logo search
Лекции ИТ - СГМУ (Госэкзамен) Новый

10. Технологии мультимедиа

Мультимедиа (от англ. multi — много, media — среда) — комбиниро­ванное представле-ние информации в разных формах (текст, звук, видео и т.д.).

Технология мультимедиа — интерактивная технология, обеспечиваю­щая работу с неподвижными изображениями, видеоизображением, ани­мацией, текстом и звуковым рядом.

Развитием гипертекстовых технологий в глобальных сетях стало по­явление гипермедийных документов, которые наряду с текстовой ин­формацией содержат информацию, представленную в мультимедийной форме.

Мультимедиа информация содержит не только традиционные стати­стические элементы: текст, графику, но и динамические: видео-, аудио- и анимационные последовательности. Типы данных мультимедиа информации представлены на рис.10.1.

Рис.10.1. Типы данных мультимедиаинформации

Человек воспринимает 95% поступающей к нему извне информации визуально в виде изображения, т.е. «графически». Такое представление информации по своей природе более наглядно и легче воспринимаемое, чем чисто текстовое. Различают векторную и растровую графику.

Векторная графика — это метод соз­дания изображений в виде совокупности линий. Каждая линия рисунка представляется отрезками прямых (векторов) и сопрягающимися с ними отрезкам стандартных геометрических кривых. Для определения формы и расположения отрезка используются математические описания.

Растровая графика — метод создания изображения в виде растра набора разноцветных точек (пикселей), упорядоченных в строки и столбцы. В памяти компьютера такие изображения хранятся в виде би­товых последовательностей, которые описывают цвет отдельных пиксе­лей. При этом на каждый пиксель приходится конкретное число бит, определяющих ту или иную характеристику цвета.

Пиксель минимальный участок изображения, кото­рому независимым образом можно задать цвет, яркость и другие характеристики.

Однако в силу относительно невысокой пропускной способности существующих каналов связи, прохождение графических файлов по ним требует значительного времени. Это заставляет применять технологии сжатия данных, представляющих собой методы хранения одного и того же объема информации путем использовании меньшего количества бит.

Оптимизация (сжатие) — это представление графической информа­ции более эффективным способом. Сетевая графика представлена преимущественно двумя форматами файлов — GIF и JPEG. Оба этих фор­мата являются компрессионными, т.е. данные в них уже находятся в сжатом виде. Сжатие, тем не менее, представляет собой предмет выбо­ра оптимального решения. Каждый из этих форматов имеет ряд на­страиваемых параметров, позволяющих управлять соотношением каче­ство-размер файла, таким образом, за счет сознательного снижения ка­чества изображения, зачастую практически не влияющего на восприятие, добиваться уменьшения объема графического файла, ино­гда в значительной степени.

Формат GIF (Graphics Interchange Format — формат обмена изображе­ниями) — один из старейших форматов записи изображений. Он был разработан в 1978 г. Формат GIF рассчитан на табличное кодирование изображений с применением 256-цветной палитры, при котором одним байтом записывают одно значение некоторого произвольного цвета. Для уменьшения объема полученные данные в процессе записи сжима­ются по определенным алгоритмам. Этот формат используют для пред­ставления малоцветных изображений, имеющих большие области одинакового цвета.

Формат JPEG (Joint Photographic Experts Group — объединенная экс­пертная группа по записи изображений) является международным стан­дартом. Этот формат предназначен для эффективной записи полноцвет­ных графических изображений. Он использует наличие необязательных данных в графических изображениях, например, для случайного про­смотра человеческим глазом не требуется высокого разрешения для цве­товой информации в изображении. Поэтому данные, представляющие высокое цветовое разрешение, могут быть исключены. Особенностью формата JPEG является использование схемы «кодирование с потерями», т.е. при воспроизведении данных, записанных со сжатием в фор­мате JPEG, полученная последовательность неточно соответствует дан­ным, имевшимся перед записью.

Запись и кодирование видеоизображений основано на представлении видеоряда в виде последовательности кадров и кодировании каждого из них как отдельного изображения с последующей записью последова­тельности кадров. Одним из наиболее распространенных методов коди­рования видеоизображений является метод MPEG (Moving Picture Experts Group — Экспертная группа no записи видеоизображений).

Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку большинство кадров имеют сравнительно небольшие отличия друг от друга, то, записав полностью один кадр, можно при записи последующего кадра записывать не все изображение, а только его отличия от предыдущего. В общей последова­тельности видеоряда выделяют опорные и промежуточные кадры. Опор­ные кадры являются начальными кадрами новых сцен, а промежуточ­ные соответствуют одной сцене и имеют много общего с опорными кад­рами.

Кодирование видеоряда начинается с записи опорного кадра. Сна­чала изображение разбивается на блоки фиксированного размера, кото­рые кодируются и сжимаются с использованием специальных алгорит­мов. Следующий кадр тоже разбивается на аналогичные блоки, которые сравниваются с блоками опорного кадра, а затем записываются только отличия от предыдущего кадра.

Существуют несколько разновидностей формата записи MPEG: MPEG-1, MPEG-2, MPEG-4, которые отличаются друг от друга качест­вом записи и степенью сжатия.

Звуковые сигналы характеризуются двумя величинами: частотой (вы­сота звука) и амплитудой (громкость звука). Основным стандартным форматом записи звука является формат WAV, введенный в действие компаниями IBM и Microsoft. Существуют и другие форматы звуковых файлов, введенные другими корпорациями, однако выборки данных при звукозаписи имеют огромные размеры. Для передачи звука и музыки по медленным каналам связи, таким как телефонные соединения, используемые для доступа к Internet, используют специальный формат; записи МРЗ (MPEG-1 layer 3). В его основу положены особенности чело­веческого слухового восприятия, выражающиеся в том, что далеко не вся информация, которая содержится в звуковом сигнале, является по­лезной и необходимой — большинство слушателей ее не воспринимают. Поэтому определенная часть данных может быть сочтена избыточной. Эта «лишняя» информация удаляется без особого вреда для субъектив­ного восприятия. При этом стандарт позволяет в заданных пределах ме­нять параметры кодирования — получать меньшую степень сжатия при лучшем качестве или, наоборот, идти на потери в восприятии ради более высокого коэффициента компрессии.

Аппаратные средства мультимедиа включают аналого-цифровые и цифроаналоговые преобразователи для перевода аналоговых аудио- и видеосигналов в цифровой эквивалент и обратно, видеопроцессоры для преобразования обычных телевизионных сигналов к виду, воспро­изводимому электронно-лучевой трубкой дисплея, декодеры для взаимного преобразования телевизионных стандартов, специальные инте­гральные схемы для сжатия данных в файлы допустимых размеров и т.д. Все оборудование, отвечающее за преобразование звуковых сигналов, объединяют в звуковые карты, а за преобразование видеосигналов – в видеокарты.

Звуковая карта — это плата, микросхема, позволяющая записывать и воспроизводить звуки, синтезировать музыку, управлять внешней акустической аппаратурой, подключенной к компьютеру.

Видеокарта — это плата, микросхема, согласующая обмен графиче­ской информацией между центральным процессором и дисплеем и управляющая выводом информации на экран.

Технологию мультимедиа составляют две основные компоненты — аппаратная и программная, представленные на рис.10.2.