logo
Лекции по ЦО АВС

4.8.2 Компрессия видеоданных

Телевизионный сигнал, как известно, избыточен. Различают статистическую избыточность, избыточ­ность по восприятию, структурную и спектральную избыточность. По теории вероятностей избыточ­ность является следствием определенных корреля­ционных связей. Корреляция означает, что некото­рый элемент изображения более или менее сущест­венно зависит от соседей в пространстве и во време­ни.

Под статистической избыточностью понимают корреляционные связи между соседними (по верти­кали и горизонтали) отсчетами ТВ сигнала. Сразу же надо подчеркнуть, что снижение избыточности в этом случае до определенных пределов обратимо, т. е. без потерь информации. Примером такого "бес­проигрышного" кодирования служит предсказание на основе дискретно-косинусного преобразования. Можно назвать и другие разностные методы.

Избыточность по восприятию связана с особен­ностями зрения человека. Например, цветовое раз­решение нашего зрения ниже яркостного. Эта осо­бенность учтена во всех стандартных аналоговых си­стемах цветового кодирования. В NTSC. PAL, SECAM цветовое разрешение существенно пониже-)НО по отношению к яркостному. То же самое зафиксировано в цифровом стандарте 4:2:2, где, по опре­делению, две цветоразностные компоненты представлены таким же по объему информационным массивом, что и один яркостный сигнал. Учитывая эту особенность нашего зрения по восприятию мелких деталей цветного изображения, можно в несколько раз сократить полосу частот при передаче и кодировании сигналов цветности.

Структурная избыточность - итог особенностей стандарта разложения или, по иному, преобразования изображения в ТВ сигнал. В нем, например, периодически передаются неизменные по форме элементы сигнала: гасящие импульсы строк и полей. В цифровом ТВ сигнале нет необходимости передавать эти импульсы по каналу связи, т.к. они могут быть восстановлены в декодере по опорным сигналам синхронизации. Устранение из состава информационного ТВ сигнала гасящих импульсов строк и полей снижает скорость передачи видеоданных примерно на 23%. Естественно, эта особенность сигнала учтена в стандарте MPEG-2.

Спектральная избыточность проявляется как результат излишне высокой частоты дискретизации. В частности, принятая ортогональная структура дискретизации ТВ изображения в общем случае не является оптимальной в частотном пространстве. Используя интерполяцию и передискретизацию определенным образом выбранных групп отсчетов ТВ сигнала, можно, в принципе, видоизменить спект­ральный состав и снизить частоту дискретизации. Такая обработка обычно необратима и, как правило, ведет к некоторому снижению качества восстанов­ленного ТВ изображения. В стандарте MPEG-2 этот вид избыточности не устраняется.

Итак, в MPEG-2 применены известные, давно апробированные методы сокращения избыточности. Вместе с ними использованы и новые подходы. В особенности это относится к совокупности согласо­ванных алгоритмов сокращения статистической из­быточности. Здесь особо эффективными оказались два метода: кодирование ТВ отсчетов с предсказани­ем и дискретно-косинусное преобразование

Кодирование с предсказанием реализуется с по­мощью дифференциальной импульсно-кодовой модуляции (часто используется абревиатура ДИКМ). При кодировании с предсказанием вы­числяется разность между истинным и предсказан­ным значением отсчета. Затем разность квантуется по уровню. От точности предсказания зависит сре­днее число бит, необходимых для передачи разно­стной информации. Предсказание может быть экстраполяционным. В этом случае (его часто называ­ют предсказанием вперед) по предшествующим значениям отсчетов ТВ сигнала оцениваются пос­ледующие отсчеты. Интерполяционное (двунапра­вленное) предсказание означает, что оценка сред­него по положению отсчета ТВ сигнала выполня­ется по известным значениям предшествующих и последующих отсчетов. Такое предсказание наибо­лее точно оценивает текущие отсчеты. Однако за точность приходится расплачиваться возросшим объемом вычислений и соответственно памяти, необходимой при реализации. При этом эффект не окупает затраты.

Как уже отмечаюсь, предсказание выполняется по соседним с предсказываемым отсчетам, причем под соседними надо понимать отсчеты, расположенные "до и за" рассматриваемым. К ним надо добавить со­седей в предшествующей и последующей строках, по­лях и кадрах. Таким образом, возможно построчное, межстрочное, внутриполевое, внутрикадровое, меж­полевое и межкадровое предсказание. Это полный на­бор возможных направлений корреляций. Но уже подчеркивалось, что предсказание вдоль отдельной строки по предшествующему и последующему эле­менту неэффективно. По этому же критерию можно отсеять и некоторые другие возможные направления.

При простейшем внутриполевом предсказании вперед предшествующий отсчет ТВ строки прини­мается как ожидаемый уровень последующего от­счета. Фактически это означает вычеркивание по­стоянной составляющей или, что тоже самое, выде­ление разностной информации. Такой метод пред­сказания особенно эффективен, когда передаются крупные, не содержащих мелких деталей, фрагмен­ты изображения, где яркость постоянна или изме­няется медленно.

Другой способ - межкадровое предсказание впе­ред. В этом случае текущий отсчет оценивается по от­счету с теми же координатами, но предыдущего кад­ра. Это очень эффективный метод предсказания для неподвижных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменятся в целом. В этом случае отсчеты, при­надлежащие однотипным элементам изображения от кадра к кадру будут смещаться. Возникает разностная информация, даже если в остальном никаких измене­ний не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого необходимо опре­делить векторы перемещения движущихся частей изображения при последовательном переходе от кад­ра к кадру. Векторы движения позволяют определить положение кодируемого отсчета в новом кадре (ском­пенсировать его перемещение) и, таким образом, со­хранить высокую точность предсказания.

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4