4.7 Mpeg-1
По стандарту MPEG-1 потоки видео и звуковых данных передаются со коростью 150 килобайт в секунду -- с такой же скоростью, как и односкоростной CD-ROM проигрыватель -- и управляются путем выборки ключевых видео кадров и заполнением только областей, изменяющихся между кадрами. К несчастью, MPEG-1 обеспечивает качество видеоизображения более низкое, чем видео, передаваемое по телевизионному стандарту.
MPEG-1 был разработан и оптимизирован для работы с разрешением 352 ppl (point per line -- точек на линии) * 240 (line per frame -- линий в кадре) * 30 fps (frame per second -- кадров в секунду), что соответствует скорости передачи CD звука высокого качества. Используется цветовая схема - YCbCr (где Y - яркостная плоскость, Cb и Cr - цветовые плоскости).
Как MPEG работает:
В зависимости от некоторых причин каждый frame (кадр) в MPEG может быть следующего вида:
I (Intra) frame - кодируется как обыкновенная картинка.
P (Predicted) frame - при кодировании используется информация от предыдущих I или P кадров.
B (Bidirectional) frame - при кодировании используется информация от одного или двух I или P кадров (один предшествующий данному и один следующий за ним, хотя может и не непосредственно, см. Рис.1)
Рисунок 2.3
Последовательность кадров может быть например такая: IBBPBBPBBPBBIBBPBBPB...
Последовательность декодирования: 0312645...
Нужно заметить, что прежде чем декодировать B кадр требуется декодировать два I или P кадра. Существуют разные стандарты на частоту, с которой должны следовать I кадры, приблизительно 1-2 в секунду, соответствуюшие стандарты есть и для P кадров (каждый 3 кадр должен быть P кадром). Существуют разные относительные разрешения Y, Cb, Cr плоскостей (Таблица 2.2), обычно Cb и Cr кодируются с меньшим разрешением чем Y.
Таблица 2.2
Вид Формата | Отношения разрешений по горизонтали (Cb/Y): | Отношение разрешений по вертикали (Cb/Y): |
4:4:4 | 1:1 | 1:1 |
4:2:2 | 1:2 | 1:1 |
4:2:0 | 1:2 | 1:2 |
4:1:1 | 1:4 | 1:1 |
4:1:0 | 1:4 | 1:4 |
Для применения алгоритмов кодировки происходит разбивка кадров на макроблоки каждый из которых состоит из определенного количества блоков (размер блока - 8*8 пикселей). Количество блоков в макроблоке в разных плоскостях разное и зависит от используемого формата (рисунок 2.4):
Рисунок 2.4 - Пример для формата 4:2:0
Техника кодирования:
Для большего сжатия в B и P кадрах используется алгоритм предсказания движения (что позволяет сильно уменьшить размер P и B кадров) на выходе которого получается:
Вектор смещения (вектор движения) блока который нужно предсказать относительно базового блока.
Разница между блоками (которая затем и кодируется).
Так как не любой блок можно предсказать на основании информации о предыдущих, то в P и B кадрах могут находиться I блоки (блоки без предсказания движения).
Таблица 2.3
Вид кадра | I | P | B | Средний размер |
Размер кадра для стандарта SIF (kilobit) | 150 | 50 | 20 | 38 |
Метод кодировки блоков (либо разницы, получаемой при методе предсказание движения) содержит в себе:
Discrete Cosine Transforms (DCT - дискретное преобразование косинусов).
Quantization (преобразование данных из непрерывной формы в дискретную).
Кодировка полученного блока в последовательность.
DCT использует тот факт, что пиксели в блоке и сами блоки связаны между собой (т.е. коррелированны), поэтому происходит разбивка на частотные фурье компоненты (в итоге получается quantization matrix - матрица преобразований данных из непрерывной в дискретную форму, числа в которой являются величиной амплитуды соответствующей частоты), затем алгоритм Quantization разбивает частотные коэффициенты на определенное количество значений. Encoder (кодировщик) выбирает quantization matrix которая определяет то, как каждый частотный коэффициент в блоке будет разбит (человек более чувствителен к дискретности разбивки для малых частот чем для больших). Так как в процессе quantization многие коэффициенты получаются нулевыми то применяется алгоритм зигзага для получения длинных последовательностей нулей (рисунок 2.5)
Рисунок 2.5
Звук в MPEG:
Форматы кодирования звука деляться на три части: Layer I, Layer II, Layer III (прообразом для Layer I и Layer II стал стандарт MUSICAM, этим именем сейчас иногда называют Layer II). Layer III достигает самого большого сжатия, но, соответственно, требует больше ресурсов на кодирование.
Принципы кодирования основаны на том факте, что человеческое ухо не совершенно и на самом деле в несжатом звуке (CD-audio) передается много избыточной информации. Принцип сжатия работает на эффектах маскировки некоторых звуков для человека (например, если идет сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц уже не будет слышен человеку, также будет ослаблена чувствительность человеческого уха на период в 100 мс после и 5 мс до возникновения сильного звука). Psycoacustic (психоакустическая) модель используемая в MPEG разбивает весь частотный спектр на части, в которых уровень звука считается одинаковым, а затем удаляет звуки не воспринимаемые человеком, благодаря описанным выше эффектам.
В Layer III части разбитого спектра самые маленькие, что обеспечивает самое хорошее сжатие. MPEG Audio поддерживает совместимость Layer'ов снизу вверх, т.е. decoder (декодировщик) для Layer II будет также распознавать Layer I.
Синхронизация и объединение звука и видео, осуществляется с помощью System Stream (рисунок 2.6), который включает в себя:
Системный слой, содержащий временную и другую информацию чтобы разделить и синхронизовать видео и аудио.
Компрессионный слой, содержащий видео и аудио потоки.
Рисунок 2.6
Видео поток (рисунок 2.7) содержит заголовок, затем несколько групп картинок (заголовок и несколько картинок необходимы для того, что бы обеспечить произвольный доступ к картинкам в группе в независимости от их порядка).
Звуковой поток состоит из пакетов каждый из которых состоит из заголовка и нескольких звуковых кадров (audio-frame).
Для синхронизации аудио и видео потоков в системный поток встраивается таймер, работающий с частотой 90 КГц (System Clock Reference -- SCR, метка по которой происходит увеличения временного счетчика в декодере) и Presentation Data Stamp (PDS, метка насала воспроизведения, вставляются в картинку или в звуковой кадр, чтобы объяснить декодеру, когда их воспроизводить. Размер PDS сотавляет 33 бита, что обеспечивает возможность представления любого временного цикла длинной до 24 часов).
Рисунок 2.7
Yandex.RTB R-A-252273-3
- 2.4.3 Ацп с плавающей точкой……………………………………………
- 1 Цифровые фильтры
- 1.1 Явление Гиббса
- 1.1.1 Сущность явления Гиббса
- 1.1.2 Параметры эффекта
- 1.1.3 Последствия для практики
- 1.2 Весовые функции
- 1.2.1 Нейтрализация явления Гиббса в частотной области
- 1.2.2 Основные весовые функции
- 1.3 Типы фильтров
- 1.4 Разностное уравнение
- Нерекурсивные фильтры
- 1.5.1 Методика расчетов нцф
- 1.5.2 Идеальные частотные фильтры
- 1.5.3 Конечные приближения идеальных фильтров
- 1.5.3.1 Применение весовых функций
- 1.5.3.2 Весовая функция Кайзера
- 1.5.4 Дифференцирующие цифровые фильтры
- 1.5.5 Гладкие частотные фильтры
- 1.6 Рекурсивные фильтры
- 6.3 Интегрирующий рекурсивный фильтр.
- 1.6.1 Принципы рекурсивной фильтрации
- 1.6.2 Режекторные и селекторные фильтры
- 1.6.2.1 Комплексная z-плоскость.
- 1.6.2.2 Режекторные фильтры
- 1.6.2.3 Селекторный фильтр
- 1.6.3 Билинейное z-преобразование
- 1.6.4 Типы рекурсивных частотных фильтров
- 1.7 Импульсная характеристика фильтров
- Передаточные функции фильтров
- 1.9 Частотные характеристики фильтров
- 1.10 Частотный анализ цифровых фильтров
- 1.10.1 Сглаживающие фильтры и фильтры аппроксимации
- 1.10.1.1 Фильтры мнк 1-го порядка (мнк-1)
- 1.10.1.2 Фильтры мнк 2-го порядка (мнк-2)
- 1.10.1.3 Фильтры мнк 4-го порядка
- 1.10.2 Разностные операторы
- 1.10.2.1 Разностный оператор
- 1.10.2.2 Восстановление данных
- 1.10.2.3 Аппроксимация производных
- 1.10.3 Интегрирование данных
- 1.10.4 Расчёт фильтров по частотной характеристике
- 1.11 Фильтрация случайных сигналов
- 1.12 Структурные схемы цифровых фильтров
- Обращенные формы.
- 1.13 Фильтры Чебышева
- 1.14 Фильтры Баттерворта
- Свойства фильтров Баттерворта нижних частот:
- 1.15 Фильтры Бесселя
- 2 Аналого-цифровое преобразование
- 2.1 Цифровая обработка звуковых сигналов
- 2.2 Основы аналого-цифрового преобразования
- 2.2.1 Основные понятия и определения
- 2.3 Структура и алгоритм работы цап
- Контрольные вопросы
- 2.4 Структура и алгоритм работы ацп
- 2.4.1 Параллельные ацп
- 2.4.2 Ацп с поразрядным уравновешиванием
- 2.4.3 Ацп с плавающей точкой
- Контрольные вопросы
- Глава 3. Звук.
- 3.1 Аудиосигнал
- 3.1.1 Звуковые волны
- 3.1.2 Звук как электрический сигнал
- 3.1.3 Фаза
- 3.1.4 Сложение синусоидальных волн
- 3.2 Звуковая система
- 3.2.1 Назначение звуковой системы
- 3.2.2 Модель звуковой системы
- 3.2.3 Входные датчики
- 3.2.4 Выходные датчики
- 3.2.5 Простейшая звуковая система
- 3.3 Амплитудно-частотная характеристика
- 3.3.1 Способы записи ачх в спецификации звуковых устройств
- 3.3.2 Октавные соотношения и измерения
- 3.3.3 Ачх реальных устройств воспроизведения звука
- 3.3.4 Диапазон частот голоса и инструментов
- 3.3.5 Влияние акустических факторов
- 3.4 Единицы измерения, параметры звуковых сигналов
- 3.4.1 Децибел
- 3.4.2 Относительная мощность электрических сигналов дБm
- 3.4.3 Децибелы и уровень звука
- 3.4.5 Громкость, уровень сигнала и коэффициент усиления
- 3.4.6 Громкость
- 3.5 Динамический диапазон
- 3.5.1 Запас динамического диапазона
- 3.5.2 Выбор динамического диапазона для реальной звуковой системы
- 3.6 Цифровой звук
- 3.6.1 Частота дискретизации
- 3.6.2 Разрядность
- 3.6.3 Дизеринг
- 3.6.4 Нойс шейпинг
- 3.6.5 Джиттер
- 3.7 Методы и стандарты передачи речи по трактам связи, применяемые в современном оборудовании (7 кГц)
- 3.7.1 Импульсно-кодовая модуляция (pcm — Pulse-Code Modulation)
- 3.7.3 Помехоустойчивость методов икм
- 3.7.4 Методы эффективного кодирования речи
- 3.7.5 Кодирование речи в стандарте cdma
- 3.7.6 Речевые кодеки для ip-телефонии
- 3.7.7 Оценка качества кодирования речи
- 3.8 Общие сведения по мр3
- 3.8.1 Феномен мрз
- 3.8.2 Что такое формат мрз?
- 3.8.3 Качество записи мрз
- 3.8.4 Формат мрз и музыкальные компакт-диски
- 3.8.5 Работа со звукозаписями формата мрз
- 3.9 Основные понятия цифровой звукозаписи
- 3.9.1 Натуральное цифровое представление данных
- 3.9.2 Кодирование рсм
- 3.9.3 Стандартный формат оцифровки звука
- 3.9.4 Параметры дискретизации
- 3.9.5 Качество компакт-диска
- 3.9.6 Объем звукозаписей
- 3.9.7 Формат wav
- 3.10 Формат mp3
- 3.10.1 Сжатие звуковых данных
- 3.10.2 Сжатие с потерей информации
- 3.10.3 Ориентация на человека
- 3.10.4 Кратко об истории и характеристиках стандартов mpeg.
- 3.10.5 Что такое cbr и vbr?
- 3.10.6 Каковы отличия режимов cbr, vbr и abr?
- 3.10.7 Методы оценки сложности сигнала
- 3.10.8 Какие методы кодирования стерео информации используются в алгоритмах mpeg (и других)?
- 3.10.9 Какие параметры предпочтительны при кодировании mp3?
- 3.10.10 Какие альтернативные mpeg-1 Layer III (mp3) алгоритмы компрессии существуют?
- 3.11 OggVorbis
- 3.13 Flac
- 4 Сжатие видео
- 4.1 Общие положения алгоритмов сжатия изображений
- 4.1.1 Классы изображений
- 4.1.2 Классы приложений
- 4.1.3 Требования приложений к алгоритмам компрессии
- 4.1.4 Критерии сравнения алгоритмов
- 4.2 Алгоритмы сжатия
- Gif (CompuServe Graphics Interchange Format)
- 4.3 Вейвлет-преобразования
- 4.3.1 Вейвлеты, вейвлет-преобразования, виды и свойства Вейвлет анализ и прямое вейвлет-преобразование
- Непрерывное прямое и обратное вейвлет-преобразования
- Ортогональные вейвлеты
- Дискретное вейвлет-преобразование непрерывных сигналов
- Кратномасштабный анализ
- Пакетные вейвлеты.
- 4.3.2 Примеры применения вейвлетов Очистка сигнала от шума
- Очистка сигнала от шумов на основе вейвлет-преобразований.
- 4.4 Формат сжатия изображений jpeg
- 2) Дискретизация
- 3) Сдвиг Уровня
- 4) 8X8 Дискретное Косинусоидальное Преобразование (dct)
- 5) Зигзагообразная перестановка 64 dct коэффициентов
- 6) Квантование
- 7) RunLength кодирование нулей (rlc)
- 8) Конечный шаг - кодирование Хаффмана
- 4.5 Jpeg2000
- 4.5.1 Общая характеристика стандарта и основные принципы сжатия
- 4.5.2 Информационные потери в jpeg2000 на разных этапах обработки
- 4.5.3 Практическая реализация
- 4.5.4 Специализированные конверторы и просмотрщики
- 4.5.5 Основные задачи для развития и усовершенствования стандарта jpeg2000
- 4.6 Видеостандарт mpeg
- 4.6.1 Общее описание
- 4.6.2 Предварительная обработка
- 4.6.3 Преобразование макроблоков I-изображений
- 4.6.4 Преобразование макроблоков р-изображений
- 4.6.5 Преобразование макроблоков в-изображений
- 4.6.6 Разделы макроблоков
- 4.7 Mpeg-1
- Параметры mpeg-1
- 4.8 Mpeg-2
- 4.8.1 Стандарт кодирования mpeg-2
- 4.8.2 Компрессия видеоданных
- 4.8.3 Кодируемые кадры
- 4.8.4 Компенсация движения
- 4.8.5 Дискретно-косинусное преобразование
- 4.8.6 Профессиональный профиль стандарта mpeg-2
- 4.9.11 Плюсы и минусы mpeg-4
- 4.10 Стандарт hdtv