Лекция_Представление_информации_в_компьютере1

Импульсно – кодовая модуляция.

Импульсно-кодовая модуляция (англ. Pulse Code Modulation, PCM) заключается в том, что звуковая информация хранится в виде значений амплитуды, взятых в определенные моменты времени (т. е. измерения проводятся «импульсами»).

При записи звука в компьютер амплитуда измеряется через равные интервалы времени с некоторой достаточно большой частотой. При воспроизведении звука компьютер использует сохраненные значения для того, чтобы восстановить непрерывную форму выходного сигнала.

Хранимый сигнал. Воспроизводимый сигнал.

Процесс получения цифровой формы звука называют оцифровкой. Устройство, выполняющее оцифровку звука, называется аналого-цифровым преобразователем (АЦП). Устройство, выполняющее обратное преобразование, из цифровой формы в аналоговую форму, называется цифро-аналоговым преобразователем (ЦАП). В современных компьютерах основная обработка звука выполняется звуковыми картами. Помимо АЦП и ЦАП звуковые карты содержат сигнальный процессор — специализированный микрокомпьютер для обработки оцифрованного звука, выполняющий значительную часть рутинных расчетов при обработке звуков (смешение звуков, наложение спецэффектов, расчет формы выходного сигнала и т. п.; центральный процессор не тратит время на выполнение этих работ).

Определение 12. Моменты измерения амплитуды называют отсчетами. Частоту, с которой производят измерения сигнала, называют частотой дискретизации.

Квантование звука заключается в следующем. Сначала мгновенные значения звукового давления измеряются с ограниченной точностью, затем, как и в случае с квантованием цветов, диапазон значений амплитуды разбивается на подуровни. По измеренному значению определяется подуровень, в который попадает значение, и в компьютере сохраняется только его номер. Количество бит, используемых для записи номеров подуровней, называется глубиной кодирования звука.

Если сравнить способы представления графической и звуковой информации, то импульсное кодирование звука соответствует растровому представлению изображений:

структура звука (в графике — изображения) не анализируется;
время (в графике — пространство) априори разбивается на небольшие области; в пределах этих областей параметры звука (изображения) считаются постоянными.

При рассмотрении представления графической информации упоминалось, что растровое представление изображения не требует хранения координат отдельных пикселей. Аналогично, при сохранении импульсного представления звука достаточно единожды сохранить параметры оцифровки (глубину кодирования, частоту дискретизации и длительность звукового фрагмента), а затем сохранять только номера подуровней единым потоком.

Увеличивая частоту дискретизации и глубину кодирования, можно более точно сохранить и впоследствии восстановить форму звукового сигнала. При этом улучшается субъективное качество оцифрованного звука, однако увеличивается объем сохраняемых данных. При цифровой записи звука в различных случаях используют разные значения частоты дискретизации и глубины кодирования. Например, в цифровых автоответчиках используют частоту дискретизации 8-11 кГц и 8 бит для записи амплитуды, а стандарт записи звука на компакт-дисках соответствует частоте дискретизации 44,1 кГц и 16 бит для амплитуды на каждый аудиоканал (стереозвук — 2 канала, моно — один канал).

Пример. Оценим объем стереоаудиофайла в формате РСМ с глубиной кодирования 16 бит и частотой дискретизации 44,1 кГц, который хранит звуковой фрагмент длительностью звучания 1 секунда. Объем такого звукового фрагмента равен: 16 бит × 44100 Гц × 2 (канала) = 1 411 200 бит == 176 400 байт -172,3 Кбайт. □

Возникает вполне естественный вопрос: до какой степени можно уменьшать параметры оцифровки (а значит, и объем оцифрованного звукового фрагмента), чтобы при восстановлении звук оставался достаточно близок к исходному?

В 1928 году американский инженер и ученый Гарри Найквист высказал утверждение, что частота дискретизации должна быть в два или более раза выше максимальной частоты измеряемого сигнала. В 1933 году советский ученый В. А. Котельников и независимо от него американский ученый Клод Шеннон сформулировали и доказали теорему, более сильную, чем утверждение Найквиста, о том, при каких условиях и как по дискретным значениям можно восстановить форму непрерывного сигнала. Эта теорема в России называется теоремой Котельникова, на Западе — теоремой Найквиста—Шеннона; есть у нее и «нейтральное» название — теорема об отсчетах.

Котельников Владимир Александрович (1908 г. р.), академик АН СССР, область научных интересов — радиотехника. Основные труды посвящены проблемам совершенствования методов радиоприема, изучению помех радиоприему и разработке методов борьбы с ними.

Теорема Найквиста – Котельникова - Шенона утверждает, что если имеется сигнал U(t), спектр которого ограничен сверху частотой f, то после ее дискретизации с частотой F>2f форму исходного сигнала можно восстановить по дискретным значениям (отсчетам) используя формулу:

где

время между отсчетами,

время k-того отсчета,

значение k-того отсчета.

Вообще говоря, точная формулировка теоремы Найквиста—Котельникова применима только к сигналам с неизменными частотными характеристиками и бесконечной длительностью, так что для оцифровки реальных звуковых сигналов частоту дискретизации выбирают с небольшим запасом. Так сотовые телефоны и цифровые автоответчики предназначены для передачи/записи голоса человека, спектр частот которого достаточно узок (не более 3 кГц), поэтому в них используется низкая частота дискретизации (обычно 8-11 кГц).

Содержание