Материалы по интерфейсам периферий / Для Скрипко / Для пособия ПУ (Восстановлен) (2)

Тема 7.3. Классификация и характеристики звуковых карт

С самого появления звуковых карт их классифицировали по возможности воспроизводить звук, записанный в цифровом виде и по возможности синтезировать его.

В соответствии с этим различают как минимум три класса аудиокарт.

Звуковые – содержат только тракт цифровой записи/воспроизведения, соответственно, такие устройства позволяют только записывать (оцифровывать) или воспроизводить непрерывный звуковой поток. Работа по запоминанию записываемого и подготовке воспроизводимого потока возлагается либо на программное обеспечение, либо на встроенный в звуковую карту сигнальный процессор.

Музыкальные – содержат только музыкальный синтезатор. Такие устройства ориентированы, прежде всего, на генерацию музыкальных звуков, которые создаются параметрически (генераторами гармонических сигналов), либо путем воспроизведения заранее записанного набора эталонных звуков.

Очевидно, что ни тот, ни другой класс звуковых карт в полной мере не соответствует современным требованиям, к ним предъявляемым: последние в большинстве случаев относятся к классу комбинированных (звуко-музыкальных) устройств, которые сочетают в себе функции первых двух классов звуковых карт.

Синтезатор (synthesio, делаю) – это устройство, которое создает звук. В терминологии компьютерных звуковых карт синтезатором является та часть звуковой карты, которая ответственна за генерирование звуков и музыки.

В настоящее время применяются два основных способа синтеза звукового сигнала: синтез на основе использования частотной модуляции (FM-синтез), а также синтез с применением таблицы волн (сэмплов) – так называемый табличный, или WT-синтез (WaveTable).

С учетом этого синтезаторы делятся на два класса: собственно синтезирующие, работающие по технологии FM-синтеза, и сэмплирующие, работающие по технологии WaveTable.

FM-синтезаторы генерируют звук при помощи одного или нескольких тон-генераторов из набора простейших волн (например, нескольких синусоид) при помощи взаимной модуляции, реализуемой такими простейшими операциями, как сложение, вычитание, умножение, деление волн и т. д.

Технология частотного синтеза – очень мощный инструмент, но качество звучания зависит от качества аппаратной реализации: в первую очередь, от количества генераторов и количества параметров обработки. В компьютерных звуковых картах были распространены FM-синтезаторы класса OPL-2 с двумя "операторами" ("оператор" – генератор, снабженный схемой управления частотой и амплитудой сигнала), а также класса OPL-3 с четырьмя "операторами".

Частотный синтез имеет неоспоримые достоинства, например, отсутствие заранее записанного единого комплекта звуков, следовательно, ему не требуется память для их хранения. Кроме того, частотный синтез обеспечивает большое разнообразие в получаемых звуках и может гарантировать повторяемость одних и тех же тембров на различных звуковых платах, оборудованных совместимыми синтезаторами. При помощи частотного синтеза можно смоделировать практически любой звук – необходимо лишь точное математическое описание и достаточное количество "операторов".

Недостатки частотного синтеза проявляются при его применении для имитации звука музыкальных инструментов, поскольку подобие звука музыкальных инструментов получается крайне грубым вследствие сложности создания "реальной" математической модели и реализации тонкого управления операторами.

Устройства, работающие по технологии синтеза на основе таблицы волн, хранят в своей памяти "сэмплы" – оцифрованные образцы звучания какого-либо инструмента, на основе которых создается звук. Размер и количество образцов сильно варьируются в зависимости от сложности воспроизводимого инструмента. Например, для воспроизведения более или менее реалистичного звука фортепиано или ксилофона требуется в несколько раз меньший объем сэмплов, чем для струнных инструментов, но и он составляет несколько мегабайт. В зависимости от возможностей синтезатора можно использовать сэмплы не всего спектра звучания инструмента, а лишь записать выборочные ноты или вообще только начало и конец звука плюс небольшую "среднюю" часть, которая затем будет циклически проигрываться в течение определенного времени. Для изменения высоты звука достаточно воспроизвести полученный сэмпл с другой скоростью, а чтобы характер звучания оставался для данного инструмента вполне натуральным, сэмплы должны быть составлены из разных фрагментов для разных диапазонов инструмента.

К достоинствам сэмплеров относится весьма точное и "почти реальное" воссоздание звучания определенного инструмента, зависящее лишь от количества и качества записанных сэмплов. При соответствующих объемах и качестве создания сэмплов вместе с изощренными алгоритмами обработки можно добиться практически 100% естественности звука. Самый существенный недостаток сэмплирующих синтезаторов – ограниченный объем памяти и, как следствие, ограничение на объем размещаемых в ней сэмплов, что сказывается на качестве синтезированного звука.

Управляющие команды для синтеза звука могут поступать на звуковую карту, например, от MIDI-устройств (Musical Instruments Digital Interface).

MIDI – это общепринятая спецификация, связанная с организацией цифрового интерфейса для музыкальных устройств, включающая в себя стандарт на аппаратную и программную части. К MIDI-устройствам относятся различные аппаратные и музыкальные инструменты, отвечающие требованиям MIDI. Таким образом, MIDI-синтезатор – это музыкальный инструмент, предназначенный обычно для синтеза звука и музыки, а также удовлетворяющий спецификации MIDI.

Рассмотрим основные характеристики звуковых карт.

Частота дискретизации (оцифровки) сигнала должна быть, как минимум, в два раза больше максимальной частоты входного сигнала (согласно теореме Котельникова). Если человеческая речь занимает полосу частот до 3–4 кГц, то для ее оцифровки потребуется частота 8 кГц. Современные звуковые платы поддерживают частоты дискретизации 8.0–192 кГц, что соответствует сигналам с частотами до 96 кГц.

Разрядность и динамический диапазон. Современные звуковые карты позволяют записывать звук с разрешением 8, 16 и 24 разряда, что соответствует 256, 65536 и 16.7 млн. различных уровней сигнала. Этот параметр, прежде всего, определяет динамический диапазон воспроизводимого звука, то есть во сколько раз интенсивность самого громкого звука может быть больше, чем интенсивность самого тихого. Эта величина обычно выражается в логарифмическом масштабе и измеряется в децибелах. Для 8-разрядного звука динамический диапазон составляет всего 48 дБ, для 16-разрядного он равен 96 дБ, а для 24-разрядного – 144 дБ.

Отношение сигнал/шум (S/N или SNR – Signal to Noise Ratio) показывает, во сколько раз громкость сигнала больше громкости шума, возникающего в звуковой плате по различным причинам, прежде всего, в результате ошибки дискретизации. Шум дискретизации присутствует всегда и составляет не менее половины младшего разряда, поэтому, например, отношение сигнал/шум для 16-разрядной платы не может быть лучше, чем 93 дБ (т. е. 96–6:2).

Коэффициент нелинейных искажений (Total Harmonic Distortion, THD). Нелинейные искажения – результат неточности в восстановлении сигнала из цифрового вида в аналоговый. Упрощенно процесс измерения этого коэффициента проводится следующим образом. На вход звуковой карты подается чистый синусоидальный сигнал. На выходе устройства снимается сигнал, спектр которого представляет собой сумму синусоидальных сигналов (сумма исходной синусоиды и ее гармоник). Далее, по специальной формуле рассчитывается количественное соотношение исходного сигнала и его гармоник, полученных на выходе устройства. Это количественное соотношение и есть коэффициент нелинейных искажений (THD). Коэффициент нелинейных искажений измеряется в процентах: 1% – "грязное" звучание; 0.1% – нормальное звучание; 0.01% – чистое звучание класса Hi-Fi; 0.002% – звучание класса Hi-Fi – Hi End.

Поддерживаемые спецэффекты. К спецэффектам, поддерживаемым звуковыми картами, относятся реверберация, хорус и различные 3D-расширения. Все спецэффекты являются результатом обработки звука, под которым понимается преобразование звуковых данных с целью изменения характеристик звучания. Основными способами преобразований звуковых данных являются амплитудные, частотные, фазовые и временные преобразования.

Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное "сворачивание" сигнала из спектра в волну.

Фазовые преобразования – сдвиг фазы сигнала тем или иным способом; например, преобразования стерео сигнала позволяет реализовать эффект вращения или "объёмности" звука.

Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов, что позволяет управлять пространственными характеристиками звука.

Эффект эхо (Echo). Реализуется с помощью временных преобразований. Фактически, для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того чтобы человек воспринимал вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а ослабленные по амплитуде.

Эффект повторение (Reverberation). Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. От эффекта "эхо" реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного. Иными словами, блок реверберации упрощенно представляет собой петлю, где выход блока подключен к его входу, таким образом, уже обработанный сигнал подается на вход, смешиваясь с оригинальным сигналом.

Эффект хор (Chorus). В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции перед смешиванием с входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

Для улучшения качества воспроизведения звука звуковые устройства реализуют различные схемы кодирования многоканального звука, наиболее распространенными из которых являются следующие: DSS, DPL, ТНХ, AC3, Dolby Digital EX, DTS и др.

Dolby Surround (DSS) – кодирование в двухканальном сигнале трех звуковых каналов: левого, правого и пространственного (surround). Без декодера воспроизводится в стереоформате.

Dolby Surround Pro-Logic (DPL) – усовершенствованная технология DSS, в которой предусмотрен центральный канал.

ТНХ – стандарт, созданный на основе DPL. Пространственный канал разделен на два псевдостереофонических – левый и правый. Кроме того, добавлен низкочастотный канал для подключения сабвуфера.

Dolby Digital (AC3) – полноценная шестиканальная (5.1) схема, предусматривающая не подмешивание дополнительной информации о каналах в стереопоток, а отдельное их представление. Предусматривает пять широкополосных (30-20 000 Гц) каналов: три фронтальных (левый, центральный и правый), два задних (левый и правый), а также низкочастотный (20-120 Гц) канал сабвуфера. Эта схема кодирования звука реализуется на дисках DVD-Video.

Dolby Digital EX – система формата 6.1. В отличие от предыдущей схемы, обеспечивает не два, а три задних канала – левый, правый и центральный. В последнее время появились также схемы 7.1 и 8.1.

Digital Theater System (DTS) – шестиканальная цифровая схема записи звукового сопровождения кинофильмов, получившая широкое распространение в США. Благодаря меньшей степени сжатия обеспечивает более высокое качество звучания, чем АСЗ.

Virtual Dolby Surround, Virtual Surround Sound (VSS), Virtual 3D Surround, 3D-Phonic, Spatializer – набор алгоритмов обработки звука, позволяющих имитировать пространственное звучание при воспроизведении через стереосистему.

Содержание