3-158

Аппаратные средства аудиосистемы мультимедийного рс Звук и слух

Звук представляет собой локальные изменения давления воздуха, происходящие с определенной частотой. Эти изменения воспринимаются органом слуха. Чем больше частота таких изменений, тем более высокий тон слышит человек. Полную информацию из спектра звукового сигнала человек извлекает в диапазоне до 4 кГц, здесь же в полную силу работает пространственная ориентация.

Диапазон звуковых частот, слышимых людьми, в общем случае считается лежащим в границах 20–20 000 Гц. Способности конкретного человека в очень большой степени зависят от его индивидуальных особенностей. Причем это не только физические особенности, но и психологические, и накопленный опыт распознавания звуков. Способность к распознаванию звуков с возрастом снижается. Замечены довольно резкие спады после 25 лет и после 50 лет.

Органы слуха человека стереофонические, то есть левое и правое ухо независимо воспринимают звуковой сигнал. Поэтому человек способен выделять нужный звуковой сигнал (в оговоренном частотном диапазоне) и определять направление на него. Таким образом, органы слуха человека воспринимают результирующую звуковую картину в виде единой звуковой волны, приходящей к барабанной перепонке. Поступившие сигналы обрабатываются мозгом по индивидуальному алгоритму и интерпретируются в знакомые человеку понятия. То есть двух абсолютно одинаково слышащих людей на земном шаре не существует!

Каков алгоритм обработки звуковых сигналов внутри мозга человека, до сих пор является тайной за семью печатями. Мы можем судить об этом только на основании косвенных признаков и экспертных оценок — «нравится — не нравится». Наиболее далеко в этих исследованиях продвинулись немецкие ученые, создавшие метод так называемого «психоакустического сжатия», использованный в формате записи звука MPEG Audio Layer 3. Однако этот метод лишь имитирует итоговый результат работы мозга при обработке звуковой информации, не воспроизводя сам алгоритм.

Особо следует остановиться на восприятии человеком различных параметров звука: громкости, частоты, пространственного положения источника, гармонических колебаний, которые сильно влияют на звуковую картину в целом. В акустике громкость звука измеряют в децибелах, то есть по логарифмической шкале, за точку отсчета (ноль) в которой принята минимальная громкость звука (на частоте 3000 Гц), еще различаемая человеком (звуковое давление около 4 мкПа). В области цифровой обработки звука используют шкалу с обратным отсчетом — за ноль принято максимально возможное значение, например громкости.

Без болевых ощущений здоровым человеком различаются звуки громкостью до 120 дБ. При уровне около 150 дБ происходит повреждение органов слуха. Однако это усредненные параметры, так как на разных частотах чувствительность по громкости сильно различается. Наиболее высока чувствительность к звукам в диапазоне 1–4 кГц, что вытекает из особенностей строения органов слуха, рассмотренных нами выше. Уже для звука частотой 100 Гц порог слышимости составляет 40 дБ (то есть с амплитудой в 100 раз больше, чем на частоте 3000 Гц). На частоте 10 кГц порог слышимости составляет около 20 дБ. В среднем человек различает уровни громкости с шагом в 1 дБ, что не назовешь высоким разрешением. Однако в целом охватываемый диапазон очень большой — от 0 дБ до 120 дБ (разница в миллион раз).

В области частотного спектра звукового сигнала складывается похожая картина. Лучше всего распознаются частотные отличия звука в диапазоне 1–4 кГц (в среднем с шагом около 0,3 %). На более низких частотах шаг распознавания падает до 4 %. Однако люди, обладающие музыкальным слухом, более чувствительны к частотному спектру. У профессионалов отмечен шаг разрешения по частоте около 0,1 %.

Пространственное разрешение реализовано у людей двояким образом. Положение источника звука, излучающего на низких частотах (менее 1 кГц), определяется по интервалу времени между приходом звуковой волны в левое и правое ухо. Такой псевдофазовый сдвиг воспринимается как информация о местоположении источника. Дополнительная, менее точная информация (в основном для частот свыше 1,5 кГц) извлекается из разной громкости звука, пришедшего в левое и правое ухо.

Гармонические колебания (то есть кратные основному тону) являются основой звуковой картины как в природе, так и в созданной человеком инфраструктуре. Они приятны слуху, и потому на гармонии построена вся музыкальная культура. Напротив, негармонические колебания воспринимаются как досадная помеха.

Сейчас установлено, что позиционирование источника звука осуществляется человеком примерно по одиннадцати параметрам, но не более трех из них имитируются современными технологиями объемного звучания. Очевидно, что любые существующие технологии так называемого трехмерного звука не способны адекватно отразить звуковую картину реального мира. Причина очень проста: точное позиционирование источника звука осуществляется органами слуха во взаимодействии с другими органами. Например, инстинктивный или намеренный поворот головы, ее наклоны дают точность позиционирования с разрешением около одного градуса. У специально тренированных людей эта точность еще выше. Поэтому стрельба вслепую «на слух» — вовсе не вымысел режиссеров боевиков, а реальный навык, получаемый в результате долгих тренировок. Но и без всяких тренировок обычный человек в полной темноте легко определяет, например, положение движущегося автомобиля, особенно знакомой марки, опираясь на предшествующий опыт.

Дополнительную сложность в оценку звуковой картины вносят искажения, так как звуковые волны интенсивно взаимодействуют с окружающими предметами. Эффекты отражения, поглощения, рассеяния, дифракции присущи реальной звуковой картине гораздо в большей мере, чем принято думать. Технологии трехмерного звука способны моделировать эти процессы лишь в некоторой степени.

Применительно к компьютерным играм можно сказать, что поворот или наклон головы персонажа пока не дают никакой новой информации пользователю о положении источника звука. Таким образом, технологии 3D-звука все-таки искажают реальную картину. Для имитации хотя бы основных возможностей пространственного разрешения слуха человека в режиме реального времени сегодня требуются на порядок более мощные, чем ныне существующие, цифровые сигнальные процессоры.

Очевидно, что для создания убедительного трехмерного звучания вполне достаточно двух звуковых каналов. Главное — точно воссоздать звуковое давление на барабанные перепонки, соответствующее реальной звуковой среде. Записи музыки, сделанные с использованием технологий, учитывающих пространственное размещение источников звука, называются «binaural recordings», и они действительно обеспечивают высококачественный трехмерный звук. Слушать такие записи надо в наушниках, причем желательно высшего класса. Компакт-диски с такими записями стоят существенно дороже обычных музыкальных CD. В играх, где позиции источников и приемника звука динамически изменяются, обеспечить пространственность звучания гораздо сложнее.

Содержание