logo
Ответы на билеты

Билет № 17

  1. Аналоговый синтез формантных частот.

В отличие от метода «непосредственного кодирования / восстановления речи», описанного ранее, метод синтеза формантных частот не использует человеческую речь в качестве исходного материала. В этом методе используется известное приближение к человеческой речи с использованием формантных частот.

При синтезе речи используется электронная модель голосового тракта человека, то есть синтезатор организован, как некоторое приближение к голосовому тракту. При этом настройка синтезатора в этом случае производится отдельно для каждого фонетического элемента алфавита.

Фонетическое описание представляет собой последовательность элементов фонетического алфавита (включая паузы) с указанием длительности звучания каждого из них. Таким образом, каждому элементу фонетического алфавита ставят в соответствие набор параметров настройки синтезатора.

Наборы параметров настройки синтезатора для каждого элемента фонетического алфавита (ФА) в виде управляющих слов (УС) хранятся в памяти (как правило, в ПЗУ). Код элемента ФА используется, таким образом, в качестве адреса и позволяет найти УС или их последовательность. Каждое УС содержит помимо набора параметров настройки синтезатора {pi} параметр длительности звучания фонологического элемента, флаг цепи УС и ряд других флагов.

Для того, чтобы связать фонему с конкретными формантными частотами, которые характерны для некоторых фонем фонетического алфавита английского языка, рассмотрим таблицу 3.1 соответствия фонем формантным частотам:

Фонема

Как в слове

F1 (Гц)

F2 (Гц)

F3 (Гц)

ee

feet

250

2300

3000

i

hid

375

2150

2800

eh

head

550

1950

2600

ае

had

700

1800

2550

aw

talk

575

900

2450

Для каждого звука в таблице даны три основные (старшие) формантные частоты.

Таким образом, необходимо задавать параметры, регулирующие характеристики полосовых фильтров, амплитуды генератора шума для воспроизведения шумных согласных, фрикативных согласных, амплитуды носовых (нозальных) гласных, и т.п.

Наиболее часто используется набор, состоящий из следующих параметров:

Один из вариантов (практически полный) модели синтезатора приведён на рис. 11.

На рисунке с помощью потенциометров, подключённым к отдельным блокам модели, задаются параметры, управляющие синтезом речи. В указанной схеме используются 10 таких параметров. Такую модель несложно реализовать, но практически она будет неработоспособна, так как задание параметров с помощью потенциометров приводит к чрезвычайно большому времени синтеза.

Выходом из сложившейся ситуации является включение в модель вместо потенциометров резистивных матриц, управляемых с помощью цифрового кода, которые имеют приемлемое время установки параметра.

Все 10 регулируемых элементов модели, определяющих величину параметров, составляют так называемые управляющие слова, которые хранятся в памяти компьютера и последовательно подаются в синтезатор. Перенастройка управления синтезатора происходит с частотой 100 Гц. Учитывая, что каждое управляющее слово состоит из 8-битового байта, синтезатором можно управлять при параллельной передаче управляющих слов со скоростью 900 байт/c. Но это ещё не скорость выдачи фонем на выход синтезатора, а всего лишь скорость передачи данных в самом синтезаторе, необходимая для текущих регулировок фильтров, высоты голосового тона и амплитуд при воспроизведении каждой отдельной фонемы. Данная информация хранится, как правило, в специальной управляющей таблице в памяти компьютера отдельно для каждой фонемы и её вариаций – аллофонов.

  1. Цветовой охват. CIE диаграмма. Управление цветом.

Профили устройств.

Цвет может быть представлен в природе, на экране монитора, на бумаге. Во всех случаях возможный диапазон цветов, или цветовой охват, будет разным.

Самым широким он будет, естественно, в природе, в этом случае он ограничивается только возможностями нормального человеческого зрения (например, человек совсем не воспринимает инфракрасного излучения без специальных устройств).

Часть из того, что существует в природе, может передать монитор. На экране нельзя точно передать, например, чистые голубой и желтый цвета.

Часть из того, что показывает монитор, можно напечатать на принтере, при этом совсем не передаются цвета, составляющие, которых имеют очень низкую плотность.

Итак, что же означает термин «цветовой охват»? Как показали эксперименты, проведённые ещё в начале прошлого века, обработка информации нашим глазом и нашим мозгом не однозначна, и полностью описать человеческое зрение в RGB-системе невозможно – на самом деле кривые спектральной чувствительности разных типов колбочек существенно сложнее.

В результате экспериментов была создана система, описывающая весь диапазон цветов, воспринимаемых нашим глазом. Её графическое отображение получило название CIE-диаграммы

(рис. 6).

CIE – латинская аббревиатура названия организации «Международная комиссия по освещению» (Committee International of Elucidation), утверждающей международные стандарты в области освещения.

Вернемся к рисунку.

Внутри закрашенной области находятся все цвета, воспринимаемые нашим глазом.

Контур этой области соответствует чистым, монохроматическим цветам, а внутренняя область – соответственно, немонохроматическим, вплоть до белого цвета (он отмечен белой точкой).

На CIE-диаграмме, в качестве точки белого, обычно отмечают так называемую "точку плоского спектра", имеющую координаты x=y=1/3.

С помощью CIE-диаграммы, любой цвет, воспринимаемый человеческим глазом, может быть определен с помощью двух координат по осям диаграммы (x и y).

Рис. 6. CIE диаграмма

Как определить цветовую область данного устройства?

Для этого необходимо пометить на CIE-диаграмме точки цветов, которые генерируют составляющие источники, например точки красного, зеленого и синего цветов конкретного цветного монитора, а затем соединить их прямыми линиями. В результате полученный треугольник отразит только те цвета, которые в состоянии генерировать данное устройство. Именно этот треугольник и называется "цветовой охват" данного устройства.

Максимально возможный цветовой охват для системы с тремя базовыми цветами даёт так называемый (гипотетический) «лазерный дисплей» (большой треугольник на рисунке), базовые цвета в котором формируются тремя лазерами, красного, зелёного и синего цветов.

Лазер имеет очень узкий спектр излучения, лучи монохромны, поэтому координаты соответствующих базовых цветов будут лежать, на границе диаграммы. Как видно из рисунка, даже лазерный (идеальный) дисплей не способен воспроизвести все цвета, какие видит человеческий глаз, хотя и достаточно близок к этому. Маленький треугольник соответствует реальному монитору.