logo
Ответы на билеты

Билет № 16

  1. Синтезаторы с непосредственным кодированием /восстановлением человеческой речи.

Синтезаторы этого типа используют компилятивный метод синтеза. Это означает, что в основу построения синтезатора положен принцип работы по образцам. В качестве образца берётся живая человеческая речь, которая предварительно кодируется, то есть преобразуется в цифровую форму и сохраняется в памяти компьютера.

Принцип кодирования речевого сигнала иллюстрирует рис. 9, а.

На верхнем рисунке приведён фрагмент речевого сигнала А(t). Этот сигнал с помощью устройства, называемого схемой выборки, квантуется с частотой синхроимпульсов (СИ), и на выходе схемы выборки образуются отдельные значения речевого сигнала А*(t). Амплитуда этих сигналов соответствует величине сигнала А(t) в момент выборки, то есть в момент поступления СИ на схему выборки.

Затем, отдельные выборки произнесённого в микрофон слова или фразы преобразуются в код и записываются в память. Массиву байтов, соответствующих слову (фразе), присваивается идентификатор (имя), по которому на этапе синтеза речи можно обратиться к области памяти, где хранится это слово, (фраза). Как видно на рис. 9, а, десяти выборкам речевого сигнала соответствуют 10 байтов, записанных в память компьютера.

На рисунке 9, б приведена простейшая схема выборки, реализованная на базе операционного усилителя (ОУ) с емкостью в цепи отрицательной обратной связи (С). Когда электронный ключ (К) закрыт ёмкость хранит напряжение, равное величине напряжения А(t) в момент закрытия ключа К. На выходе операционного усилителя (ОУ) при этом образуется напряжение -А*(t) равное А(t) (при равенстве резисторов R). С приходом очередного импульса СИ ключ открывается и ёмкость разряжается до напряжения А(t), действующего на входе. С прекращением импульса СИ ключ К закрывается и ёмкость хранит напряжение, поступившее на вход в момент закрытия ключа (с обратным знаком). Работу схемы выборки описывает временная диаграмма, приведённая на рис. 9, а.

Структура синтезатора приведена на рис. 10.

В приведённой структуре можно выделить 3 основных узла:

1. Входной узел синтезатора, состоящий из микрофона (М), фильтра нижних частот (ФНЧ), усилителя (У), схемы выборки и 8-битового АЦП.

2. Компьютер.

3. Выходной узел синтезатора, включающий в себя 8-битный ЦАП, фильтр нижних частот (ФНЧ), усилитель мощности и динамик (Д).

Работа входного узла синтезатора описана выше и не требует особых комментариев. Следует лишь отметить, что фильтр нижних частот, используемый в этом узле, и настроенный на частоту фильтрации сигнала с микрофона (ниже 3 кГц), выполняет задачу подавления высокочастотных помех, приводящих к искажению речевого сигнала А(t). Усилитель (У) доводит амплитуду речевого сигнала до уровня, принятого в синтезаторе.

Схема выборки с частотой 6 кГц производит выборки речевого сигнала A*(t), а аналого-цифровой преобразователь (АЦП) преобразует выборки в цифровые коды (байты). При частоте выборки сигнала 6 кГц среднее количество выборок для слова длительностью 0,3 секунды составляет около 2000 байтов (включая короткие паузы в начале и в конце слова).

Компьютер имеет параллельный 8-битный порт ввода данных с АЦП и параллельный 8-битный порт вывода, откуда данные поступают на вход 8-битного цифро-аналогового преобразователя (ЦАП).

В процессе сбора данных компьютером его резидентная программа переносит информацию из 8-битного АЦП и последовательно записывает её в память.

После произнесения слова процесс выборки заканчивается, а в памяти оказывается записанным цифровое представление слова.

Выходной узел синтезатора представляет воспроизводящую часть синтезатора. Он содержит 8-битный цифро-аналоговый преобразователь, фильтр нижних частот (ФНЧ), который отфильтровывает нежелательные высокочастотные сигналы c выхода ЦАП – A(t)вос, возникающие в восстановленном сигнале. Отфильтрованный сигнал поступает на усилитель мощности, а затем в виде сигнала A*(t)вос на динамик-Д.

Программа воспроизведения речи, хранимая в памяти, – это простая индексирующая программа, которая последовательными шагами просматривает записанную ранее информацию и выводит её побайтно на 8-битный ЦАП.

Речь, которую услышит пользователь по своему звучанию, соответствует голосу говорящего и имеет модуляцию и тональность, как и входной речевой сигнал.

  1. Анализ цвета. Объективный и субъективный факторы.

Цветовые модели RGB и CMYK.

Анализ цвета

Для описания цвета, необходимо представить цветовую информацию как некий световой поток. В общем случае цвет — это совокупность разных световых волн с преобладанием определенных частот.

Для анализа спектральной составляющей светового потока используются автоматизированные спектрографические системы.

Пример такой системы приведен на фотографиях.

На фотографии: большой и угловатый чёрный ящик – это монохроматор Solar TII MS3504i, слева виден его входной порт, напротив которого закреплён световод с оптической системой, справа виден оранжевый цилиндр фотодатчика, закреплённого на выходном порту монохроматора; сверху стоит источник питания системы.

Строить описание цветовой информации на частотных характеристиках — задача очень сложная с практической точки зрения. Поэтому выполняется принудительное разделение светового потока с помощью совокупности фильтров. Этот этап называется анализом цвета.

Для того чтобы описать цветовую информацию, необходимо преобразовать его в такую форму, которая позволяет осуществлять непосредственное измерение, а именно в форму яркостных характеристик. Для этого используются фильтры.

Каждый из фильтров создает после себя однородный цветовой поток, т. е. по сути, тоновое изображение, которое достаточно легко фиксировать и кодировать — преобразовывать в цифровую форму. Практика показала, что достаточно всего трех фильтров (красного, зеленого и синего цветов). Вспомним рецепторы «колбочки».

Световой поток дублируется на три идентичных, которые проходят через три разных фильтра, а за каждым фильтром располагается устройство, фиксирующее яркость элемента дискретизации.

Цветовая модель RGB

Множество цветов видны за счет излучения света определенных длин волн. К излучаемым цветам относятся белый свет, цвета на экране телевизора, монитора, кино, проектора и т. д. Цветов огромное количество, но из них выделено только три, которые считаются основными (первичными): это — красный, зеленый и синий

Перечисленные цвета совпадают с теми цветами, которые упоминались при обсуждении основ физиологии зрения.

При смешении двух основных цветов результат осветляется: из смешения красного и зеленого получается желтый, из смешения зеленого и синего — голубой, синий и красный дают пурпурный. Если смешиваются все три цвета, образуется белый цвет. Поэтому такие цвета называются аддитивными.

Модель, которую мы рассматриваем, называется RGB по первым буквам английских слов Red (Красный), Green (Зеленый) и Blue (Синий).

Поскольку в модели используется три независимых значения, ее можно представить в виде трехмерной системы координат.

Каждая координата отражает вклад одной из составляющих в результирующий цвет.

В результате получается некий куб, внутри которого и "находятся" все цвета, образуя цветовое пространство модели RGB. Любой цвет, который можно выразить в цифровом виде, входит в пределы этого пространства (рис. 4).

Рис. 4. Цветовой куб

Объем такого куба (количество цифровых цветов) легко рассчитать: поскольку на каждой оси можно отложить 256 значений, то 256 в кубе (или 2 в двадцать четвертой степени) дает число 16 777 216.

Это означает, что в цветовой модели RGB можно описать более 16 миллионов цветов, но использование цветовой модели RGB вовсе не гарантирует,

что такое количество цветов может быть обеспечено на экране или на оттисках. В определенном смысле это число — скорее предельная (потенциальная) возможность.

Замечание

Следует отметить, что у аддитивной модели синтеза цвета существуют ограничения. В частности, не удается с помощью физически реализуемых источников основных цветов получить голубой цвет (как в теории — путем смешения синей и зеленой составляющих), на экране монитора он создается с некоторыми техническими ухищрениями. Кроме того, любой получаемый цвет находится в сильной зависимости от вида и состояния применяемых источников. Одинаковые числовые параметры цвета на различных экранах будут выглядеть по-разному. И, по сути дела, модель RGB — это цветовое пространство какого-то конкретного устройства, например сканера или монитора.

Цветовая модель CMYK

К отражаемым цветам относятся цвета, которые сами не излучают, а используют белый свет, вычитая из него определенные цвета. Такие цвета называются субтрактивными ("вычитательными"), поскольку они остаются после вычитания основных аддитивных.

Основных субтрактивных цветов будет три: голубой, пурпурный, желтый

Перечисленные цвета составляют так называемую полиграфическую триаду. Эти цвета поглощают красную, зеленую и синюю составляющие белого цвета. При этом большая часть видимого цветового спектра может быть репродуцирована на бумаге. Каждому пикселю в CMYK-изображении присваиваются значения, определяющие процентное содержание триадных красок.

При смешениях двух субтрактивных составляющих результирующий цвет затемняется, а при смешении всех трех должен получиться черный цвет. При полном отсутствии краски остается белый цвет.

Следует отметить, что существует проблема, именуемая "баланс по серому цвету" (невозможно создать нейтральный серый, используя равные площади голубой, пурпурной и желтой растровой точки).

Для компенсации этих и других недостатков в число основных красок была добавлена черная краска (она позволяет получить чистый насыщенный черный цвет и нейтральные тона).

Именно эта краска добавила последнюю букву в название модели CMYK.

С — это Cyan (голубой), М — это Magenta (пурпурный), Y - Yellow (желтый), К — это BlacK (Черный), т. е. от слова взята не первая, а последняя буква. По другой версии: буква «К» — это сокращение от слова Key ("ключевой", "основной", "контурный"), поскольку черный цвет играет основную роль в обеспечении резкости печати.