logo
Полный текст учебника

Системы синтеза речи

Системы речевого вывода информации базируются либо на выборке из словаря готовых оцифрованных звуковых последовательностей, либо на синтезаторах речи. Самым простым вариантом является выборка готовых звуковых последовательностей (как в автоответчике), но, ввиду большого размера звуковых файлов, вывод большого числа слов в этом случае практически невозможен. В таких простых системах часто используются меню, по которым пользователь может выбрать те высказывания, которые он бы хотел услышать. При наличии нужных записей в базе данных их текст озвучивается. Такие системы находят применение, например, в будильниках, в автомобильных навигационных системах и т. п.

Формирование речевого вывода более функционально выполняется полными синтезаторами речи в несколько этапов.

Задачей первого этапа является фильтрация шумовых символов текста (знаков препинания, кавычек, тире, скобок и т. п.). Эта задача решается модулем нормализации, который также обрабатывает контекстно-зависимые сокращения, форматы дат, времени, денежных единиц и т. п.

Модуль преобразования на втором этапе переводит текст из орфографического в фонетический формат (из букв в звуки). Для некоторых языков, например для английского, это непростой процесс, поскольку многие слова произносятся не по буквам, а по особым правилам произношения отдельных буквенных сочетаний.

Модуль анализа выполняет одновременно лексикографическую и синтаксическую обработку для выбора варианта произношения, ритма и интонации.

Фонетический модуль, получив от модуля анализа фонетическое представление исходного текста, обогащает звучание речи дифтонгами, трифтонгами, четырехзвучиями и другими полезными составляющими.

Модуль обработки звука преобразует фонетические данные в звуковые сигналы: генерируемые волновые последовательности (с частотой порядка 10 КГц) модулируются фонетическим потоком. На этой стадии выполняется управление громкостью, скоростью речи, тембром голоса.

Среди программ синтеза речи можно назвать шведскую систему Infovox, систему Monologue английской фирмы FirstByte, систему ProVerbe компании ElanInformatique и др.