logo
Полный текст учебника

Механизм распознавания речи

Механизм распознавания речи включает в себя обычно четыре основных блока:

Препроцессор или модуль сбора данных обеспечивает приведение речевого сигнала к наиболее качественному виду (производится автоматическая регулировка усиления, подавление эхо-сигнала, фиксация наличия или отсутствия речи и интонационного выделения конца фразы и т. п.).

Экстрактор выполняет спектральный анализ сигнала. Акустико-фонетический поток звуков разбивается на короткие кадры (длительностью примерно по 10 мс) и выявляются спектральные характеристики каждого кадра.

Компаратор выполняет акустическое сравнение выявленных характеристик каждого кадра с имеющимися акустико-фонетическими образцами. Сравнение производится на уровнях выявления контекстно-независимых фонем, контекстно-зависимых фонем и моделей слов.

Интерпретатор решает задачу наилучшего разбиения полученного от компаратора «алфавитного» потока на слова и фразы.