4.3. Система распознавания речи «Dragon Naturally Speaking»
Разработка компании Nuance (капитализация 5 млрд. долларов) – программный продукт, система диктовки для любого текста и любого пользователя на английском языке. Система требует пред началом работы адаптации языковых моделей и расширения словаря. Адаптация языковых моделей производится путем загрузки в систему типичных для работы пользователя текстов и последующей корректировки статистических языковых моделей. Расширение словаря – задача пользователя. Насколько успешно он с ней справится, настолько успешно будет работать система. Любая система распознавания знает только те слова, что есть в ее словаре. Существует в этой системе и подстройка под голос диктора. Для этого нужно минут тридцать почитать тексты, предложенные системой, что бы программа адаптировала параметры существующих акустических моделей.
Следует четко понимать, что на данном этапе (а может быть и в принципе) создание универсального продукта невозможно. Например, для журналистов, которые проводят интервью с разными людьми,
в разном окружении, в разных местностях. Надеяться на появление мобильных и даже стационарных устройств для распознавания спонтанной речи не приходится. Спонтанная речь отличается более сложными языковыми и акустическими моделями. Вычислительные мощности и речевые базы спонтанной речи должны иметь гигантские размеры. В то же время системы с ограниченным специализированным словарем есть и хорошо работают. Например, их используют медицинские учреждения в США. Известно, что медицинским работникам постоянно требуется делать какие – то записи, будь то история болезни или протоколирование действий. Медики в США наговаривают текст, который автоматически переводится в машинный вид. Затем текст подвергается косметической правке. Соответствующие технологии есть у фирмы Nuance. Объем продаж медицинских систем распознавания речи в США составляет 12 – 15 млрд. долларов. Можно, так же отметить мультимедийную систему изучения английского языка в игровой форме «TriplePlayPlus English». Разработка Сиракузского университета США (так же разновидность системы Dragon), в которой реализован диалоговый речевой режим обучаемого и программы. Производится предварительная настройка по принципу (мужчина, женщина или ребенок). Затем, в ходе речевого диалога, программа не пропустит на следующий этап обучения до тех пор, пока ее не «удовлетворит» произношение обучаемого.
В целом, в плане практического применения, наибольших успехов достигли системы на ограниченных специализированных словарях.
- Билет № 1
- Билет № 2
- 2. Клиппирование речевого сигнала.
- 3. Выделение формантных параметров речи.
- Билет № 3
- Билет № 4
- Билет № 5
- 1. Методы кодирования- востановления формы речевых сигналов.
- 2. Аналоговые методы синтеза формантных частот.
- 3. Синтезаторы третьего типа используют метод цифрового моделирования голосового тракта человека.
- Билет № 6
- Билет № 7
- Билет № 8
- Билет № 9
- Билет № 10
- 3.4.4.2. Форматы пакетов
- 3.4.4.2.1. Маркерный пакет
- 3.4.4.2.2. Маркер начала кадра (sof)
- 3.4.4.2.3. Пакет данных
- 3.4.4.2.4. Пакет подтверждения
- Билет № 11
- Билет № 12
- Билет № 13
- Билет № 14
- Билет № 15
- Билет № 16
- Билет № 17
- Билет № 18
- Рассмотрим общее устройство и принцип работы пзс.
- 1. Методы кодирования- востановления формы речевых сигналов.
- 2. Аналоговые методы синтеза формантных частот.
- 3. Синтезаторы третьего типа используют метод цифрового моделирования голосового тракта человека.
- Билет № 19
- Билет № 20
- 4.1. Еще в 1996 г. Компания Lernout & Hauspie Speech Products
- 4.2. Управление голосом Vocollect
- 4.3. Система распознавания речи «Dragon Naturally Speaking»
- 4.4. Разработка «Горыныч».
- 4.5 Фирма црт (Центр речевых технологий, Ст. Петербург)
- «Икар Лаб»
- Назначение и области использования.
- Функциональные возможности
- 3.6.1.Качество печати.
- 3.6.2. Скорость печати.
- 3.6.3.Память принтера.
- 3.6.4. Бумага и лотки
- 3.6.5. Чернила и тонер.
- 3.6.6. Подключение к компьютеру.
- Билет № 21
- Билет № 22
- Билет № 23
- 3.2. Матричный принтер.
- 3.3. Струйный принтер.
- 3.4. Лазерный принтер.
- 3.5. Сублимационный принтер.
- Билет № 24
- Билет № 25
- Билет № 26
- Билет № 27
- 3.4.4.2. Форматы пакетов
- 3.4.4.2.1. Маркерный пакет
- 3.4.4.2.2. Маркер начала кадра (sof)
- 3.4.4.2.3. Пакет данных
- 3.4.4.2.4. Пакет подтверждения
- Билет № 28