Программные продукты распознавания речи
Средства речевого управления первыми появились на рынке. Их основная идея состоит в распознавании компьютером человеческих слов и выполнении определенных действий. На ранних стадиях развития речевого управления компьютеры научились распознавать слова, обозначающие цифры. Научные исследования в этом направлении продолжались, и сегодня компьютеры способны распознавать числа на 20 языках при условии, что пользователь называет цифры последовательно. Автоматические справочные системы на базе технологии распознавания цифр применяются телефонными компаниями Европы и Северной Америки.
Распознавание имен развито пока не в такой степени. Компания Nortel применяет технологию Open Speech для собственных нужд на базе внутренней АТС: пользователь снимает трубку, набирает определенную цифру и произносит нужное имя, а компьютер, повторив имя и получив подтверждение, соединяет пользователя с абонентом. Система Open Speech имеет недостатки: медлительность, трудности поиска абонента при произнесении имени в уменьшительном виде и др. Более сложная система распознавания, основанная на преобразовании речи в последовательность цифровых данных, разработана фирмой Nuance Communications. Цифровые данные используются для извлечения информации из базы данных, а механизм синтеза речи генерирует речевой ответ. Такую систему применяет американская компания Charles Schwab & Co., специализирующаяся на брокерских услугах участникам фондового рынка. По некоторым данным, система ежедневно принимает 50 тыс. звонков и обеспечивает 95% точности при обработке 10 тыс. названий (компании, ценные бумаги и т.д.).
Фирма Philips работает над системой распознавания речи третьего поколения. Система первого поколения была основана на распознавании цифр и предусматривала четкую структуру запроса: пароль, идентификатор, число, обозначающее сущность обращения. В такой системе информация вводилась в речевой форме или с помощью кнопок телефона с тональным набором. Продукты второго поколения базировались на определении ключевых слов. Система третьего поколения – Natural Dialogue System – основана на идее постепенного обучения на большом количестве диалогов, в ходе которых создаются рабочий словарь и база данных отношений между словами. Система данного типа используется швейцарской железнодорожной компанией Swiss Railways и охватывает 3,5 тыс. пунктов. В системе компьютер обрабатывает типичные обращения клиента и связывает пункт отправления с пунктом назначения. Германская авиакомпания Lufthansa, также применяющая данную систему, предлагает возможным клиентам автоматическое расписание своих рейсов, а радиостанция Radio Luxemburg – прогноз погоды по туристическим маршрутам мира.
Программные пакеты средств диктовки, которые основаны на распознавании человеческой речи и записи ее в память компьютера в виде текстовой информации, применяются на практике всего несколько лет. Различают пакеты раздельной и слитной диктовки. Первые, к которым относится, например, пакет Voice Type корпорации IBM, достаточно просты в разработке и не предъявляют жестких требовании к вычислительной мощности, но создают некоторые трудности для пользователя, который должен делать неестественные паузы перед произнесением каждого нового слова. Пакеты слитной диктовки более сложны, требуют повышенного быстродействия процессора и больших объемов памяти. С помощью пакета Via Voice корпорации IBM пользователь может в речевом режиме выполнить операции по вводу текстовой информации на трех языках (английском, немецком и французском) в Windows – приложениях со скоростью до 140 слов в минуту. Для эффективной работы с пакетом Via Voice необходима непродолжительная настройка в виде курса обучения системы (около 100 предложений). Стоимость пакета – 200 USD.
Фирма Dragon Systems разработала пакет слитной диктовки Dragon Dictate. Система, которая содержит активный словарь как минимум на 30 тыс. слов, позволяет управлять компьютером с помощью речевых команд и надиктовывать текст в программы Microsoft Word, Word Perfect, Netscape Navigator, Internet Explorer и др. Пользователь может дополнить базовый активный словарь произвольной записью необходимых ему слов или подключить дополнительные словари по определенной тематике или области профессиональных знаний (медицинский, юридический и т.д.). Распознавание слов в системе Dragon Dictate построено на фонетической модели каждой буквы алфавита, произносимой пользователем. Фонетическая модель буквы создавалась на основе спектрального анализа записи произнесения букв тысячами англоязычных американцев и последующего деления спектральных характеристик на отдельные элементы (фонемы). Однако, фонетическая модель позволяет добиться 85-90 % уровня распознавания, поэтому побуквенный ввод сочетается с проверкой по словарям. Если и после этого буквы не складываются в произнесенное слово, запускается алгоритм корректировки: буквы в неизвестном слове удаляются, добавляются или заменяются, причем каждая из операций оценивается определенным количеством штрафных баллов, а затем происходит выбор слова по наименьшей сумме штрафных баллов.
Программные продукты идентификации по образцу речи преследуют цель распознавания конкретной личности говорящего и тесно связаны с биометрическими технологиями идентификации людей по их уникальным физическим признакам (отпечатки пальцев, рисунок радужной оболочки глаз). Речь каждого человека имеет свои особенности и может быть описана определенными значениями физических показателей. Данное свойство уникальности речи применяется в системах ограничения доступа и системах безопасности, в том числе информационной.
При взаимодействии с системой идентификации пользователь проходит регистрацию, при которой запоминаются особенности его голоса и формируется, так называемая, речевая модель, затем тестирование, сравнивающее полученную речевую модель с моделью обобщенного «самозванца», составленной на базе речи множества людей. Если уникальная модель речи и модель речи «самозванца» отличаются, то пользователь получает допуск.
В наиболее простых программных продуктах для идентификации используется одно ключевое слово, повторяемое несколько раз в процессе регистрации (по существу – это пароль). Однако, здесь высока вероятность обмана системы с помощью предварительной записи и воспроизведения голоса.
Схема регистрации может состоять в повторении 10 и более слов, предложенных системой. В процессе тестирования человеку предлагается произнести некоторые из этих слов. Для каждого сеанса регистрации используются различные слова, что обеспечивает высокую степень защиты от обмана системы посредством записи голоса.
И, наконец, существует фоновая схема регистрации: пользователь зачитывает текст или последовательность фраз, а система «незаметно» записывает некоторые элементы, создает речевую модель и проводит тестирование. Фоновая схема обеспечивает наивысшую степень защиты.
Программные продукты с проверкой голоса предлагают на рынке 20 фирм-производителей. Для идентификации по голосу через коммутируемую телефонную сеть удобны программы фирмы Keyware Technologies. Кроме того, фирма создала пакет S2 Security Server для двойного опознавания по голосу и лицу.
- А.А. Козырев информационные технологии
- Экономике и управлении
- Предисловие
- Глава 1. Введение в информационные технологии Информационные технологии в экономических и управленческих учебных дисциплинах
- История возникновения и развития информационных технологий
- Состав и сущность современных информационных технологий в экономике и управлении
- Контрольные вопросы
- Глава 2. Аппаратные средства компьютерных технологий информационного обслуживания управленческой деятельности Классификация и структура аппаратных средств ит Классификация
- Карманные пк
- Блокнотные пк
- Персональные компьютеры сферы автоматизации домашнего хозяйства
- Базовые настольные персональные компьютеры
- Сетевые персональные компьютеры
- Высокопроизводительные настольные персональные компьютеры и серверы начального уровня
- Многопроцессорные рабочие станции и серверы высокого уровня
- Суперкомпьютеры
- Кластерные системы
- Классификация персональных компьютеровPc99
- Классификация по принципу архитектуры микропроцессоров
- Структура персонального компьютера
- Материнская плата
- Центральный процессор
- Процессоры класса 586
- Процессоры класса 686
- Процессоры класса 786
- Перспективные разработки процессоров
- Процессоры семейства Alpha
- Отечественные разработки перспективных процессоров
- Память на магнитных и оптических носителях
- Винчестер
- Оптимальная емкость винчестеров для настольных пк в 1992-2000 годах
- Дисковод флоппи-дисков
- Дисководы cd-rom
- Дисководы cd-r
- Дисководы dvd
- Магнитооптические накопители
- Накопители на магнитной ленте
- Оперативная память
- Графический контроллер
- Монитор
- Устропства мультимедиа
- Устройства ввода и вывода
- Источники бесперебойного питания
- Технические средства презентаций
- Слайд-проекторы
- Графопроекторы
- Видеопроекторы
- Проекторы с жидкокристаллическими дисплеями
- Проекционные экраны
- Устройства коммуникаций и сети
- Контрольные вопросы
- Глава 3. Основы построения инструментальных средств информационных технологий Использование операционных систем
- История появленияwindows98
- Технология «горячиxклавиш»
- Применение технологии «окон»
- Размеры и положение окна на экране
- Организация диалоговых окон
- Использование справочной системы
- Технологии работы с файлами и папками
- Завершение работы с компьютером в системеWindows
- Использовлние технологий «Рабочего стола»Windows98
- Операции с папками в окне «Мой компьютер»
- Технологии «проводника»Windows
- Технология синхронизации документов
- Технологии удаления и восстановления информации
- Применение технологии «Панели задач»
- Работа с Главным меню
- Технология применения ярлыков
- Панель управления
- Настройка свойств экрана
- Вспомогательные программыWindows98
- Служебные программыWindows98
- ТехнологииMicrosoftNetMeeting
- ТехнологияMicrosoftСhat
- Технологии FrontPage Express
- Применение комплекса программ для связиWindows98
- Поиск информации в рамках компьютера, локальной или глобальной сети
- Специализированные операционные системыBeOs,MacOs,JavaOs
- Применение пользовательских оболочек
- Возможности Norton Commander
- Интерфейс Norton Commander
- Организация файлов
- Назначение функциональных клавиш
- Операции с файлами
- Технологии пакетов вспомогательных программ Комплекс программNortonUtilities
- Пакет утилит Norton System Works 2000
- Пакет утилитMcAfeeOffice2000
- Коммуникационные пакеты Обзор основных коммуникационных пакетов
- Технологии работы с обозревателем
- Функции защиты информации в браузерах
- Использование антивирусных программных продуктов Компьютерные вирусы, пути их распространения и методы борьбы с ними
- Антивирусные программные продукты
- Контрольные вопросы
- Глава 4. Информационные технологии функциональной обработки информации
- Информационные технологии документационного обеспечения управленческой деятельности
- Технологии подготовки текстовых документов Текстовый процессорWord2000
- Системы машинного перевода
- Технологии обработки экономической информации на основе табличного процессораExcel2000
- Требования к размеру видеопамяти
- Технологии использования систем управления базами данных (субд) Базы данных в экономических системах
- Организация системы управления базами данных
- Вопросы разработки и внедрения баз данных
- Офисные интегрированные программные пакеты Интегрированный программный продукт
- Интегрированный программный продукт
- Технологии обработки речи
- Программные продукты распознавания речи
- Программы синтеза речи
- Теоретические основы распределенной обработки информации
- Контрольные вопросы
- Глава 5. Организация корпоративных информационных систем Понятие корпоративной информационной системы
- Стандарт методов управления производством и дистрибуцииMrpii
- Организация информационных систем в соответствии со стандартомMrpii
- Бизнес-планирование
- Система управленияErp
- Планирование разработки компьютерных информационных систем
- Этапы построения корпоративных информационных систем
- Требования к документации и стандартизации корпоративных информационных систем
- Защита информации
- Безопасность пользователя при эксплуатации компьютерных систем
- Отечественные нормы безопасности
- Зависимость между неблагоприятными факторами и отклонениями в состоянии здоровья
- Зарубежные нормы безопасности
- Требования тсо'92 по уменьшению электрических и магнитных полей
- Организация информационных систем обеспечения качества
- Контрольные вопросы
- Глава 6. Компьютерные технологии интеллектуальной поддержки управленческих решений
- Технологии исследования финансово-хозяйственной деятельности
- Бухгалтерские пакеты
- Программные продукты создания бюджета
- Технологии стратегического корпоративного планирования
- Программные продукты стратегического корпоративного планирования
- Компьютерная программаProjectexpert
- Основные функции программы
- Подготовка отчетных форм
- Связь с другими программами.
- Отличия Project Expert 5 и Project Expert 5 Professional.
- Компьютерная программаMarketingExpert
- Компьютерная программаBizplanner
- Компьютерная программаAuditexpert
- Переоценка баланса
- Автоматический ввод данных
- Графики и диаграммы
- Подготовка отчетных форм
- Настройка
- Обмен данными
- Компьютерная программаProjectQuestionnaire&Risk
- ПрограммаProjectRisk
- Компьютерная программаForecastExpert
- Технологии прогнозирования деятельности предприятия Прогнозирование с помощьюMicrosoftExcel
- Прогнозирование с помощью программного продукта «Альт-Прогноз»
- Исходные данные для описания инвестиционного проекта
- Технологии автоматизации аналитических исследований Офисный экспертный комплекс
- Технологии автоматизации управления в масштабах всего предприятия
- Комплексная автоматизация предприятия «босс-Компания»
- Комплексная автоматизация предприятия «Парус»
- Комплексная автоматизация предприятия «Галактика»
- Комплексная автоматизация предприятия «ns2000»
- Контрольные вопросы
- Глава 7. Экономические аспекты повышения эффективности информационных технологий
- Определение производительности компьютерной техники
- Экономическая оценка совокупной стоимости владения
- Анализ расходов на информационные системы
- Экономия при переходе на 32-разрядную платформу*
- Снижение совокупной стоимости владения путем реформирования информационной системы
- Контрольные вопросы
- Глава 8. Инновационные направления развития информационных технологий
- Обзор современного состояния рынка ит
- Пути развития традиционной индустрии ит
- Контрольные вопросы
- Заключение
- Библиография
- Содержание
- Глава 1. Введение в информационные технологии 2
- Глава 2. Аппаратные средства компьютерных технологий информационного обслуживания управленческой деятельности 10
- Глава 3. Основы построения инструментальных средств информационных технологий 68
- Глава 4. Информационные технологии функциональной обработки информации 123
- Глава 5. Организация корпоративных информационных систем 162
- Глава 6. Компьютерные технологии интеллектуальной поддержки управленческих решений 177
- Глава 7. Экономические аспекты повышения эффективности информационных технологий 234
- Глава 8. Инновационные направления развития информационных технологий 243