logo
ИТ в экономике / учебник / Козырев_Информационные технологии в экономике и управлении_2000

Системы машинного перевода

Российскими разработчиками созданы четыре поколения программ-переводчиков [166].

Компания «Промт», начиная с 1991 года, представила на рынке несколько пакетов nporpaмм-переводчиков первого поколения. Пакет ProMT (Programming Machine Translating) версии 3.0, работавший под MS DOS, был ориентирован на перевод специальной документации по программному обеспечению и не имел возможностей пополнения и корректировки словаря. В 1992 году появился пакет Stylus, в состав которого была включена программа-утилита для корректировки словаря в соответствующей предметной области. В 1993 году был создан пакет Stylus for Windows 2.0, который стал первой в мире программой перевода, работающей в среде Windows 3.1.

Второе поколение программ-переводчиков представляет выпущенная в 1994 году полноценная версия Stylus for Windows со встроенным редактором и архитектурой на базе OLE 1.0 и DDE, которая позволяет организовывать передачу данных из редактора MS Word, предусматривает возможность сохранения элементов форматирования среды Word, допускает синхронную прокрутку исходного текста и перевода, сохранения промежуточных результатов перевода. Был значительно расширен словарный запас программы за счет появления большого общелексического словаря, дополняемого, при необходимости, специализированными словарями или словарем конкретного пользователя. В 1995 году, совместно с компанией «Бит» разработан пакет комплексного назначения Stylus Lingvo Office, включающий программу распознавания отсканированного текста (OCR), программу-переводчик и программу проверки орфографии (LingvoCorrector).

В 1996 году для написания программы третьего поколения, способной работать под Windows 95 и Windows NT, был использован макроязык программирования MS Visual С ++, а сама архитектура программы построена на системном ядре перевода или технологии «Гигант», которая обеспечивает единую оболочку для перевода, редактирования результатов перевода и корректировки словарей. В 1997 году компания «Промт» подготовила программу-переводчик для сети Internet -WebTranSite и упрощенную версию Stylus – Stylus Lite.

Четвертое поколение программ-переводчиков, в частности, программа РroМТ-98, имеет архитектуру на базе OLE 2.0 и ActiveX и состоит из трех компонентов в единой оболочке (переводчик РroМТ, приложение для обработки большого количества документов File Translator и браузер Web View с синхронным переводом HTML-страниц). В основе программ четвертого поколения лежит новая технология HTML-to-HTML, которая позволяет сохранять формат переводимых Web-страниц и двигаться по переведенным ссылкам. Помимо РroМТ-98 компанией «Промт» выпущена новая версия переводчика дтя сети Internet – WebTranSite-98, в которой появляется возможность повышения качества перевода за счет подключения дополнительных словарей, а также используется система перевода запросов при общении через популярные серверы. Кроме того, подготовлен пакет для карманных компьютеров – Pocket РroМТ версии 1.0. Этот новый программный продукт на платформе Windows СЕ выполняет функции перевода аналогично настольным системам. Для ввода текста используется клавиатура или новый файл в текстовом формате или формате Pocket Word.

На рынке программных продуктов машинного перевода появились два новых пакета семейства «Прагматика»: «Pragmatica» и «Word +», которые работают под Windows и позволяют осуществлять русско-английский и англо-русский перевод [179].

Пакет «Pragmatica» более совершенен, имеет собственную программную оболочку. Машинный перевод осуществляется с использованием словаря общего назначения на более чем 100 тыс. слов и восьми специализированных словарей в среднем по 40-50 тыс. слов: шести тематических англо-русских словарей (космическая отрасль, машиностроение, медицина, политехника, атомная энергетика, бизнес) и двух тематических русско-английских словарей (авиация и бизнес). Предусмотрена возможность проверки русской и английской орфографии, подборки синонимов, пополнения словарей. Работу с пакетом значительно упрощает режим «активной мыши», при котором пользователь видит в специальном окне перевод слова, отмеченного значком мыши. Отметим, что «Pragmatica» имеет возможность стыковки с текстовым процессором MS Word. Взаимодействие пакета с MS Word происходит не с помощью протокола передачи данных DDE, а через диалоговые окна форматов Word, что позволяет организовать работу переводчика в соответствии с привычными командами текстового процессора.

Система «Word +» работает со словарями меньшего объема и отличается от «Pragmatica» тем, что не имеет собственной оболочки и встраивается в текстовый процессор Word.

Один из новейших программных продуктов в этой области – пакет PROMT Translation Office 2000. В его состав входят восемь компонентов: SmarTool (Microsoft Office 97/2000 Support) Mail Translator (Microsoft Outlook 2000 Support), PROMT, Dictionary Editor, Electronic Dictionary (входит только в комплектации Гигант и ERRE), Web View, QTrans, Clipboard Translator и Integrator.