Технологии автоматизации перевода текстов
Программные средства автоматического перевода текстов документов можно условно разбить на две основные категории:
Электронные словари представляют собой программные средства для перевода отдельных слов, отображаемых на экране или имеющихся в документе. Удобство их использования состоит в возможности немедленно получить перевод неизвестного слова.
Программы перевода осуществляют автоматический перевод входного текста, выполненного на одном языке, и выдают текст на другом языке.
В ходе работы программа перевода использует обширные словари, наборы грамматических правил и другие средства, обеспечивающие наилучшее (с точки зрения программы) качество перевода. Словарь в этом случае может содержать не только отдельные слова, но и типичные словосочетания. Используя эти средства, программа анализирует грамматическую структуру предложений исходного текста, обнаруживает связи между словами и пытается построить верный перевод фразы на другом языке. Чем короче предложение, тем больше шансов на то, что такое преобразование будет правильным. В длинных предложениях и сложных грамматических конструкциях любая система перевода может быть неточной.
Надёжный и качественный автоматический перевод документов с одного языка на другой пока остается недостижимым идеалом. Причин для этого множество, и главная из них состоит в том, что перевод текста не сводится к переводу отдельных лексических единиц. Преодолеть этот барьер современные программы автоматического перевода пока не могут.
Тем не менее, современные средства автоматизации перевода достигли того уровня, который позволяет эффективно использовать их на практике. Дело в том, что технический текст, в отличие от художественного текста, использует ограниченное число языковых конструкций и более ориентирован на однозначную интерпретацию. Среди используемых лексических единиц встречается большое число технических терминов, имеющих совершенно определённый смысл в рамках данной научной или технической дисциплины. Это значительно упрощает процесс перевода и позволяет в отдельных случаях автоматически получать текст, близкий к результату ручного подстрочного перевода. Программы автоматического перевода имеет смысл использовать для перевода технических текстов в следующих случаях:
при абсолютном незнании иностранного языка;
при необходимости получить перевод быстро, даже ценой снижения его качества (например, это относится к переводу Web-документов);
для перевода на иностранный язык (умения читать иноязычные тексты недостаточно, чтобы научиться объясняться на иностранном языке);
для быстрого создания первоначального черновика («подстрочника»), используемого в ходе подготовки полноценного перевода.
Подготовка документа к переводу включает в себя:
• редактирование исходного текста;
создание списка, не подлежащего переводу слов (например, наименование фирм, товарных знаков и т.д.);
выбор режима перевода - останавливать перевод или не останавливать на нераспознанных словах;
выбор построения файла перевода - двуязычный пофрагментный вывод или только перевод.
Из систем автоматического перевода с русского языка на английский и с английского на русский наиболее распространены такие программы, как Socrat (Сократ) и Stylus. Stylus обеспечивает более высокое качество и более высокую гибкость при переводе. Последняя версия программы Stylus сменила название и теперь называется Promt 98 или Promt XT, Promt8.
Программа словарь ABBYY Lingvo является популярным многоязычным словарем и содержит самую необходимую лексику на языках: английском, немецком, французском, испанском, итальянском, русском.
Для быстрого перевода слова с одного языка на другой необходимо:
1. Указать направление перевода, например, с русского языка на английский
2. Выбрать словарь для перевода, например, словарь по компьютерной терминологии
3. Набрать нужное слово или словосочетание в строке ввода, например, информатика, при этом содержимое главного окна ABBYY Lingvo будет меняться, синхронизируясь с набираемым текстом, как только вы увидели в списке то, что переводите – нажмите кнопку со стрелкой вправо или клавишу ENTER.
4. На экране появится карточка с переводом слова из строки ввода.
Программа словарь ABBYY Lingvo имеет достаточно простой интерфейс для работы и очень популярна при выполнении перевода отдельных слов.
При переводе программа находит начальную форму слова, выделяет устойчивые словосочетания в запрашиваемом фрагменте, предлагает варианты написания слова, если перевод запрашиваемого слова не найден.
Программа Promt предназначена для автоматического перевода документов с английского языка на русский и с русского на английский. Она способна работать с документами в различных форматах, допускает немедленное редактирование оригинала, перевода и может сохранять в нужном виде как оригинал, так и перевод. Перевод слов, которые не входят ни в один из словарей, можно определить самостоятельно и сохранить в пользовательском словаре. Кроме того, программа Promt позволяет указать правила работы с именами собственными и другими словами, не требующими перевода, например, с сокращениями.
Одновременно для обработки может быть открыто несколько документов. Окна документов имеют необычный вид. Они разбиваются на три отдельные области: две из них предназначены для отображения оригинала текста и сформированного перевода, а третья представляет собой информационную панель, предназначенную для вывода информации о переводимом документе и специальных настройках.
Дополнительные возможности программы включают пакетный перевод файлов, быстрый перевод неформатированного текста, а также возможности синхронного перевода Web-страниц в Интернете. Эти средства реализованы как отдельные приложения.
Качество перевода определяется полнотой используемых словарей и учётом грамматических правил. При переводе можно как применять стандартные ресурсы программы, так и добавлять собственные.
Правила перевода отдельных слов (терминов) определяются использованием словарей. Для каждого переводимого документа задаётся набор применяемых словарей. Словари просматриваются в определённом порядке, и, как только переводимое слово обнаружено в каком-то из словарей, дальнейший просмотр прекращается. Программа Promt использует при переводе три типа словарей:
Генеральный словарь содержит общеупотребительную лексику и бытовые значения слов. Он используется всегда и притом самым последним, если слово не найдено ни в одном из других словарей. Изменение этого словаря невозможно.
Специализированные словари содержат термины из различных областей знаний, причём значение переводимого термина выбирается в соответствии со специализацией словаря. Одни и те же слова могут иметь совершенно разный смысл в разных технических дисциплинах, так что выбор нужного словаря обеспечивает правильное использование специальной терминологии в переводе. Редактирование специализированных словарей не допускается, но их можно подключать или отключать при переводе документа.
- Содержание
- Введение
- Лекция 1. Введение в курс. Классификация компьютерных информационных технологий
- Предмет дисциплины. Понятие «компьютерные информационные технологии»
- Технологическая схема обработки информации
- Базовые и специальные информационные технологии
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 2. Информационные ресурсы автоматизированных систем обработки экономической информации
- Понятие «информационные ресурсы». Классификация
- Политика Республики Беларусь в области формирования информационных ресурсов
- Информационные услуги, режимы их предоставления
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 3. Техническое обеспечение компьютерных информационных технологий
- Классификация эвм
- Процессоры
- Устройства автоматизации ввода данных
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 4. Сетевые информационные технологии. Компьютерные сети: основные понятия и принципы построения
- Компьютерные сети: понятие, классификация
- Топология компьютерной сети
- Модель коммутационной сети
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 5. Локальные вычислительные сети
- 1. Оборудование лвс
- 2. Методы доступа к сети
- 3. Стандарты локальных сетей
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 6. Сетевые информационные технологии. Сетевые модели
- Эталонная модель osi
- Конвергенция компьютерных и телекоммуникационных сетей
- Корпоративные сети
- Преимущества, которые дает использование сетей
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 7. Глобальные компьютерные сети
- 1. Глобальная сеть Интернет, протоколы tcp/ip
- 2. Адресация компьютеров в сети
- 3. Услуги Интернет
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 8. Сетевые ит. Интернет и бизнес
- Задачи бизнеса в Интернете
- Классификация электронного бизнеса
- 3. Правовые аспекты электронного бизнеса
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 9. Сетевые информационные технологии. Электронные платежные системы
- Виды платежных систем
- Услуги платежных систем в Беларуси
- Формирование сетевой экономики
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 10. Технологии обеспечения безопасности информационных систем
- 1. Понятие безопасности информационных систем
- 2. Угрозы информационно безопасности
- 3. Методы и средства защиты информации
- Физические и юридические лица имеют право
- Особенности обеспечения безопасности в компьютерных сетях
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 11. Программное обеспечение компьютерных информационных технологий. Системное по
- Модели разработки и распространения по
- Виды лицензий на использование по
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 12. Программное обеспечение компьютерных информационных технологий. Прикладное по
- Технологии обработки информации. Офисные пакеты
- Технологии автоматизированного ввода документа (осr-системы)
- Технологии автоматизации перевода текстов
- Технологии организации рабочего места
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 13. Технологии искусственного интеллекта
- Понятие искусственного интеллекта
- 2. Области применения ии
- Понятие экспертной системы
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 14. Пакеты для математической обработки данных. Maple. Основы работы
- Компоненты экрана, справочная система Maple
- Вычисления в Maple
- Числа и константы
- Стандартные функции
- Преобразование математических выражений
- Решение уравнений
- Численное решение уравнений
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 15. Пакеты для математической обработки данных.Maple. Матрицы и графики
- Работа с массивами
- Графики и анимация
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция 16. Технологии и инструментальные средства программирования. Основы алгоритмизации
- 1. Понятие алгоритма
- 2. Типы алгоритмических процессов
- Повторять:
- 3. Способы записи алгоритмов
- Контрольные вопросы
- Литература
- Основные понятия
- Лекция №17. Технологии и инструментальные средства программирования. Языки программирования
- Технологии разработки программных комплексов
- Классификация языков программирования
- Инструментальные средства программирования
- Контрольные вопросы
- Литература
- Основные понятия