Автоматизация ввода информации в компьютер
Основным методом перевода бумажных документов в электронную форму является сканирование, в результате которого создается графический образ бумажного документа.
Принцип действия сканирующих устройств или сканеров одинаков. Документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. В результате сканирования получается графическое изображение, состоящее из точек, т.е. растровое изображение. Количество точек определяется как размером изображения, так и разрешением сканера.
Существуют специальные стандарты программного интерфейса, обеспечивающего связь между сканерами и операционной системой. Этот интерфейс основан на специальном протоколе TWAIN.
Графический образ, получаемый после сканирования документа, чаще всего необходимо перевести в текст. Для этого используются специальные программные средства, называемые средствами распознавания образов. Многие из программ используют совершенно различные алгоритмы распознавания, но при этом распознавание не зависит ни от шрифтов, ни от алфавита. Из программ, способных распознавать текст на русском языке наиболее известными являются программы Fine Reader и CuneiForm.
Преобразование документа в электронный вид происходит в три основных этапа. Каждый из этих этапов может выполнятся программами как автоматически, так и под контролем пользователя.
Сканирование. Запускается сканирующий модуль, настраиваются параметры сканирования(разрешение, размер, тип сканирования) и происходит собственно сканирование.
Сегментация и распознавание текста. Прежде чем получить готовый текст, необходимо разбить фрагменты документа на блоки(текст, рисунок, таблица и т.д.), для того, чтобы правильно их распознать(превратить в текст).
Проверка орфографии и передача текста в нужное приложение для дальнейшей работы или сохранение в файл.
- Лекция 4. Прикладное программное обеспечение
- Средства табличной обработки информации
- Средства обработки графической информации
- Средства табличной обработки информации
- Области применения электронных таблиц
- Среда табличного процессора
- Основные режимы работы
- Система команд
- Табличные данные
- Средства обработки графической информации
- Средства работы с растровой графикой
- Векторная графика
- Средства работы с векторной графикой
- Фрактальная графика
- Лекция2 Прикладное программное обеспечение
- Офисное по
- Средства разработки презентаций и публикаций
- Автоматизация ввода информации в компьютер
- Автоматизация перевода документов
- Cправочно-правовые системы
- Классификация баз данных
- По характеру хранимой информации
- По способу хранения данных
- По структуре организации данных
- Системы управления базами данных
- Этапы проектирования баз данных
- Этапы проектирования и создания базы данных определяются следующей последовательностью:
- Интеллектуальные системы