logo search
Шпоры автоматизация и моделирование в ИД Сулим

28. Алгоритмы автоматизированных систем управления редакционно-издательскими процессами

Ввод текста. У-ва ввода текста предназначены для ввода информации и состоит из самого у-ва ввода, данных о шрифтах и необходимых команд, служащих для обработки введенной информации. Разнообразные у-ва ввода можно разделить на две основные группы:

1) у-ва непосредственной связи оператора с ЭВМ;

2) у-ва ввода с носителей информации.

У-ва непосредственной связи с оператором, путем ввода, работают в режиме, определяемом психофизиологическими возможностями оператора. При этом используются как универсальные, так и специальные клавиатурные у-ва. Все эти у-ва предусматривают ручной ввод текстовой информации. К у-вам ввода с носителей относятся кодирующие у-ва и читающие автоматы.

Кодирующие аппараты позволяют получать текст, закодированный на магнитном диске, который затем вводится в ЭВМ. Читающие аппараты обладают высокими скоростями ввода информации, прямым считыванием ее с текста. К сожалению, эти у-ва обладают одним недостатком: невысокая надежность при распознавании текста, напечатанного. К этой группе устройств относятся у-ва ввода информации от телеграфных агентств с телетайпов напрямую, а так же широко используются в газетном производстве.

Кодирующие аппараты предназначены для кодирования и ввода текста, содержащего сложные математические и физические формулы. Эти аппараты являются специализированными у-вами, входящими в состав автоматизированных систем переработки текстовой информации. По своим характеристикам кодирующие аппараты существенно могут отличаться друг от друга. По скорости кодировки, по числу знаков набора, по формату, по числу гарнитур, которые они могут кодировать или распознавать, по шрифтам.

Одной из важнейших задач, решаемых при кодировании текста, является расчет и формирование строки. При этом суммируются ширина закодированных знаков и выдается сигнал об окончании строки. А так же производится выключка строки. Что касается переноса слов, то он производится только в том случае, когда слово состоит не менее чем из 4 букв. Слово при этом анализируется на наличие приставки, при ее наличии перенос производится после нее, слово анализируется на наличие в нем твердого, мягкого знака, й после которых тоже допускается перенос. Далее слово просматривается на наличие пар букв: чередование гласная/согласная. При наличии таких пар осуществляется перенос по ним.

Читающий автомат. Предназначен для считывания и распознавания знаков текста, а так же знаков препинания и т. д. Он же производит кодирование считанной информации. Читающий автомат позволяет существенно повысить скорость кодирования вводимой информации. Он заменяет 15-20 операторов, которые работают на кодирующих аппаратах. Сами считывающие автоматы не широко используются для ввода информации. Причина в том, что читающие аппараты очень зависят от качества печати и напечатанная полиграфическим образом информация не всегда распознается с должным качеством. Вероятность распознавания знака составляет 0,9999.

Процесс перевода текста на машинный язык с помощью читающих устройств включает этапы:

1) подготовка массива страниц для их раздельной подачи в автомат;

2) считывание знаков, при котором просматривается очередной знак, после чего он преобразуется в кодовую комбинацию и заносится в память ЭВМ;

3) распознавание считанного знака, в процессе которого кодовая комбинация сравнивается с эталонным знаком библиотеки и принимается решение о наименовании знака (к какому классу его отнести);

4) регистрация – при которой распознанные знаки записываются на носитель или выводятся на мониторе.

Большое разнообразие печатных шрифтов значительно затрудняет задачу решения обобщенного образа для каждого знака и затрудняет сам процесс распознавания.

При распознавании машинописных текстов приходится различать не только размеры знаков и их начертания, но и учитывать возможные дефекты их изображения на бумаге. Совершенно не пригодны для автоматического чтения и распознавания тексты, написанные под копирку. Для повышения надежности распознавания знаков текста используются так называемые стилизованные шрифты. Типичный пример – цифры почтовых индексов.