logo search
Береза Підр

Відображення логічної моделі документа на його ге­ометричну модель називається алгоритмом формування текстових до­кументів.

Наступним кроком на шляху до формалізації документа є фор­малізація його змісту. Суть такої формалізації полягає у тому, щоб розбити кожний кінцевий компонент структури документа на елемен­ти, кожний з яких має нести певне смислове (семантичне) наванта­ження. При цьому розглядаються елементи трьох видів:

аї елементи, що мають відношення тільки до даного документа;

б) елементи, що повторюються у багатьох документах;

в) елементи, що повторюються кілька разів в одному документі. Елементи групи (в), у свою чергу, можуть поділятися на елементи

виду (а) або (б).

Таким чином, у пам'ять ПЕОМ заносяться І зберігаються шаблони документів, що містять у собі:

текстові елементи, що є унікальними для даного виду документа;

«порожні» елементи, що заповнює проектувальник для кожної конкретної версії документа даного виду;

посилання на елементи, що повторюються.

Перевага такого підходу полягає у натуральному поданні повно-текстового документа для розроблювача, а також у простоті зміни структури документа пря його реалізації.

Аналіз видів і типів документів ІС, вимог до їхнього змісту по­казує, що багатьом технічним документам на ІС властива наявність однакових розділів і підрозділів. Для багатьох розділів характерне дуб­лювання однойменних фрагментів тексту. Дублювання призво­дить до зростання трудомісткості розробки, збільшення обсягу робіт з підготовки технічної документації за рахунок:

1. Багаторазових описів одних і тих самих процедур обробки даних.

2. Багаторазового опису правил використання доку­ментів» порядку роботи фахівців.

3. Опису загальні правила експлуатації технічних і програмних засобів у різних документах.

При цьому зміст окремих компонентів документів не формалізо­вано. З іншого боку, у процесі підготовки проектної документації ви­конуються однотипні повторювані роботи з написання фрагментів тек­сту. Часто ці фрагменти бувають понаповнені копіями, а мають лише певну частку повторення.

Традиційним засобом автоматизації підготовки документів є тек­стові редактори і програми-форматизатори. Текстові редактори забез­печують автоматизоване введення, коригування, збереження і виве­дення текстових документів. Програми-форматизатори забезпечують правильне розміщення тексту і його елементів на друкованій сторінці, виділення заголовків, оформлення таблиць.

Проте, можливостей текстових редакторів виявляється недостатньо для автоматизації процесів, підготовки комплексів технічної документації на ІС.

Існують такі недоліки:

ї. Відсутня можливість автоматичного встановлення зв'язків між вікнами.

2. Відсутній апарат перехресних посилань між фрагментами текстів.

3. Функції з блоками тексту не виконуються автоматично.

4. Текстова база даних являс собою набір незв'язних текстових файлів.

5.Виділення і копіювання блоків тексту вручну - рутинна робота.

6. Неможливо подати документ у вигляді деякого структурованого щаблону.

7. Швидке коригування комплекту докуменації утруднене.

Проведений аналіз показує, що існуючі засоби автоматизації підготовки документації практично вичерпали можливості свого розвитку. Тому необхідний пошук і розвиток нових інформаційних технологій у цьому напрямку.

Так розрізняють чотири послідовні стадії написання тексту:

генерація ідей або думок;

організація (ідей або думок);

переведення думок у слова і речення;

редагування.

Друга стадія дуже важлива - при написанні тексту змістова організація і обробка плану займають близько двох третин усього часу. Розумові процеси, що проходять у голові автора моделюються у термінах семантичної сітки. У вузлах такої сітки знаходяться судження (думки).

У подальшому осмисленні автором своєї задачі сітка зорганізовуеться в ієрархічну структуру.

Дослідження показують, що візуалізація, винесення назовні цих розумових сіткових структур і можливість маніпулювати ними допомагають авторові краще справлятися з другою стадією написання тексту. Причому це дозволяє поєднувати другу та третю стадії.

Потім на чергу стає проблема лінеаризації сітки, формування з неї вузлів змістової послідовності. Це проблема, яка стосується вже не рівня слів, а понять.

Стратегії лінеаризації, перекладені в інструкції для комп'ютера, на сьогодні є не вирішеною науковою проблемою.

Наведена модель процесу підготовки текстової документації ба­зується на поняттях системи, структури, елементів, зв'язків. Але з цього не випливає, що проблема упорядкованого викладу думок і рішень. Необхідно створити систему, здатну допомогти кожному, ко­му треба з досить великої сукупності окремо записаних думок, вислов­лювань, фактів, ілюстрацій утворити послідовність, зрозумілу як ціле.

Існують підходи до рішення даної проблеми у перспективних інформаційних технологіях.

Технологія гіпертексту

Перспективу розвитку будь-якої нової інформаційної технології визначає ЇЇ відповідність загальним тенденціям розвитку. Такою тен­денцією в інформатиці є відмова від жорстких «системних» методів та ієрархічної організації систем даних і знань. Однією з нових техно­логій, що знаходяться на початкових етапах свого розвитку є гіпертекстова технологія. Сформулюємо визначення гіпертексту як основи нової гіпертекстової технології.

Гіпертекст — це спеціальна форма (різновид) елект­ронного документа, в якому:

інформація зберігається у сітковій структурі, кожний вузол якої містить фрагмент документа або будь-який набір елементів даних;

доступ до інформації здійснюється шляхом інтерактивного пере­гляду і вибору зв'язків для переходу до наступних вузлів.

У понятті «гіпертекст» (hурег — над) знаходять відображення наче б то два зміста. По-перше, гіпертекст — деяка одиниця інформації, частинами якої є тексти. По-друге, говорячи про гіпертекст, розуміємо текст, частини якого мають «надзв'язки», тобто з'єднані один з одним безліччю різних відношень, що представлені у багатовимірному про­сторі. (У звичайному тексті окремі його частини з'єднані лінійним відношенням прямування.)

Якщо вузли містять не тільки текстову, а й графічну, звукову, відеоінформацію або комбінації цих видів інформації, то така форма подання Інформації в ЕОМ називається гіпермедіа.

У найзагальнішому вигляді гіпертекст можна визначити як СУБД, що дозволяє користувачеві поєднувати асоціативними зв'язками інформацію, яка відображується на екрані, і здійснювати прямий (не­послідовний) доступ до зв'язаних між собою окремих записів тексту. Вузли у гіпертекстовій базі даних являють собою структурні одиниці тексту (аналогічно електронним карткам у каталозі) на відміну від за­писів у звичайних БД.

У таких системах доступ до інформації здійснюється шляхом інтерактивного перегляду і вибору зв'язків для переходу до наступних вузлів. Тому у гіпертекстових системах важливим компонентом є структурний редактор для інтерактивного зв'язування вузлів, мо­дифікацій або додавання зв'язкін між вузлами.

Зв'язки встановлюються виходячи з вимог зручного та швидкого доступу до інформації. Використовується, як правило, два типи зв'яз­ків - посильні та ієрархічні. З використанням ієрархічних зв'язків вузли організовуються у структури на основі принципу підпорядко­ваності «предок - нащадок». Посильні зв'язки слугують для зв'язу­вання одержаних структур.

Оргнізація доступу до інформації в гіпертекстових системах може бути забезпечена одним з таких трьох способів:

у початкових вузлах гіпертексту розміщується коротка таблиця змісту;

для перегляду інформації приймається спеціальна програма;

проводиться індексація вузлів інформації і пошук здійснюється за вказаними індексами.

Традиційні найпростіші операції, що їх виконує проектувальник, працюючи з базою даних - пошук, перегляд, виведення документів. У гіпертекстовій системі ці операції набувають статусу пізнавальних аналітичних операцій зі смисловим змістом документів. Наступний фрагмент користувач вибирає на основі професіонального аналізу змісту поточного фрагмента. У разі необхідності користувач-проекту­вальник може породжувати нову асоціацію, яка потім приводить до конкретних дій за вибором наступних фрагментів.

1987 року розробники з Університету Північної Кароліни (США) представили систему WЕ (АWгіtіпgЕпvігопmепtfог Ргоfеssіопаls).

В основу моделі системи WЕ покладено таку ідею: читання і пись­мо розглядаються як симетричні в цілому процеси, які у своїх стадіях змінюють їх за взаємопротилежною черговістю.

Виходячи з цього на екрані системи користувачеві пропонується два головних вікна, а саме:

візуалізація мережі (сітки) для підтримки ранньої стадії створен­ня тексту ("мозкового штурму");

вікна ієрархій для подальшої концептуальної організації.

У третьому вікні користувач може редагувати текстові начерки у вузлах сітки.

Зберігання, змінювання і пошук вузлів і зв'язків сітки здійсню­ються у реляційній базі даних. Для запитів до реляційноЇ БД виді­ляється четверте вікно.

Система WЕ орієнтована на створення науково-технічних текстів.

Лабораторією «Сіменс» (Відень) розроблена система Нуреr Аuthог. В основу системи покладено підтримку трьох фаз авторського процесу:

ІДЕЇ,

ПЛАН,

ТЕКСТ.

У першій фазі система забезпечує збирання ідей, які коротко за­писуються у вузлах. Змістові асоціації ідей фіксуються у вигляді гіпертекстових зв'язків, тобто будується неформальна база знань.

Далі система дозволяє надати одержаній сітці ієрархічну органі­зацію. Для цього структура проблемної сфери упорядковується від «за­гального до окремого» (таксономією). Таксономія зберігається у ма­шині і розглядається як засіб навігації створеної сітки.

У другій фазі документ проходить більш конкретне планування, яке не обов'язково повторює базову таксономію. При цьому сукупність ідей, що утворюють «базу знань»» перетворюється на лінійний ланцю­жок блоків, які підлягають заповненню текстом.

У третій фазі відбувається заповнення блоків текстом.

Система Нурег Аuthог побудована як додаток до комерційної гіпер-текстової системи НурегShell.

Зростаючі вимоги проектувальників, конструкторів, аналітиків до можливостей автоматизованих систем підготовки документації вже нині виходять за межі можливостей суто гіпертекстових систем. Так, перелік вимог до систем автоматизованого проектування може вклю­чати такі положення:

зберігання текстових і географічних документів;

можливість додавання sвиключення документів;

автоматичне виділення ключових слів у тексті;

пошук документів за ключовими словами і за змістом документа;

перехід від текстового або графічного документа до зв'язаних з ним інших документів;

зв'язок документів з цифровими даними, побудова діаграм графіч­них документів.

ГІпертекстова система забезпечує легкість переходу від одного до­кумента до іншого. Але залишається ряд невирішених питань:

вручну роблять посилання у документах (відсутнє автоматичне індексування);

засоби пошуку дозволяють знаходити тільки такі слова і словоспо­лучення, які точно збігаються;

прив'язка до баз даних відсутня.

Для реалізації зазначених вимог sусунення недоліків в існуючих системах роботи з документами за рубежем стали створювати системи нового класу — системи «text management systems» ("системи уп­равління документацією"), в яких поєдналися різноманітні методи зберігання та обробки інформації.

У загальному випадку системи управління документацією забез­печують таке:

звичайний логічний пошук інформації за ключовими словами;

деякі системи дозволяють проводити пошук за зразком, який містить, крім букв, спеціальні символи (wilcards), наприклад «?» або «*»;

найбільш розвинені системи забезпечують пошук не лише задано­го слова, але і його синонімів або зв'язаних з ним за змістом слів;

групи слів і синонімів знаходяться у словниках системи;

під час пошуку слів усі системи використовують індекс. Індекси можуть вказувати лише ім'я документа або файла, який його утримує, або зберігати також місцезнаходження слова у тексті;

користувач може вказувати, які слова не слід включати в індекс.

Системи управління документацією знаходять все ширше застосу­вання. Про це свідчить, наприклад, той факт, що 1992 року в США на персональних комп'ютерах працювало від 80 до 100 тисяч таких систем.