logo
Моделирование систем / Моделирование систем / Теория / Dop / АИС_Конспект

3.7. Гипертекстовые информационные системы

В связи с широким распространением сети Интернет и сетей Интранет становится актуальным разработка универсальных механизмов обмена данными между различными информационными системами сети.

В качестве основы такой технологии используется XML (eXtensible Markup Language) стандарт. Язык XML представляет собой стандарт на разработку гипертекстовых документов и определяет правила передачи этих документов между приложениями сети. Технология XML это так же протокол хранения и передачи информации.

Документ XML представляет собой разметку, которая состоит из следующих частей: пролога и основной части.

В прологе хранятся общие сведения о документе для процессора XML. Данные сведения оформляются в виде директивы. Например, директива задающая версию XML и кодовую таблицу документа имеет вид:

<?xml version=”1.0” encoding=”type”?>

type – тип кодировки. Для использования кириллицы могут применяться кодировки:

windows – 1251 и ISO – 8859 – 5.

За прологом документа следует его основная часть, в которой хранится разметка информации. Разметка – выделение структурных составляющих документа. Информационные единицы выделяются с помощью тегов. Теги бывают двух основных видов.

Парные:

<name>информация</name>

Не парные:

<name/>

name – наименование тега. Наименование тегов выбираются разработчиком по смыслу документа и должны писаться латинскими буквами. Названия тегов регистрозависимые.

При формировании разметки необходимо получить «корректно форматированный документ». Такой документ должен отвечать следующим основным требованиям:

Корректные документы могут так же содержать ссылки на символьные сущности. Такие ссылки могут быть именованные (см. таблицу 3.4), либо хранят код символа в кодировке Unicode (Unicode Consortium, Unicode Inc).

Таблица 3.4. Именованные ссылки.

Ссылка

Символ

&amp;

&

&apos;

&gt;

>

&lt;

<

&quot;

Примеры ссылок на символ по его коду:

© (авторское право )

® (торговая марка )

— (длинное тире )

В корректном документе могут находится так же комментарии, которые оформляются в виде:

<!-- Текст комментария -->

Так как наименования тегов регистрозависимые, то парные теги должны быть замкнуты, пересечение тегов не допускается.

Правильное вложение тегов:

<A><B>Строка текста<B/></A>

Неверное вложение тегов:

<A><B>Строка текста</A><B/>

Хранятся XML документы в текстовых файлах с расширением xml.

Пример корректного структурированного XML документа:

<?xml version="1.0" encoding="windows-1251"?>

<DOC>

<line1>

<italic>Акционерное общество </italic>

<text>АО Пульсар:</text>

</line1>

<line2><italic>Поставка </italic><text>

серверов, рабочих станций.</text>

</line2>

<skip/>

<line3><bold>Проектирование и развертывание компьютерных сетей</bold></line3>

</DOC>

В документе содержится справочная информация об акционерном обществе. Корректные документы могут использоваться при создании документальных информационных систем.

При создании фактографических информационных систем используются структурированные XML документы. Такие документы состоят из блоков данных одинаковой структуры, которые можно трактовать как записи. Отличие заключается только в информационном содержании блока.

Пример структурированного документа:

<?xml version="1.0" encoding="windows-1251"?>

<firma>

<worker>

<id>100</id>

<name>Иcлентьева И.А</name>

<otdel>Бухгалтерия</otdel>

<pay>12000</pay>

</worker>

<worker>

<id>200</id>

<name>Перова А.И.</name>

<otdel>Бухгалтерия</otdel>

<pay>10000</pay>

</worker>

<worker>

<id>300</id>

<name>Иванов И.И.</name>

<otdel>Склад</otdel>

<pay>15000</pay>

</worker>

</firma>

В документе хранится информация о трех служащих организации в блоках данных worker. Фиксируется о служащем фирмы: табельный номер, фамилия, наименование отдела, ставка.

Для работы с XML документами используют различные технологии. Ниже перечислены технологии доступа, которые в настоящее время получили наиболее широкое распространение:

написанных на языке программирования JavaScript.

В данном курсе рассматриваются технология каскадных стилевых таблиц. С помощью данной технологии выполняется преобразование XML документов хранящихся в документальных информационных системах. При этом XML документ – разметка соответствующего документа. Каскадная стилевая таблица служит для получения требуемого вида документа при его просмотре.

Использование каскадной стилевой таблицы требует выполнения следующих шагов:

<?xml-stylesheet type="text/css" href="file.css"?>.

Файл CSS представляет собой набор правил преставления информации, связанной с тегом XML. В общем виде правило имеет следующую структуру:

Тег|Теги {параметр1: значение;

параметр2: значение;

....

}

Где Тег (Теги) – тег их XML документа, параметр – стилевой параметр, используемый для оформления информации, связанной с тегом, значение – значение параметра.

Некоторые стилевые параметры приведены в приложении 1. При их использовании нужно учитывать ряд особенностей.

Создание стилевых таблиц требует учета нотации параметров и их значений, так как они регистрозавимые.

При выводе изображения в документе, нужно использовать пустой тег. Изображение – фон этого узла. Нужно обязательно задать размер изображения, запретить его повтор в области узла, указать тип выравнивания фонового­ рисунка.

Размещение документа в документальной системе может потребовать создания его описания. При использовании технологии XML это можно решить с помощью DTD (Data Type Definition) таблицы.

Таблица DTD описывает структуру документа. Задается таблица в прологе документа. В виде:

<!DOCTYPE name

[

Описание элементов

]>

name – имя корневого узла.

Описание элементов–тегов задается с помощью объявления:

<!ELEMENT Имя_тега описание_содержимого>

Описание содержимого:

EMPTY – пустой элемент;

ANY – любое содержимое;

(#PCDATA) – символьное содержание.

В качестве описи содержимого могут указываться вложенные элементы:

Имя_тега(вложенные_элементы).

Где Имя_тега – наименование XML тега.

При описании вложенных структур действуют следующие правила:

  1. Перечисление через запятую – обязательный перечень элементов в документе. Это последовательная форма.

  2. Использования символа | – выборочная форма. Обязательно наличие одного из тегов.

Документ XML, который отвечает структуре DTD называется валидным. Пример валидного документа:

<?xml version="1.0" encoding="windows-1251"?>

<?xml-stylesheet type="text/css" href="text.css"?>

<!DOCTYPE DOC[

<!ELEMENT DOC (line1,line2,skip,line3)>

<!ELEMENT line1 (italic,text)>

<!ELEMENT line2 (italic,text)>

<!ELEMENT line3 (bold)>

<!ELEMENT text (#PCDATA)>

<!ELEMENT italic (#PCDATA)>

<!ELEMENT bold (#PCDATA)>

<!ELEMENT skip EMPTY>

]>

<DOC>

<line1>

<italic>Акционерное общество </italic><text>АО Пульсар:</text>

</line1>

<line2><italic>Поставка </italic><text>серверов, рабочих станций.</text></line2>

<skip/>

<line3><bold>Проектирование и развертывание компьютерных сетей</bold></line3>

</DOC>

Правила CSS находятся в файле text.css содержание, которого приводится ниже, действие правил показано на рисунке 3.7.

Рис.3.7. Действие правил. Браузер Microsoft Internet Explorer.

Файл с правилами CSS:

line1,line2,line3,skip{display:block;}

skip{padding:3px;}

italic{font-style:italic;}

bold{font-weight:bold;}

Для уточнения содержания используются символы, указываемые рядом с элементами, которые сведены в таблицу 3.5.

Таблица 3.5. Символы вложения.

Символ

Значение

?

Ни одного или один из вложенных элементов

+

Один или несколько из вложенных элементов

*

Ни одного или несколько из вложенных элементов

Пример:

<?xml version="1.0" encoding="windows-1251"?>

<?xml-stylesheet type="text/css" href="text2.css"?>

<!DOCTYPE DOC[

<!ELEMENT DOC (header,line+,grline,info)>

<!ELEMENT line (#PCDATA)>

<!ELEMENT header (#PCDATA)>

<!ELEMENT info (#PCDATA)>

<!ELEMENT grline EMPTY>

]>

<DOC>

<header>Акционерное общество</header>

<line>Поставка серверов, рабочих станций.</line>

<line>Проектирование и развертывание компьютерных сетей.</line>

<grline/>

<info>© Education XML</info>

</DOC>

Рис. 3.8. Действие правил. Браузер Microsoft Internet Explorer.

Правила CSS размещены в файле text2.css, и имеют вид:

line,header,grline,info{display:block;}

header{font-weight:bold;}

grline{background-image:url(pulser.gif);

background-position:center;

background-repeat:no-repeat;

width:500px;

height:5px;

}

Действие правил показано на рисунке 3.8.