logo search
Лекція 2

Правильні екзмпляри xml

У XML, разом з концепцією «добре оформленого документа», розглядається концепція «дійсного або валідного документа XML».

Правильний документ гарантує цілісність структури даних. Завдяки цьому значно спрощується доставка і обмін даними, які коректуються параметрами XSLT.

Для визначення правильності документа необхідно:

  1. Визначити використання тільки заданого набору дескрипторів.

  2. Перевірити, щоб порядок проходження елементів і їх атрибутів повністю відповідав змісту документа або певним правилам.

Іншими словами, в XML-документі має бути правильно реалізована схема документа, що визначає його структуру.

Як правильно визначити структуру. Повернемося, наприклад, до створення XML документа для інструкції по миттю машини. Документ XML добре оформлений, але з погляду правильності він надлишковий (на кожну складову відводиться два елементи). Логічно було б використовувати один елемент з атрибутом

<items quantity= “.”>.

А XML-код виглядатиме так:

<?xml version= “1.0” encoding= “windows-1251”>

<!--Це XML код інструкції-->

<directions>

<title>Інструкція, як помити машину</title>

<ingredients>

<items quantity= “50 л”>Вода</items>

<items quantity= “0,5 л”>Шампунь</items>

<items quantity= “0,3 л”>Віск</items>

</ingredients>

<instrument>

<items quantity= “1 шт.”>Відро</items>

<items quantity= “1 шт.” >Мочалка </items>

<items quantity= “2 шт.” >Лоскут для полірування</items>

</instrument>

<actions> Машину обполоснути водою, потім нанести піну і залишити на 5 хвилин. Піну змити. Нанести на поверхню кузова віск, витерти корпус машини

</actions>

</directions>.

Рисунок 5 – Приклад документа

  1. Контроль типів даних.

Контроль типів даних досягається завдяки використанню відповідної схеми.

Дані XML документа, які використовуються при обміні, повинні використовувати один формат, для запобігання плутанини.

Наприклад, дата може бути оформлена в одному з таких форматів:

mmddyy yyddmm

ddmmyy yymmdd.

Існує декілька підходів до контролю типів даних. Пізніше розглянемо технології XDR і DTD.

До наступних типів даних може буде потрібна перевірка правильності. Необхідність перевірки залежить від того, обмін якою інформацією здійснюється.

Тип даних

Опис

Boolean

Логічний тип, значення ІСТИНА / БРЕХНЯ

Char

Один символ

String

Рядок символів

Float

Дійсні числа

Int

Цілі числа

Date

Дата у форматі YYYY-DD-MM

Time

Час у форматі HH-MM-SS

Id

Текст, унікальним чином ідентифікуючий елемент

Idref

Посилання на ідентифікатор

Enumeration

Послідовність значень, з якої можна вибрати будь-яке значення.

  1. Здійснити контроль цілісності даних для забезпечення оптимального обміну інформацією через Web за допомогою транзакцій.

Якщо мова йде про перевірку правильності оформлення документа, то мова йде не про представлення даних, а про структуру даних.

У ЧОМУ ПОЛЯГАЄ ВІДМІННІСТЬ СТРУКТУРИ ДОКУМЕНТА ВІД СТРУКТУРИ ДАНИХ?

Структура документа дозволяє читачеві швидко зрозуміти, в якому саме вигляді подав інформацію автор документа.

Структури даних вказують шлях комп’ютерного застосування даних, які містяться в різних контейнерах цілого документа. У структурі даних не міститься визначення важливості одного компонента документа по відношенню до іншого. Всі компоненти рівні.

Парсер – це програма (у специфікації консорціуму W3C називається обробником XML), яка інтерпретує символ за символом. Існує два типи парсерів: