Правильні екзмпляри xml
У XML, разом з концепцією «добре оформленого документа», розглядається концепція «дійсного або валідного документа XML».
Правильний документ гарантує цілісність структури даних. Завдяки цьому значно спрощується доставка і обмін даними, які коректуються параметрами XSLT.
Для визначення правильності документа необхідно:
Визначити використання тільки заданого набору дескрипторів.
Перевірити, щоб порядок проходження елементів і їх атрибутів повністю відповідав змісту документа або певним правилам.
Іншими словами, в XML-документі має бути правильно реалізована схема документа, що визначає його структуру.
Як правильно визначити структуру. Повернемося, наприклад, до створення XML документа для інструкції по миттю машини. Документ XML добре оформлений, але з погляду правильності він надлишковий (на кожну складову відводиться два елементи). Логічно було б використовувати один елемент з атрибутом
<items quantity= “.”>.
А XML-код виглядатиме так:
<?xml version= “1.0” encoding= “windows-1251”>
<!--Це XML код інструкції-->
<directions>
<title>Інструкція, як помити машину</title>
<ingredients>
<items quantity= “50 л”>Вода</items>
<items quantity= “0,5 л”>Шампунь</items>
<items quantity= “0,3 л”>Віск</items>
</ingredients>
<instrument>
<items quantity= “1 шт.”>Відро</items>
<items quantity= “1 шт.” >Мочалка </items>
<items quantity= “2 шт.” >Лоскут для полірування</items>
</instrument>
<actions> Машину обполоснути водою, потім нанести піну і залишити на 5 хвилин. Піну змити. Нанести на поверхню кузова віск, витерти корпус машини
</actions>
</directions>.
Рисунок 5 – Приклад документа
Контроль типів даних.
Контроль типів даних досягається завдяки використанню відповідної схеми.
Дані XML документа, які використовуються при обміні, повинні використовувати один формат, для запобігання плутанини.
Наприклад, дата може бути оформлена в одному з таких форматів:
mmddyy yyddmm
ddmmyy yymmdd.
Існує декілька підходів до контролю типів даних. Пізніше розглянемо технології XDR і DTD.
До наступних типів даних може буде потрібна перевірка правильності. Необхідність перевірки залежить від того, обмін якою інформацією здійснюється.
Тип даних
| Опис
|
Boolean | Логічний тип, значення ІСТИНА / БРЕХНЯ |
Char | Один символ |
String | Рядок символів |
Float | Дійсні числа |
Int | Цілі числа |
Date | Дата у форматі YYYY-DD-MM |
Time | Час у форматі HH-MM-SS |
Id | Текст, унікальним чином ідентифікуючий елемент |
Idref | Посилання на ідентифікатор |
Enumeration
| Послідовність значень, з якої можна вибрати будь-яке значення.
|
Здійснити контроль цілісності даних для забезпечення оптимального обміну інформацією через Web за допомогою транзакцій.
Якщо мова йде про перевірку правильності оформлення документа, то мова йде не про представлення даних, а про структуру даних.
У ЧОМУ ПОЛЯГАЄ ВІДМІННІСТЬ СТРУКТУРИ ДОКУМЕНТА ВІД СТРУКТУРИ ДАНИХ?
Структура документа дозволяє читачеві швидко зрозуміти, в якому саме вигляді подав інформацію автор документа.
Структури даних вказують шлях комп’ютерного застосування даних, які містяться в різних контейнерах цілого документа. У структурі даних не міститься визначення важливості одного компонента документа по відношенню до іншого. Всі компоненти рівні.
Парсер – це програма (у специфікації консорціуму W3C називається обробником XML), яка інтерпретує символ за символом. Існує два типи парсерів:
перевіряють форматування документів, тобто їх відповідність синтаксичним правилам;
спочатку перевіряють форматування документа, а потім їх відповідність всім обмеженням, вказаним у пов'язаних з ним документах.
- Хід лекції вступ
- Xml пропонує метод структуризації файлу у вигляді текстового файлу
- 1 Питання. Створення xml-даних
- Розміщення атрибутів у екземплярі xml
- Порожні елементи
- Сім’я xml-технологій
- Xml нова мова, але у неї глибоке коріння
- Створення і перегляд xml-документа
- 2 Питання. Основні конструкції, синтаксис та семантика мови розмітки xml
- Правильне вкладення елементів
- Визначення імен у xml
- Декларації xml
- Правильні екзмпляри xml
- Визначення типу документа
- Простий елемент із текстовим вмістом