logo
metoda / Metod_sam_IT_ta_tehnol_Internet_2010_ukr

4.3 Xml (extensible markup language)

4.3.1 Вступ

XML є технологією для створення мов розмітки, що описують у структурованій формі дані фактично будь-якого типу. На відміну від HTML, у якому автор документа обмежений певним набором тегів, XML дає можливість авторам документів точніше описувати дані шляхом створення нових тегів. XML може використовуватися для створення спеціалізованих мов розмітки, що описують дані практично в будь-якій сфері діяльності.

4.3.2 Синтаксис XML-документа

Синтаксис мови XML визначений жорстко й не допускає багатозначності тлумачення своїх правил. Відхилення від цих правил спричиняє відмову процесора обробляти весь документ.

Правила побудови XML-документа:

–структура XML-документа обов'язково починається з оголошення, наприклад, <?xml version = “1.0”?> ;

– кожний тег, що відкривається, має тег, що закривається;

XML чутливий до регістра;

– важливий порядок тегів (необхідно дотримуватися вкладеності);

– XML-документ має містити єдиний кореневий елемент;

– в XML у тегів можуть бути атрибути, їхні значення мають бути в лапках ''... '' або '...';

– пробіли в XML не ігноруються.

Приклад простого XML-документа, що містить повідомлення Ласкаво просимо в XSLT!

<?xml version = “1.0” ?>

<myMessage>

<message> Ласкаво просимо в XSLT! message>

</myMessage>

Його відображення в браузері Internet Explorer на наведено рис. 4.2.

4.3.3 Поняття елемента XML-документа

В елемент включається все, що міститься між відкриваючим та закриваючим тегом, включаючи й теги. Елемент вміщує: дочірні елементи, звичайний текст, змішаний вміст, порожній вміст. Тег – це ім'я елемента.

Рисунок 4.2 – XML-документ, відображений в Internet Explorer

4.3.4 Правило побудови елементів

Ім'я елемента може містити літери, цифри й інші символи. Ім'я не може починатися із цифр та зі знаків пунктуації, не може містити пробіли. Необхідно уникати використання ':' в іменах, тому що вона використовується під час включення в імена простору імен.

Побудова атрибутів:

– значення атрибутів мають бути у лапках;

– атрибут не може мати множинне значення й не може подаватися у вигляді деревоподібної структури.

Атрибути формалізуються в DTD-описі та XML-схемах (XML-схеми вивчаються в рамках аудиторних занять). Рекомендується включати в атрибути інформацію, яку не передбачається надалі трансформувати в дані.

4.3.5 Секція CDATA

Все, що розташовано всередині секції CDATA, ігнорується аналітичним аналізатором. Синтаксис секції: <![CDATA [.....]]>.

4.3.6 Символи в XML-документі

У XML-документі може використовуватися практично будь-який символ, однак символи амперсанда (&), лівої кутової дужки (<), правої кутової дужки (>), апострофа (') і лапок (") зарезервовані в XML і не можуть застосовуватися в символьних даних. Щоб використовувати ці символи у вмісті елемента або атрибута, необхідно використовувати посилання на сутність, що починається зі знака амперсанда (&) і закінчується крапкою з комою (;). Використання посилань на сутності запобігає помилковій інтерпретації XML-процесором як символьних даних, так і XML-розмітки.

XML надає внутрішні сутності для амперсанда (&), лівої кутової дужки (<), правої кутової дужки (>), апострофа (') і лапок (").