logo
Informatics

11.3.4. Язык гипертекстовой разметки web-документов html

Программа World Wide Web инициирует каналы передачи связной информации по всему земному шару. Язык HTML предоставляет простой формат для предоставления этой информации. Требуется, чтобы все программы, совместимые с WWW, могли поддерживать язык HTML. Программа WWW использует протокол Internet протокол передачи гипертекста -HTTP), который позволяет передавать кодированную информацию между клиентом и сервером.

Гипертекст и гипермедиа являются для Web фундаментальными технологиями. Гипертекст - это легкая в использовании, однако чрезвычайно мощная система связанных слов и фраз, позволяющая осуществлять навигацию между страницами. Эти слова представляют собой перекрестные ссылки на другие слова на других страницах и обычно выделяются на странице Web более ярким цветом.

Гипермедиа - это среда, основанная на внутренних взаимосвязях. Если немного развить концепцию гипертекста, включив в нее фотографии, видео и звук, получим то, что известно как гипермедиа.

Обычно они присутствуют в каждой странице Web и понятны кач1 дому броузеру Web. Без гипертекста и гипермедиа не было бы World Wide Web.

Язык разметки гипертекста, более известный как HTML, играет роль клея, связывающего Web в единое целое. Каждая страница в Web создана с использованием HTML, поскольку данный язык предоставляет возможности для работы с гипертекстом и гипермедиа. И хотя HTML действительно является языком, это не тот язык, который ассоциируется с компьютерами и разработкой программного обеспечения.

Язык разметки гипертекста формулируется в терминах языка стандартной обобщенной разметки (Standard Generalized Markup Language - SGML). Язык SGML представляет собой метод создания структурированных документов, а также языков для их разметки.

Этот язык можно считать противоположностью настоящим языкам программирования, таким, как С, Pascal. Он прост в изучении и использовании; это не столько язык, сколько метод представления документов.

SGML- это глобальный стандарт для описания языков разметки гипертекста (таких, как HTML). Документы SGML являются программно- и аппаратно-независимыми, они не привязаны к какой-либо конкретной программе, компьютеру или устройству вывода. SGML был одобрен ISO (International Standard Organization - Международная организация стандартов) в 1986 г. и является стандартом для многих коммерческих и государственных систем создания документов.

В языке SGML каждый документ имеет три части: Декларации языка SGML, привязывающие к определенным значениям параметры обработки, а также имена синтаксиса. Например, декларация SGML в описании типа документа HTML объявляет, что строка, с которой начинается метка, -это </, а максимальная длина имени составляет 40 символов.

Пролог, состоящий из одной или нескольких деклараций о типе документа. Они определяют типы элементов, взаимосвязи между элементами и их атрибуты, а также условные обозначения, которые могут быть задействованы при разметке. Декларация HTML DTD, например, указывает, что элемент HEAD содержит, по крайней мере, один элемент TITLE.

Данные состоят из разметки документа и собственно информации. Термин HTML используется для обозначения как типа документа, так и языка разметки для кодировки документов данного типа.

Документ HTML - это обычный текстовый файл, а окончательный вид документа зависит от магических последовательностей символов, вправленных в <настоящий> текст. Подготовка документа в HTML больше похожа на составление программы, чем на работу в

настольной издательской системе, поскольку она представляет собой бесконечный цикл переделок исходного HTML-текста в текстовом редакторе, загрузки файла в программу просмотра Web для проверки, как файл выглядит и печатается, определения, в чем состоят проблемы, и возврата в текстовый редактор для внесения исправлений.

Язык разметки гипертекста можно использовать для представления:

Язык разметки гипертекста определяет формальный набор правил и процедур для электронной интерпретации и представления подготовительного текста. За основу модели разметки документов в HTML принята таговая модель.

Таговая модель описывает документ как совокупность контейнеров, каждый из которых начинается и заканчивается тагами. Т.е. документ HTML представляет собой не что иное,, как обычный ASCII файл с добавленными в него управляющими HTML-кодами (тагами).

Структура HTML-документа и контейнеров языка дает специальные возможности поисковым машинам WWW для наиболее эффективно10 поиска информации.

Таги, ограничивающие контейнер, определяют область действия правил интерпретации текстовых элементов документа. Типичным примером такого рода является таг стиля Italic, который определяет область отображения курсива. Команды форматирования языка HTML, называемые управляющими кодами (tag), представляют собой просто зарезервированные последовательности символов, начинающиеся с < (знака меньше) и заканчивающиеся > (знаком больше). Управляющие коды HTML нечувствительны к регистру в отличие от escape-последовательностей специальных символов HTML (к которым мы вернемся позже). В большинстве случаев управляющие коды используются симметричными парами, при этом завершающий код отличается от открывающего символом / (знак дроби). Например, если у нас есть гипотетический атрибут форматирования текста, управляемый кодом <Х>, и мы хотим применить его к словам .<Это мой текст>, HTML-последовательность кодов и собственно текста будет выглядеть так:

<Х>Это мой текст</Х>

В настоящее время в World Wide Web сосуществуют три различных версии или уровня HTML. Версии 0.9 или 1.0 (с ними совместима программа просмотра Mosaic, версия 1.0.3) в основном сосредоточиваются на управлении заголовками, списками и форматировании символов. Команды HTML легки в освоении и использовании.

В заключение сделаем несколько замечаний о перспективах развития языка гипертекстовой разметки. Так, если его первая версия (HTML 1.0) была направлена на представление языка как такового, где описание его возможностей носило скорее рекомендательный характер, вторая версия ( HTML 2.0) фиксировала практику использования конструкций языка, версия ++ (HTML++) представляла новые возможности, расширяя набор тагов HTML в сторону отображения научной информации и таблиц, а также улучшения стиля компоновки изображений и текста, то версия 3.2 призвана упорядочить все нововведения и согласовать их с существующей практикой. Кроме этого, в версии 3.2 снова делается попытка формализации интерфейса пользователя гипертекстовой распределенной системы.

Сейчас World Wide Web Consortium (W3C) уже опубликовал рабочие материалы спецификации HTML 4.0, где реализованы дополнительные средства работы с мультимедиа и ряд полезных упрощений.