logo
Архив ZIP - WinRAR / Тема 2

2.2.1. Введение в язык html.

Для создания web-страниц используется язык разметки HTML. Он представляет собой набор команд определяющих, в каком виде информация будет отображаться в окне браузера. Команды состоят из заключённых в угловые скобки (<>) тэгов (дескрипторы) и их атрибутов. Почти все дескрипторы языка HTML парные и состоят из открывающего (<>) и закрывающего (</>) тэгов, между которыми располагается содержимое тэга. Тэги подразделяются на структурные, которые организуют текст и на форматирующие, которые задают его стиль. Конструкцию тэга можно представить таким образом: <tag atribut="value">Другие теги и (или) текст внутри этого тега</tag>, где:

Контейнер – состоит из открывающего и закрывающего дескрипторов. Контейнеры предназначены для хранения некоторой информации, например текста или других HTML-дескрипторов. Элемент HTML-документа – это контейнер вместе с его содержимым. Язык HTML не чувствителен к регистру букв, поэтому все дескрипторы можно задавать как прописными, так и строчными буквами.

Технология HTML состоит в том, что в обычный текстовый документ вставляются управляющие символы (тэги), сохраняют его с расширением htm или html и в результате получается web-страница. Браузер при загрузке Web-страницы представляет её на экране в том виде, который задаётся тэгами. Основными достоинствами HTML-документов являются малый информационный объем и возможность просмотра на компьютерах, оснащенных различными операционными системами.

При форматировании текста с помощью языка HTML выделяется два аспекта.

Отображение HTML-документа браузером имеет ряд особенностей. Текст выводится в окно браузера слово за словом; при достижении правой границы окна очередное слово переносится на новую строку. Таким образом, по умолчанию (если не использованы специальные элементы форматирования), горизонтальной полосы прокрутки не появляется. Вертикальная полоса прокрутки появляется, как обычно, если содержимое документа не умещается в видимой части окна. Все последовательно идущие пробелы, символы табуляции, символы перевода строки отображаются браузером как один пробел. Т.е. без применения форматирования текст будет выведен единым блоком, в котором слова отделены друг от друга одним пробелом.

Так как web-страница должна быть одинаково интерпретирован браузерами различных компьютерных платформ, то стандартом оформления имени файла будет набор самых жестких правил всех платформ. Поэтому желательно, что бы имена файлов web-страниц соответствовали следующим требованиям.

HTML-документы могут иметь различную кодировку.

Кодировка представляет собой таблицу символов, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен свой уникальный номер - код символа, занимающий 1 байт. Стандартизирована только половина таблицы ascii-код - от 0 до кода 127 все символьные таблицы одинаковы (в них знаки препинания и латинский алфавит, область от 128 до 255 отведена под национальные алфавиты), а кириллица в разных кодовых таблицах имеет разное положение. В Интернете существуют 6 основных типа кодовых таблиц для русской кириллицы.

При создании html-документа в любом редакторе его кодировка будет такая же, какую и использует этот редактор. В последствии готовые документы можно преобразовать в любой формат при помощи специальных программ-перекодировщиков.

При работе в Интернете с html-документами для нормального отображения символов той или иной кодировки, и web-сервер, и браузер должны обменяться соответствующей служебной информацией. Для этого протокол HTTP, при помощи поля Accept-Charset, позволяет браузеру послать сообщение на сервер о том, какие кодировки в нем доступны и в каком порядке очередности. При этом сервер может выбрать из вариантов документ, исполненный в требуемой кодировке, сообщить браузеру информацию о том, в какой кодировке будет прислана страница, или автоматически перекодировать ее и переслать браузеру. Если всё сделано корректно, то проблем не возникает, в противном случае пользователь может увидеть не читаемый текст.

Перекодировать web-страницу при просмотре можно, используя возможности браузера. В программе Internet Explorer это команда Вид→Кодировка.

Имеется способ указать кодировку web-страницы не на сервере, а непосредственно в html-коде. Для этого используется специальная версия meta-тега с параметром charset, задающим нужную кодировку. При этом необходимо помнить, что данный тэг имеет приоритет и над установками браузера и над установками, присылаемыми web-сервером.

Данные кодировки не содержат все символы из набора символов документа. Для того, что вставить такой символ в web-страницу необходимо использовать ссылки на символы SGML. Такие ссылки на символы могут быть числовыми и принимать две формы:

Некоторые из таких символов имеют символические имена, и ссылка на них имеет синтаксис "&name; , где name – символическое имя. При таких ссылках на символы учитывается регистр.

Примеры некоторых ссылок на символы.

Основные тэги языка HTML представлены в приложении 1.