2.2.1. Введение в язык html.
Для создания web-страниц используется язык разметки HTML. Он представляет собой набор команд определяющих, в каком виде информация будет отображаться в окне браузера. Команды состоят из заключённых в угловые скобки (<>) тэгов (дескрипторы) и их атрибутов. Почти все дескрипторы языка HTML парные и состоят из открывающего (<>) и закрывающего (</>) тэгов, между которыми располагается содержимое тэга. Тэги подразделяются на структурные, которые организуют текст и на форматирующие, которые задают его стиль. Конструкцию тэга можно представить таким образом: <tag atribut="value">Другие теги и (или) текст внутри этого тега</tag>, где:
< - символ начала описания;
tag - название тега из определенного списка воспринимаемых браузером тэгов. Если браузеру не известно название тега, то он проигнорирует его и на разметку станицы он не повлияет. Название тега может состоять только из одного слова, так как после пробела начинается область атрибутов;
atribut= - атрибут определяющий дополнительные условия. Совсем необязательно, что он есть в каждом описании. В некоторых его нет вообще, а в некоторых их несколько, разделенных пробелами;
value - значение параметра. Если оно состоит из одного слова или символа, то кавычки ставить необязательно. Кавычки могут быть заменены прямым апострофом ';
> - символ конца описания
/tag - конец тега с соответствующим названием.
Контейнер – состоит из открывающего и закрывающего дескрипторов. Контейнеры предназначены для хранения некоторой информации, например текста или других HTML-дескрипторов. Элемент HTML-документа – это контейнер вместе с его содержимым. Язык HTML не чувствителен к регистру букв, поэтому все дескрипторы можно задавать как прописными, так и строчными буквами.
Технология HTML состоит в том, что в обычный текстовый документ вставляются управляющие символы (тэги), сохраняют его с расширением htm или html и в результате получается web-страница. Браузер при загрузке Web-страницы представляет её на экране в том виде, который задаётся тэгами. Основными достоинствами HTML-документов являются малый информационный объем и возможность просмотра на компьютерах, оснащенных различными операционными системами.
При форматировании текста с помощью языка HTML выделяется два аспекта.
Формирование структуры (особенно актуально для достаточного объемного текста). К структурным элементам относятся заголовки, абзацы, разделы и т.д.
Задание отдельным структурным блокам текста (и даже отдельным объектам) параметров внешнего отображения: различное горизонтальное выравнивание абзацев, вывод фрагментов текста шрифтом особой гарнитуры, цвета, размера и т.д.
Отображение HTML-документа браузером имеет ряд особенностей. Текст выводится в окно браузера слово за словом; при достижении правой границы окна очередное слово переносится на новую строку. Таким образом, по умолчанию (если не использованы специальные элементы форматирования), горизонтальной полосы прокрутки не появляется. Вертикальная полоса прокрутки появляется, как обычно, если содержимое документа не умещается в видимой части окна. Все последовательно идущие пробелы, символы табуляции, символы перевода строки отображаются браузером как один пробел. Т.е. без применения форматирования текст будет выведен единым блоком, в котором слова отделены друг от друга одним пробелом.
Так как web-страница должна быть одинаково интерпретирован браузерами различных компьютерных платформ, то стандартом оформления имени файла будет набор самых жестких правил всех платформ. Поэтому желательно, что бы имена файлов web-страниц соответствовали следующим требованиям.
В имени файла разрешено использовать следующий набор символов: a-z, A-Z, _, ,-, 0-9.
Длинна имени файла должна быть не более 8 символов.
Расширение файла "htm".
HTML-документы могут иметь различную кодировку.
Кодировка представляет собой таблицу символов, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен свой уникальный номер - код символа, занимающий 1 байт. Стандартизирована только половина таблицы ascii-код - от 0 до кода 127 все символьные таблицы одинаковы (в них знаки препинания и латинский алфавит, область от 128 до 255 отведена под национальные алфавиты), а кириллица в разных кодовых таблицах имеет разное положение. В Интернете существуют 6 основных типа кодовых таблиц для русской кириллицы.
KOI (koi8-r) - специальная кодовая таблица, разработанная для Интернета. Она используется довольно широко, но работать с ней в Windows можно только в HTML-редакторах, умеющих работать с различными кодировками. Эту кодировку разработали когда адаптировали к русскому языку систему unix. Это было ещё в 70-х годах - до появления персональных компьютеров. И до сих пор в unix она считается основной кодировкой.
DOS - использует кодовую таблицу DOS ASCII. В настоящее время почти не используется, как и сама DOS в чистом виде. Была разработана Microsoft для IBM-совместимых персональных компьютеров.
Windows (win-cp1251) - использует кодовую таблицу Windows ANSI. В настоящее время наиболее распространена в Интернете. Появилась вместе с первой успешной версией Windows 3.0-3.11.
Mac (Macintosh) – кодировка для macintosh-компьютеров.
ISO - многоязыковая кодовая таблица. Широкого распространения в России не получила. Появилась в связи с попыткой стандартизации кодировок на мировом уровне.
UNICODE – кодировка, в которой на каждый символ отведено 2 байта.
При создании html-документа в любом редакторе его кодировка будет такая же, какую и использует этот редактор. В последствии готовые документы можно преобразовать в любой формат при помощи специальных программ-перекодировщиков.
При работе в Интернете с html-документами для нормального отображения символов той или иной кодировки, и web-сервер, и браузер должны обменяться соответствующей служебной информацией. Для этого протокол HTTP, при помощи поля Accept-Charset, позволяет браузеру послать сообщение на сервер о том, какие кодировки в нем доступны и в каком порядке очередности. При этом сервер может выбрать из вариантов документ, исполненный в требуемой кодировке, сообщить браузеру информацию о том, в какой кодировке будет прислана страница, или автоматически перекодировать ее и переслать браузеру. Если всё сделано корректно, то проблем не возникает, в противном случае пользователь может увидеть не читаемый текст.
Перекодировать web-страницу при просмотре можно, используя возможности браузера. В программе Internet Explorer это команда Вид→Кодировка.
Имеется способ указать кодировку web-страницы не на сервере, а непосредственно в html-коде. Для этого используется специальная версия meta-тега с параметром charset, задающим нужную кодировку. При этом необходимо помнить, что данный тэг имеет приоритет и над установками браузера и над установками, присылаемыми web-сервером.
Данные кодировки не содержат все символы из набора символов документа. Для того, что вставить такой символ в web-страницу необходимо использовать ссылки на символы SGML. Такие ссылки на символы могут быть числовыми и принимать две формы:
синтаксис &#D;, где D - десятичное число, указывает символ Unicode с десятичным номером D;
синтаксис &#xH; или &#XH;, где H - шестнадцатеричное число, указывает на символ Unicode с шестнадцатеричным номером H.
Некоторые из таких символов имеют символические имена, и ссылка на них имеет синтаксис "&name; , где name – символическое имя. При таких ссылках на символы учитывается регистр.
Примеры некоторых ссылок на символы.
水 - шестнадцатеричная числовая ссылка на символ 水.
© - десятичная числовая ссылка на символ ©.
Å - символическая ссылка на символ Å.
å - символическая ссылка на символ å.
- пробел.
Основные тэги языка HTML представлены в приложении 1.
- Тема 2.1.4 Современные средства разработки web-приложений Введение.
- Раздел 1. Общие сведения о www-сервисе Интернет.
- 1.1. Основные понятия.
- Раздел 2. Основы сайтостроения.
- 2.1. Содержание, структура и дизайн web-сайта.
- 2.2. Язык html и каскадные таблицы стилей css.
- 2.2.1. Введение в язык html.
- 2.2.2. Введение в таблицы стилей css.
- 2.3. Инструментальные средства разработки web-сайта.