3.3.1. Стандарты кодирования символов ascii, ansi, кои-8 и unicode
Представление символов в электронных изданиях базируется на таблицах кодов, в которых каждому из отображаемых на экране символов соответствует код от 0 до 255. Первые 127 кодовых комбинаций используются для латинских букв и цифр, знаков пунктуации и т. д. и, как правило, строятся по единому принципу.
Стандарт представления символов ASCII - это 7-битовое описание кода символа. Поскольку в персональных компьютерах используются байты, состоящие из 8 бит, производители компьютеров часто определяют наборы символов, использующие 256 кодов вместо 128 кодов ASCII. В результате получается «расширенный набор символов» (extended character set), который включает в себя набор символов ASCII и до 128 других символов.
Расширенный набор символов, который Windows и программы для Windows в большинстве случаев используют, называется набор символов ANSI (ANSI character set), фактически он является международным стандартом ISO. Кодовая таблица стандарта ANSI представлена на рис. 3.2.
В нашей стране кодовые комбинации начиная со 128 используются для кодирования символов кириллицы, математических символов и другой информации. Причем для каждой платформы используется свое расположение символов в кодовой таблице. Так, известны кодировки Windows, Mac, DOS-OS/2, ISO (Dec) и КОИ-8. Поэтому приходится осуществлять перекодировки символов кириллицы электронных изданий в зависимости от используемой платформы.
Стандарт кодировки символов UNICODE. Стандарт Unicode был предложен некоммерческой организацией Unicode Consortium, образованной в 1991 г. Для представления каждого символа в этом стандарте используются два байта: один байт для кодирования символа, другой для кодирования признака. Тем самым обеспечивается информационная совместимость данного способа кодирования со стандартом ASСII.
Двухбайтовое описание кодов символов позволяет закодировать очень большое число символов из различных письменностей. Так, в документах Unicode могут соседствовать русские, латинские, греческие буквы, китайские иероглифы и математические символы.
Кодовое пространство Unicode разделено на несколько областей. Область с кодами от 0000 до 007F содержит символы набора Latin 1 (младшие байты соответствуют кодировке ISO 8859-1). Далее идут области, в которых расположены знаки различных письменностей, а также знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем (29000). 6000 кодовых комбинаций оставлено программистам.
- Компьютерные технологии в науке и образовании
- Часть 3 Гипертекстовые и мультимедийные инструментальные системы
- Содержание
- Лекция 1
- 3.1 Основные компоненты гипертекстовых и мультимедийных документов.
- 3.1.1.Текстовая информация
- 3.1.2 Полутоновые и цветные иллюстрации
- 3.1.3 Анимационная графика
- 3.1.4 Видеоинформация
- 3.1.5 Аудиоинформация
- Лекция 2
- 3.2 Технологии гипертекстовых систем.
- 3.2.1 Функции гипертекстовых электронных изданий
- 3.2.2 Принципы построения гипертекстовых документов
- 3.2.3 Математическая модель гипертекста
- 3.2.4 Гипертекстовые Web-документы
- 3.2.5 Подготовка публикаций в среде Adobe Acrobat
- 3.2.6 Технология Help-файлов
- 3.2.7 Средства доставки электронных изданий
- 3.2.8. Классификация и общие принципы оформления электронных изданий
- Лекция 3
- 3.3 Цифровое представление текстовой информации.
- 3.3.1. Стандарты кодирования символов ascii, ansi, кои-8 и unicode
- 3.3.2. Формат pdf
- 3.3.3 Формат разметки текста rtf
- Лекция 4
- 3.4 Графические форматы.
- 3.4.1. Растровый формат gif
- 3.4.2. Формат графических файлов png
- 3.4.3 Графический формат jpeg
- 3.4.4. Формат tiff
- 3.4.5. Программные средства преобразования форматов
- Лекция 5
- 3.5. Представление анимационной, видео- и звуковой информации
- 3.5.1. Семейство форматов mpeg
- 3. 5.1.1. Компрессия видеоданных в mpeg
- 3.5.1.2. Формат mpeg-1
- 3.5.1.3. Формат mpeg-2
- 3.5.1.5. Формат mpeg-7
- 3.5.2. Звуковые форматы
- 3.5.3. Анимационные файловые форматы fli, flc, cel
- Лекция 6
- 3.6 Программы просмотра Web-публикаций.
- 3. 6.1.Доступ к Web-странице в Internet
- 3.6.2.Программа просмотра ms Internet Explorer
- 3.6.3. Программа просмотра Netscape Navigator
- Лекция 7
- 3.7 Языки разметки гипертекста и программирования скриптов.
- 3.7.1 Язык разметки гипертекста нтмl
- 3.7.2 Расширенный язык разметки xml
- 3.7.3 Язык Java
- 3.7.4 Язык JavaScript
- 3.7.5 Язык программирования сценариев php
- 3.7.6 Язык Perl
- 3.7.7 Язык моделирования виртуальной реальности vrml
- Лекция 8
- 3.8 Программирование Web-страниц в языковой среде html.
- 3.8.1 Структура и форматирование html-документа
- 3.8.2 Таблицы
- 3.8.3 Изображения и навигационные карты
- 3.8.4 Формы
- 3.8.5 Фреймы
- 3.8.6 Фреймы и таблицы
- 3.8.7 Объекты
- 3.8.8 Гиперссылки
- 3.8.9 Таблицы стилей
- Лекция 9
- 3.9 Автоматизация создания Web-публикаций.
- 3.9.1 Назначение и функциональные возможности пакета
- 3.9.2 Структурная схема программного пакета
- 3.9.3 Интерфейс пользователя и принципы его организации
- 3.9.4 Некоторые типовые процедуры пакета Dreamweaver