logo
Информатика учебник

4.3. Представление символьной информации

Символьная информация хранится и обрабатывается в компьютере в форме цифрового кода, то есть каждому символу ставится в соответствие отдельное бинарное слово-код. Так как многие типы информации содержат в значительном объеме цифровую информацию, то применяются две системы кодирования: символьной информации и десятичных чисел.

Необходимый набор символов, предусмотренный в конкретном компьютере, обычно включает в себя:

Среди наборов символов наибольшее распространение получили знаки кода ASCII (ASCIIAmerican Standard Code for Information Interchange) - американский стандартный код обмена информацией.

ASCII - это семиразрядный код, обеспечивающий 128 различных битовых комбинаций. Стандартный знакогенератор современного персонального компьютера IBM PC имеет 8-битовую кодировку символов, состоящую из двух таблиц кодирования: базовой и расширенной. Базовая таблица построена по стандарту ASCII и одинакова для всех IBM-совместимых компьютеров. Расширенная таблица относится к символам с номерами от 128 до 255 и может отличаться на компьютерах разного типа.

Для представления букв русского алфавита в рамках ASCII первоначально был разработан вариант кодировки – КОИ-7 (код обмена информацией 7-битный). Расположение символов во второй половине таблицы этой кодировки резко отличается от принятого фирмой IBM, что затрудняет использование зарубежного программного обеспечения на отечественных машинах.

В настоящее время находят широкое применение и другие виды кодировки. Так, в связи с массовым использованием операционных систем и других продуктов компании Microsoft в нашей стране нашла применение кодировка символов русского языка, известная как кодировка Windows-1251. Эта кодировка используется на большинстве персональных компьютеров, работающих на платформе Windows.

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией восьмизначный). Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в некоторых службах российского сектора Интернета. В частности, в нашей стране она является стандартом в сообщениях электронной почты и телеконференций.

В последнее время все большее распространение получает универсальная система кодирования текстовых данных – UNICODE. В данной системе символы кодируются не восьмиразрядными двоичными числами, а 16-разрядными числами. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов – этого достаточно для размещения в одной таблице всех широко употребляемых языков.