Материалы по интерфейсам периферий / Для Скрипко / Для пособия ПУ (Восстановлен) (2)

Тема 1.4. Представление текстовых и числовых данных

Правило представления символьной информации (буквы алфавита и др. символы) заключается в том, что каждому символу ставится в соответствие уникальное число, т.е. каждый символ нумеруется. Простейшим примером такого соответствия может быть, например, возрастающая нумерация символов кириллицы по порядку их следования. В этом случае букве А будет соответствовать число 1, букве Б – 2 и т.д. до 33. Поскольку, например, компьютер на самом низком уровне оперирует символами двоичной системы счисления, то необходимо выполнить дальнейшие преобразования из десятичной системы счисления в двоичную.

Наиболее распространенный стандарт кодировки символов ASCII-код ("Американский Стандартный Код для Обмена Информацией" – англ. American Standart Code for Information Interchange) был введён в США еще в 1963 г. и после модификации в 1977 г. был принят в качестве всемирного стандарта. Каждому символу поставлено в соответствие двоичное число от 0 до 255 (8-битовый двоичный код), например: A – 01000001, B – 01000010, C – 01000011, D – 01000100 и т.д. Символы от 0 до 127 – латинские буквы, цифры и знаки препинания составляют постоянную (базовую) часть таблицы. Расширенная таблица с 128 по 255 символ отводится под национальный стандарт.

Остальные символы используются для представления национальных алфавитов. Конкретный состав этих символов определяется кодовой страницей. В русской версии ОС Windows используется кодовая страница 866.

Таким образом, каждый введенный в компьютер с клавиатуры или другим образом символ запоминается и хранится на носителе в виде набора из восьми нулей и единиц. Текстовый файл в этом случае представляет собой последовательность байт данных, за каждым из которых стоит символ текста. При выводе текста на экран или на принтер соответствующие программно-аппаратные средства вывода выполняют обратную перекодировку из цифровой формы в символьную по тем же правилам.

В настоящее время идет внедрение нового стандарта – Unicode. Этот стандарт определяет кодировку каждого символа не одним байтом, а двумя. Соответственно, число одновременно кодируемых символов возрастает с 256 до 65536. Данный стандарт позволяет закодировать одновременно все известные символы, в том числе японские и китайские иероглифы.

Важным понятием при представлении числовых данных является понятие системы счисления.

Система счисления – это способ наименования и представления чисел с помощью символов, имеющих определенные количественные значения. В зависимости от способа представления чисел системы счисления делятся на позиционные и непозиционные.

В позиционных системах количественное значение каждой цифры зависит от места (позиции) в числе. В непозиционных системах цифры не меняют своего количественного значения при изменении их расположения в числе. Примером позиционной системы является арабская десятичная система (0-9). Римская система, в которой для каждого числа используется специфическое сочетание символов (XXV = 25, CХ = 110 и т. д.), является примером непозиционной системы счисления.

Алфавитом системы счисления называется набор элементарных символов, из комбинации которых образуются любые численные значения. Количество таких символов и определяет название системы счисления: двоичная – два (0 и 1); восьмеричная – восемь (0, 1, 2, 3, 4, 5, 6, 7, 8); десятичная – десять (0-9); шестнадцатеричная – шестнадцать (0-9, A, B, C, D, E, F).

Общее правило перевода чисел из одной системы счисления в другую формулируется так: перевод числа Х из системы счисления с основанием P в систему счисления с основанием К выполняется путем нахождения остатков от деления числа Х на основание К, при этом процесс продолжается до тех пор, пока частное от деления не будет меньше основания К. Все вычисления выполняются в системе счисления с основанием Р. Например, для перевода числа 10 из десятичной системы счисления в двоичную необходимо найти остатки от деления числа 10 на 2. Аналогично выполняются преобразования в восьмеричную и шестнадцатеричную системы счисления.

Для обратного перевода числа из любой системы счисления в десятичную удобнее использовать другое правило, которое в общем виде формулируется так: перевод числа Х из системы счисления основанием К в систему счисления с основанием Р осуществляется путем представления числа Х по степеням основания К. Все вычисления выполняются в системе счисления с основанием Р, т. е. основание К и цифры исходного числа должны также быть выражены в системе счисления с основанием Р. Например, перевод двоичного числа 1010 в десятичную систему счисления выполняется представлением числа 1010₂ по степеням с основанием 2, начиная с нулевой степени при младшем (самом правом) разряде двоичного слова.

Содержание