logo
ИНФ

5. Единицы измерения информации. Таблицы кодов. Представление информации в эвм.

Бит (англ. bit — немного) — единица измерения информации.

Байт (англ. byte) — единица измерения количества информации, по умолчанию байт считается равным восьми битам.

1Байт = 8Бит

Байт

обозначение

Единица измерения

1000

kB

1 килобайт

1000000

MB

1 мегабайт

1000000000

GB

1 гигабайт

1000000000000

TB

1 терабайт

1000000000000000

PB

1 петабайт

1000000000000000000

EB

1 эксабайт

100000000000000000000

ZB

1 зеттабайт

1000000000000000000000000

YB

1 йоттабайт

В основном, в зависимости от объема, пользуются первыми тремя единицами измерения: Калобайты, Мегабайты, Гигабайты.

Таблица кодов — это табличка, в ячейки которой вписаны коды, то есть комбинации из цифр и букв латинского алфавита. Координаты ячеек определяются так же, как координаты клеток на шахматной доске (например, В3). Каждая таблица уникальна, комбинации кодов не повторяются.

Двоичное кодирование

В какой бы форме не представлялась подлежащая обработке информация, она должна быть переведена компьютером на язык, доступный для автоматической обработки. Язык компьютера – это язык чисел, причем не обычных (десятичных), а двоичных, алфавит которых состоит всего лишь из двух цифр – 0 и

1. Двоичная система наиболее проста и удобна для обработки на ЭВМ, т. к. компьютер – электрическая машина и работает с электрическими сигналами: есть сигнал – включено, нет сигнала – выключено.

В современной вычислительной технике информация как раз и кодируется с помощью сигналов двух видов: включено или выключено. На этом простом принципе и основана работа ЭВМ. Любая информация в компьютере может быть представлена в виде последовательности двоичных символов – бит.

Представление текстовой информации При двоичном кодировании текстовой информации каждому символу соответствует его код – последовательность из 8 нулей и единиц, называемая байтом. Всего существует 256 разных последовательностей из 8 нулей и единиц. Это позволяет закодировать 256 символов, например большие и малые буквы латинского и русского алфавитов, цифры, знаки препинания, специальные символы, пробел и т. д.

Соответствие байтов и символов задается с помощью таблицы кодировки, в которой устанавливается взаимосвязь между символами и их порядковыми номерами в компьютерном алфавите. Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код есть порядковый номер символа в двоичной системе счисления.  Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от 0 (двоичный код 000000000) до 127 (двоичный код 01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. остальные 128 кодов, начиная с 128 (двоичный код 10000000) и кончая 255 (двоичный код 11111111), использу-ются для кодировки букв национальных алфавитов, символов псевдографики и научных симво-лов. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. 

Принцип последовательного кодирования алфавита: в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.

Современные ЭВМ реализованы на электронных элементах (триггерах), имеющих два устойчивых состояния (типа включен/выключен). Эти состояния кодируются – одно обозначается “0”(ноль), другое – “1” (единица). Таким образом, язык ЭВМ содержит как и азбука Морзе (телеграфная азбука) только два символа. Это в свою очередь, вынуждает для представления данных в ЭВМ использовать специальные коды. Данные по типу можно разделить на четыре группы.

СИМВОЛЬНЫЕ – используются для обозначения понятий, объектов и формирования ТЕКСТОВ по правилам того или иного языка сообщений.

ЧИСЛОВЫЕ – используются для обозначения КОЛИЧЕСТВ в различных формах и различных системах счисления (двоичной, восьмеричной, десятичной и шестнадцатеричной)

ДАТА - используется для представления ДАТ в различных формах (американской, германской, европейской и других)

ЛОГИЧЕСКИЕ – используются для обозначения НАЛИЧИЯ или отсутствия какого-либо признака (ЕСТЬ/НЕТ) и имеют только два значения: ИСТИНА – обозначается либо .T., либо .

ЛОЖЬ – обозначается либо .F., либо N Основным элементом кодированного представления данных в ЭВМ является БАЙТ. Это код из восьми позиций, в каждой из которых может находиться либо 0, либо 1. Например: 01001000 или01000101 и т.п. Каждая позиция называется разрядом или битом. В зависимости от того, какой тип данных представляет байт, его содержимое интерпретируется по-разному.

При представлении СИМВОЛЬНЫХ данных один байт представляет собой кодированное представление одного символа, например