Кодирование текстовой информации
Двоичное кодирование текстовой информации в компьютере. Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией.
Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:
N = 2i => 256 = 2i => 28 = 2i => I = 8 битов.
Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255) (табл. 3.1).
Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.
Таблица 3.1. Кодировки знаков |
|
В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение.
Различные кодировки знаков. Присваивание знаку конкретного двоичного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. В существующих кодовых таблицах первые 33 кода (десятичные коды с 0 по 32) соответствуют не знакам, а операциям (перевод строки, ввод пробела и т. д.).
Десятичные коды с 33 по 127 являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Десятичные коды с 128 по 255 являются национальными, т. е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO (табл. 3.1 и 3.2)), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
Таблица 3.2. Десятичные коды некоторых символов в различных кодировках |
|
Например, в кодировке Windows последовательность числовых кодов 221, 194, 204 образует слово "ЭВМ", тогда как в других кодировках это будет бессмысленный набор символов.
К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.
В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту:
N = 2i = 216 = 65 536.
Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.
Контрольные вопросы
1. Почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных символов, хотя русский алфавит включает только 33 буквы? 2. С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов?
- Теоретический материал к уроку 9 класс
- Что такое мультимедиа Что такое мультимедиа
- Области использования мультимедиа
- Представление результатов компьютерного моделирования
- Реклама
- Технические средства мультимедиа
- Система ввода/вывода звука
- Устройства для работы с видеокадрами
- Устройства хранения мультимедийной информации
- Компьютерные презентации Что такое презентация
- Какие бывают презентации
- Этапы создания презентации
- Кодирование информации с помощью знаковых систем Знаки: форма и значение
- Знаковые системы
- Кодирование информации
- Кодирование текстовой информации
- Кодирование числовой информации Представление числовой информации с помощью систем счисления
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Перевод чисел в позиционных системах счисления
- Задания для самостоятельного выполнения
- Арифметические операции в позиционных системах счисления
- Задания для самостоятельного выполнения
- Двоичное кодирование чисел в компьютере
- Задания для самостоятельного выполнения
- Кодирование и обработка звуковой информации
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Алгоритмы и исполнители Управление и кибернетика
- Возникновение кибернетики
- Что такое управление
- Алгоритм управления
- Вопросы и задания
- Управление с обратной связью Линейный алгоритм
- Обратная связь
- Модель управления с обратной связью
- Циклы и ветвления в алгоритмах
- Системы с программным управлением
- Вопросы и задания
- Алгоритм и его формальное исполнение Свойства алгоритма и его исполнители
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Выполнение алгоритмов человеком и компьютером
- Что такое язык программирования
- Что такое система программирования
- Вопросы и задания
- Знакомство с языком Паскаль Возникновение и назначение Паскаля
- Структура программы на Паскале
- Операторы ввода, вывода, присваивания
- Правила записи арифметических выражений
- Пунктуация Паскаля
- Вопросы и задания
- Алгоритмы с ветвящейся структурой Представление ветвлений на ая. Трассировка ветвящихся алгоритмов
- Сложные ветвящиеся алгоритмы
- Вопросы и задания
- Программирование ветвлений на Паскале Оператор ветвления на Паскале
- Программирование полного и неполного ветвления
- Программирование вложенных ветвлений
- Логические операции
- Сложные логические выражения
- Вопросы и задания
- Программирование диалога с компьютером Что такое диалог с компьютером
- Пример программирования диалога
- Вопросы и задания
- Программирование циклов
- Этапы решения расчетной задачи на компьютере
- Задача о перестановке букв. Программирование цикла на Паскале
- Что такое отладка и тестирование программы
- Вопросы и задания
- Алгоритм Евклида Наибольший общий делитель
- Идея алгоритма Евклида
- Описание алгоритма Евклида блок-схемой
- Программа на ая и на Паскале
- Вопросы и задания
- Что такое массив
- Описание и ввод значений в массив на Алгоритмическом языке
- Цикл с параметром в ая
- Расчет среднего значения элементов массива
- Вопросы и задания
- Массивы в Паскале
- Описание и обработка массива на Паскале
- Цикл с параметром на Паскале
- Форматы вывода
- Программа с двумя массивами
- Вопросы и задания
- Одна задача обработки массива
- Что такое случайные числа
- Датчик случайных чисел на Паскале
- Алгоритм поиска числа в массиве
- Программа поиска числа в массиве
- Вопросы и задания
- Формализация и моделирование Моделирование как метод познания
- Контрольные вопросы
- Материальные и информационные модели
- Материальные модели.
- Информационные модели.
- Образные модели
- Графические информационные модели
- Чертежи и схемы
- График - модель процесса.
- Знаковые информационные модели.
- Табличные модели
- Двоичные матрицы
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Информационное моделирование на компьютере Основное преимущество компьютера перед человеком
- Для чего нужны математические модели
- Компьютерная математическая модель
- Что такое вычислительный эксперимент
- Управление на основе моделей
- Имитационное моделирование
- Вопросы и задания
- Формализация и визуализация моделей
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Основные этапы разработки и исследования моделей на компьютере
- Контрольные вопросы
- Хранение, поиск и сортировка информации Базы данных и системы управления базами данных
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Сортировка в базах данных
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Поиск в базах данных
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Коммуникационные технологии Передача информации
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Локальные компьютерные сети
- Контрольные вопросы
- Адресация в Интернете
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Маршрутизация и транспортировка данных по компьютерным сетям
- Контрольные вопросы
- Информационные ресурсы Интернета Всемирная паутина
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Электронная почта
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Файловые архивы
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Общение в Интернете
- Контрольные вопросы
- Мобильный Интернет
- Контрольные вопросы
- Звук и видео в Интернете
- Контрольные вопросы
- Поиск информации в Интернете
- Способы поиска в Интернете Три способа поиска в Интернете
- Поисковые серверы
- Язык запросов поисковой системы
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Электронная коммерция в Интернете
- Контрольные вопросы
- Разработка Web-сайтов с использованием языка разметки гипертекста html
- Контрольные вопросы
- Структура Web-страницы
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Форматирование текста на Web-странице
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Вставка изображений в Web-страницы
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Гиперссылки на Web-страницах
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Списки на Web-страницах
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Информатизация общества Информационное общество
- Контрольные вопросы
- Задания для самостоятельного выполнения
- Информационная культура
- Контрольные вопросы
- Правовая охрана программ и данных. Защита информации Правовая охрана информации
- Контрольные вопросы
- Лицензионные, условно бесплатные и свободно распространяемые программы
- Контрольные вопросы
- Защита информации
- Контрольные вопросы