logo
Теория информации

1. Информация, ее представление и измерение

Понятие информации является наиболее сложным для понимания и обычно во вводных курсах информатики не определяется, принимается как исходное базовое понятие, понимается интуитивно, наивно. Часто это понятие отождествляется неправильным образом с понятием "сообщение".

Понятие "информация" имеет различные трактовки в разных предметных областях. Например, информация может пониматься как:

Рассмотрим это фундаментальное понятие информатики на основе понятия "алфавит".

Формальное определение алфавита: алфавит – конечное множество различных знаков, символов, для которых определена операция конкатенации (приписывания, присоединения символа к символу или цепочке символов); с ее помощью по определенным правилам соединения символов можно получать слова (цепочки знаков) и словосочетания (цепочки слов) в этом алфавите (над этим алфавитом).

Буквой или знаком называется любой элемент x алфавита X, где . Понятие знака неразрывно связано с тем, что им обозначается ("со смыслом"), они вместе могут рассматриваться как пара элементов (x, y), где x – сам знак, а y – обозначаемое этим знаком.

Конечная последовательность букв алфавита называется словом в алфавите (или над алфавитом).

Длиной |p| некоторого слова p над алфавитом Х называется число составляющих его букв.

Слово (обозначаемое символом Ø) имеющее нулевую длину, называется пустым словом: |Ø| = 0.

Множество различных слов над алфавитом X обозначим через S(X) и назовем словарным запасом (словарем) алфавита (над алфавитом) X.

В отличие от конечного алфавита, словарный запас может быть и бесконечным.

Слова над некоторым заданным алфавитом определяют сообщения.

В алфавите должен быть определен порядок следования букв (порядок типа "предыдущий элемент – последующий элемент"), то есть любой алфавит имеет упорядоченный вид X = {x1, x2, …, xn} .

Таким образом, алфавит должен позволять решать задачу лексикографического (алфавитного) упорядочивания, или задачу расположения слов над этим алфавитом, в соответствии с порядком, определенным в алфавите (то есть по символам алфавита).

Информация – это некоторая упорядоченная последовательность сообщений, отражающих, передающих и увеличивающих наши знания.

Классификации информации:

Информация актуализируется с помощью различной формы сообщений – определенного вида сигналов, символов.

Информация по отношению к источнику или приемнику бывает трех типов: входная, выходная и внутренняя.

Информация по отношению к конечному результату бывает исходная, промежуточная и результирующая.

Информация по ее изменчивости бывает постоянная, переменная и смешанная.

Информация по стадии ее использования бывает первичная и вторичная.

Информация по ее полноте бывает избыточная, достаточная и недостаточная.

Информация по доступу к ней бывает открытая и закрытая.

Свойства информации:

Основные свойства информации, определяющие ее качество:

Семантический аспект информации [semantic aspect of information] — характеристика информации с точки зрения ее смысла, содержания. Для восприятия информации необходимо, чтобы передаваемые сообщения в определенной мере соответствовали тезаурусу1 знаний получателя: если они не имеют точек соприкосновения с ним, сообщение понято не будет (так, человек, не знающий математики, не поймет математическую формулу). Мера соответствия сообщения тезаурусу определяет количество извлекаемой из него информации: оно максимально, когда достигается максимальное приращение тезауруса в результате восприятия и понимания сообщения.

Смысловую сторону информации изучает семантика, являющаяся разделом семиотики — науки о знаках и знаковых системах.

Прагматический аспект информации [pragmatical aspect of information] — характеристика информации с точки зрения полезности, пригодности для решения задачи. При этом оценка может быть субъективной, отражая точку зрения получателя информации (интерпретатора). Если получатель хотя и понял поступившую информацию, но не счел ее полезной, важной, то это означает наличие прагматического шума — такая информация отсеивается. Проблемы прагматического отбора информации изучает прагматика — раздел семиотики, науки о знаках и знаковых системах. Исследования в этой области важны для проектирования информационно-поисковых систем, систем машинного распознавания образов, машинного перевода и др.

Методы получения информации можно разбить на три большие группы.

  1. Эмпирические методы или методы получения эмпирических данных.

  2. Теоретические методы или методы построения различных теорий.

  3. Эмпирико-теоретические методы (смешанные) или методы построения теорий на основе полученных эмпирических данных об объекте, процессе, явлении.

Охарактеризуем кратко эмпирические методы.

  1. Наблюдение – сбор первичной информации об объекте, процессе, явлении.

  2. Сравнение – обнаружение и соотнесение общего и различного.

  3. Измерение – поиск с помощью измерительных приборов эмпирических фактов.

  4. Эксперимент – преобразование, рассмотрение объекта, процесса, явления с целью выявления каких-то новых свойств.

Кроме классических форм их реализации, в последнее время используются опрос, интервью, тестирование и другие.

Охарактеризуем кратко теоретические методы.

  1. Восхождение от абстрактного к конкретному – получение знаний о целом или о его частях на основе знаний об абстрактных проявлениях в сознании, в мышлении.

  2. Идеализация – получение знаний о целом или его частях путем представления в мышлении целого или частей, не существующих в действительности.

  3. Формализация – получение знаний о целом или его частях с помощью языков искусственного происхождения (формальное описание, представление).

  4. Аксиоматизация – получение знаний о целом или его частях с помощью некоторых аксиом (не доказываемых в данной теории утверждений) и правил получения из них (и из ранее полученных утверждений) новых верных утверждений.

  5. Виртуализация – получение знаний о целом или его частях с помощью искусственной среды, ситуации.

Охарактеризуем кратко эмпирико-теоретические методы.

  1. Абстрагирование – выделение наиболее важных для исследования свойств, сторон исследуемого объекта, процесса, явления и игнорирование несущественных и второстепенных.

  2. Анализ – разъединение целого на части с целью выявления их связей.

  3. Декомпозиция – разъединение целого на части с сохранением их связей с окружением.

  4. Синтез – соединение частей в целое с целью выявления их взаимосвязей.

  5. Композиция — соединение частей целого с сохранением их взаимосвязей с окружением.

  6. Индукция – получение знания о целом по знаниям о частях.

  7. Дедукция – получение знания о частях по знаниям о целом.

  8. Эвристики, использование эвристических процедур – получение знания о целом по знаниям о частях и по наблюдениям, опыту, интуиции, предвидению.

  9. Моделирование (простое моделирование), использование приборов – получение знания о целом или о его частях с помощью модели или приборов.

  10. Исторический метод – поиск знаний с использованием предыстории, реально существовавшей или же мыслимой.

  11. Логический метод – поиск знаний путем воспроизведения частей, связей или элементов в мышлении.

  12. Макетирование – получение информации по макету, представлению частей в упрощенном, но целостном виде.

  13. Актуализация – получение информации с помощью перевода целого или его частей (а следовательно, и целого) из статического состояния в динамическое состояние.

  14. Визуализация – получение информации с помощью наглядного или визуального представления состояний объекта, процесса, явления.

Кроме указанных классических форм реализации теоретико-эмпирических методов часто используются и мониторинг (система наблюдений и анализа состояний), деловые игры и ситуации, экспертные оценки (экспертное оценивание), имитация (подражание) и другие формы.

Информационная система – это система, в которой элементы, структура, цель, ресурсы рассматриваются на информационном уровне (хотя, естественно, имеются и другие уровни рассмотрения).

Информационная среда – это среда (система и ее окружение) из взаимодействующих информационных систем, включая и информацию, актуализируемую в этих системах.

Установление отношений и связей, описание их формальными средствами, языками, разработка соответствующих описаниям моделей, методов, алгоритмов, создание и актуализация технологий, поддерживающих эти модели и методы, и составляет основную задачу информатики как науки, образовательной области, сферы человеческой деятельности.

Информатику можно определить как науку, изучающую неизменные сущности (инварианты) информационных процессов, которые протекают в различных предметных областях, в обществе, в познании, в природе.

Контрольный тест №1:

  1. Семантический аспект – это характеристика информации с точки зрения...

    1. ее смысла

    2. количества информации

    3. полезности

    4. структуры информации

  2. Прагматический аспект информации рассматривает

    1. отношения между единицами информации

    2. дает возможность раскрыть ее содержание и показать отношение между смысловыми значениями ее элементов

    3. информацию с точки зрения ее практической полезности для получателя

    4. определяет значение символа естественного алфавита

  3. Информацию, достаточную для решения поставленной задачи, называют…

    1. полной

    2. достоверной

    3. актуальной

    4. объективной

  4. Свойство информации, заключающееся в достаточности данных для принятия решений, есть …

    1. содержательность

    2. полнота

    3. достоверность

    4. объективность

  5. Информация достоверна, если она…

    1. отражает истинное положение дел

    2. полезна

    3. достаточна для принятия решений

    4. используется в современной системе обработки информации

  6. Представление информации в виде слов определяет характер информации:

    1. вербальный

    2. смысловой

    3. целочисленный

    4. знаковый