Классические алгоритмы сжатия данных. Диспетчеры архивов. Их функции.
Классические алгоритмы сжатия данных. Диспетчеры архивов. Их функции.
Существует достаточно много алгоритмов сжатия данных, однако все они теоретически основаны на трех способах уменьшения их избыточности: изменение содержания данных; изменение их структуры; изменение содержания данных и их структуры. Изменение содержания данных при их сжатии делает метод сжатия необратимым и полное восстановление информации невозможно. Такие методы называются методами сжатия с регулярной потерей информации. Они применимы для данных, где формальная утрата части содержания не приводит к значительному снижению потребительских свойств. Сюда относятся мультимедийные данные: звукозаписи, рисунки и др. (форматы сжатия: .JPG для графических данных, .MP3 для звуковых данных, .MPG для видеоданных). Эти методы, обладая более высокой степенью сжатия, чем обратимые методы, неприменимы к текстовым документам, базам данных, программному коду.
В основе алгоритмов RLE лежит принцип выявления повторяющихся последовательностей данных и замены их простой структурой, в которой указывается код данных и коэффициент повтора. Например, для последовательности 0, 0, 0, 12, 12, 0, 23, 23, 23, 23 (10 байтов) образуется следующий вектор: 0, 3, 12, 2, 0, 1, 23, 4 (8 байтов) – здесь подчеркнуты коэффициенты повтора. В данном примере коэффициент сжатия равен 8/10 (80%). Алгоритмы RLE отличаются простотой, высокой скоростью работы, но недостаточным сжатием. Для текстовых данных эти методы неэффективны.В основу алгоритмов KWE (по ключевым словам) положено кодирование лексических единиц (пример лексической единицы: слово – последовательность символов, ограниченная с обеих сторон пробелами или символами конца абзаца) исходного документа группами байтов фиксированной длины. Результат кодирования сводится в таблицу, которая прикладывается к результирующему коду и представляет собой словарь. Пары байтов, получаемых при кодировке слов, называются токенами. Эффективность метода зависит от длины документа: прикладываемый словарь значительно увеличивает длину кратких документов. Алгоритм эффективен для англоязычных текстовых документов и файлов баз данных.В основе алгоритма Хаффмана лежит кодирование не байтами, а битовыми группами. Перед началом кодирования производится частотный анализ кода документа и выявляется частота повтора каждого встречаемого символа. Чем чаще встречается символ, тем меньшим числом битов он кодируется. Образующаяся в результате кодирования иерархическая структура прикладывается к сжатому документу в качестве таблицы соответствия
Изменение структуры данных при их сжатии делает метод сжатия обратимым. Исходные данные восстанавливаются путем применения обратного метода. Обратимые методы применимы для сжатия любых типов данных (примеры форматов сжатия без потери информации: .GIF, .TIF, .PCX – для графических данных; .АVI – для видеоданных, .ZIP, .ARJ, .RAR, .LZH – для любых типов).
Теоремы (примем без доказательства):
Для любой последовательности данных существует теоретический предел сжатия, который не может быть превышен без потери части информации.
Для любого алгоритма сжатия можно указать такую последовательность данных, для которой он обеспечит лучшую степень сжатия, чем другие методы.
Для любого алгоритма сжатия можно указать такую последовательность данных, для которой данный алгоритм вообще не позволит получить сжатия.
Таким образом, различные методы сжатия демонстрируют наивысшую эффективность для данных разных типов и разных объемов.В основе существующих обратимых методов сжатия данных лежат теоретические алгоритмы RLE, KWE и алгоритм Хаффмана. Их свойства приведены в таблице:
- Информатика в системе наук. История развития информатики как науки. Информация: определение, измерение информации.
- Информация - от латинского informatio – сведения, разъяснения, изложение.
- 2. Истоки зарождения вычислительной техники. Этапы развития вт. Поколения эвм.
- Поколение первое. Компьютеры на электронных лампах.
- Поколение второе. Транзисторные компьютеры.
- Поколение третье. Интегральные схемы.
- Поколение четвертое. Большие интегральные схемы.
- Пятое поколение эвм"
- 3.Методы классификации эвм. Краткая характеристика основных классов. Классификация по уровню специализации
- Классификация по размеру
- Классификация по совместимости
- Классификация по назначению
- 4. Большие эвм. Назначение. Область применения. Структура вц. Большие эвм (Main Frame)
- 5.Мини- и микроЭвм, пк. Назначение. Область применения. МиниЭвм
- МикроЭвм
- Персональные компьютеры
- Классификация по уровню специализации
- Классификация по размеру
- Классификация по совместимости
- 6. Системы счисления. Определения. Перевод чисел из одной системы счисления в другую. Основные правила. Рассмотреть на примерах.
- 7.Формы представления чисел в эвм. Двоичная арифметика. Представление отрицательных чисел. Выполнение арифметических действий в эвм.
- 8.Логические элементы эвм. Алгебра логики. Законы алгебры логики.
- Кодирование информации. Кодовая таблица. Система кодирования ascii. Система кодирования unicode.
- Кодирование графической информации. Растровые и векторные графические форматы. Форматы хранения графической информации. Двоичное кодирование графической информации
- 11.Кодирование звуковой и видеоинформации. Форматы хранения звуковой и видеоиформации. . Двоичное кодирование звуковой информации
- 12.Структурная схема эвм. Неймановская архитектура компьютера. Назначение и функции основных элементов схемы. Основной цикл работы эвм.
- Структура эвм по Фон Неймона
- Шинная архитектура компьютера. Назначение и функции основных элементов схемы. Контроллер.
- Состав пк. Основные устройства пк IV-го поколения.
- Системный блок пк. Типы системных блоков. Устройства, размещаемые в системном блоке.
- Материнская плата. Основные устройства, размещаемые на материнской плате
- Разновидности памяти эвм и предназначение каждого вида памяти.
- Внутренняя память пк: назначение, типы, параметры.
- 1. Оперативная память
- 3. Специальная память
- 4. Видеопамять
- Клавиатура. Назначение. Типы клавиатур. Основные характеристики.
- Эргономика
- Тип клавиатуры
- Легкость нажатия на клавиши
- Интерфейс
- Интерфейс usb.
- Манипуляторы. Назначение. Типы. Основные характеристики.
- Сканеры. Назначение. Типы. Основные характеристики.
- Принтеры. Назначение. Классификация. Основные характеристики.
- Модем. Определение. Назначение. Основные характеристики.
- Модемы различаются по многим характеристикам: исполнению, поддерживаемым протоколам передачи данных, протоколам коррекции ошибок, возможности голосовой, факсимильной передачи данных.
- По исполнению (внешний вид, размещение модема по отношению к компьютеру) модемы бывают:
- Модемы различаются также по типам:
- Дисководы для cd дисков. Назначение. Основные характеристики. Оптические запоминающие устройства
- Пзу. Назначение. Состав. Постоянные запоминающие устройства (пзу)
- Озу. Назначение. Состав.
- Процессор. Назначение. Состав. Основные параметры, характеризующие процессор.
- Основные характеристики микропроцессора
- Шины. Типы и назначение.
- Устройства ввода данных пк. Классификация. Назначение.
- Устройства вывода данных пк. Классификация. Области применения. Устройства вывода данных
- Мониторы. Определение. Назначение. Классификация.
- Монитор. Определение. Классификация. Жидкокристаллические мониторы.
- Монитор. Определение. Назначение. Классификация. Монитор на базе элт.
- Видеоадаптер. Назначение. Режимы работы видеоадаптера.
- Внешние запоминающие устройства. Виды взу и физические принципы работы.
- По пк. Назначение. Уровни по. Краткая характеристика уровней по.
- Общая классификация программных средств вс.
- Прикладное по. Классификация ппо.
- Ос. Назначение. Основные функции.
- Ос. Классификация ос.
- Понятие операционной системы
- Эволюция операционных систем и основные идеи
- Альтернативные операционные системы: MacOs, os/2, Unix, Linux
- Операционная система Windows: история развития ос, состав и основные принципы работы.
- Понятие файловой системы. Сектор, кластер. Файл, каталог, полное имя файла. Таблица размещения файлов.
- Файловая система fat. Таблица размещения файлов.
- Сравнительная характеристика современных файловых систем.
- Служебные программы. Назначение. Классификация служебных программ
- Служебный уровень
- Служебные программы. Средства диагностики дисков.
- Служебный уровень
- Классификация служебных программных средств
- Средства «сжатия» дисков. Методы сжатия. Форматы сжатия.
- Классические алгоритмы сжатия данных. Диспетчеры архивов. Их функции.
- Компьютерные вирусы. Определение. Назначение. Типы компьютерных вирусов.
- Компьютерные вирусы. Способы обнаружения и борьбы с компьютерными вирусами.
- Методы обнаружения вирусов
- Классификация антивирусов
- Алгоритм. Свойства. Средства и способы записи алгоритма. Рассмотреть на примерах.
- Алгоритм. Виды алгоритмов. Примеры.
- Алгоритм. Основные принципы составления алгоритмов. Примеры.
- Компьютерные сети. Архитектура компьютерных сетей. Основные характеристики архитектуры сетей
- Компьютерные сети. Основные характеристики. Типы сетей.
- Типы сетей По размеру, охваченной территории
- Понятие сервера. Типы серверов, используемые в компьютерных сетях
- Топология сети. Определение топологии. Типы топологий, их характеристики
- Способы передачи информации в глобальной вычислительной сети. Протоколы tcp/ip.
- Internet. Основные понятия и определения. История развития.
- Службы Internet.
- Текстовый редактор Word. Основные элементы настройки при работе с документами.
- Текстовый редактор Word. Элементы автоматизации при работе с большими документами и/или с большим количеством однотипных документов. Рассмотреть на примерах, предложенных преподавателем
- Электронные таблицы Excel. Функции рабочего листа. Примеры логических функций. Рассмотреть на примерах.
- Электронные таблицы Excel. Обобщение данных: фильтрация, консолидация, промежуточные итоги, сводные таблицы. Рассмотреть на примерах.
- Электронные таблицы Excel. Ввод и форматирование данных. Расчеты по формулам. Рассмотреть на примерах.
- Электронные таблицы Excel. Построение и форматирование диаграмм. Рассмотреть на примерах.