logo search
FINAL (Verdana, 16)

45.Объясните понятие сжатия информации. Проанализируйте классические алгоритмы сжатия.

Общая схема передачи информации

Исход.инф-я -> шифрование -> сжатие -> шумозащитное кодирование -> канал связи ( <- отдельно входит «шум») -> декодирование шумозащитных кодов -> распаковка -> дешифровка -> получение информации

Информацию можно передавать последовательно, т.е. бит за битом, и параллельно, т.е. группами фиксированного количества бит. Канал связи - это среда передачи информации, которая характеризуется в первую очередь макс. возможной для нее скоростью передач данных. Шум - это помехи в канале связи при передаче информации. Скорость передачи информации измеряется в количестве переданных за одну секунду бит или в бодах (baud): 1бод = 1бит/сек (bps).

Устройства для преобразования непрерывной информации в дискретную обобщающе называются АЦП (аналого-цифровой преобразователь) или ADC (Analog to Digital Convertor, A/D); для преобразования дискретной информации в аналоговую - ЦАП (цифро-аналоговый преобразователь) или DAC (Digital to Analog Convertor, D/A).

Преобразование информации.

Цель сжатия - уменьшение количества бит, необходимых для хранения или передачи заданной информации(Rar, Zip, Arj, GZ и др.) Кодирование - процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки (Цифровое,Аналоговое,Таблично-символьное, Числовое) преобразования сообщения в комбинацию символов в соответствии с кодом Шифрова́ние — способ преобразования открытой информации в закрытую и обратно.

Сжатие информации. Метод Шеннона-Фэно . 1)Значения д.с.в. располагают в порядке убывания их вероятностей.2)Затем последовательно делят на две части с приблизительно равными вероятностями.3)К коду первой части добавляют 0, а к коду второй – 1 ит.д. недостатки:С ростом длины сообщения трудоемкость построения кода становится недопустимо большой; Такое кодирование делает невозможным отправку сообщения по частям, что необходимо для непрерывных процессов передачи данных;

Полученный код: A—11,B—1, C —100, D—00,E—011, F — 010

X Р code(X) А 0,4 0 | В 0.2 11 | С 0.4 10

ML(X) = ML1(X) = 1.6 бит/сим, НХ = log2 5 - 0.8= 1.523 бит/сим

Сжатие информации. Метод Хаффмена. 1. Более практичен и никогда по степени сжатия не уступает методу Шеннона-Фэно, более того, он сжимает максимально плотно. 2. Код строится при помощи двоичного (бинарного) дерева. Вероятности значений д.с.в. приписываются его листьям; все дерево строится, опираясь на листья. 3. Величина, приписан к узлу дерева, наз-ся весом узла. 4. Два листа с наименьшими весами создают родительский узел с весом, равным сумме их весов; в дальнейшем этот узел учитывается наравне с оставшимися листьями, а образовавшие его узлы от такого рассмотрения устраняются. 5. После постройки корня нужно приписать каждой из ветвей, исходящих из родительских узлов, значения 0 или 1. 6. Код каждого значения д.с.в. - это число, получаемое при обходе ветвей от корня к листу, соответствующему данному значению. Двигаясь по кодовому дереву сверху вниз, можем записать для каждого символа соответствующий ему код. Cловарно-ориентированные алгоритмы сжатия информации Разработан израильскими математиками Якобом Зивом (Ziv) и Авраамом Лемпелом (Lempel). Основная идея LZ77 состоит в том, что второе и последующие вхождения некоторой строки символов в сообщении заменяются ссылками на ее первое вхождение. LZ77 использует уже просмотренную часть сообщения как словарь. Чтобы добиться сжатия, он пытается заменить очередной фрагмент сообщения на указатель в содержимое словаря. Общий подход: LZ77 использует "скользящее" по сообщению окно, разделенное на две неравные части. Первая, большая по размеру, является словарем, включает уже просмотренную часть сообщения. Вторая, намного меньшая, является буфером, соде-им еще незакодиров. символы входного потока. Алгоритм пытается найти в словаре фрагмент, совпад-ий с содерж. буфера. Алгоритм LZ выдает коды, сост-ие из 3 эл-ов: смещение в словаре относительно его начала подстроки, совпадающей с началом содержимого буфера; длина этой подстроки; первый символ буфера, следующий за подстрокой