logo search
FoxPro / Методички АСВТ / Информатика

Сжатие различных типов данных

Если рассматривать различные типы данных, то, наверное, лучше всего сжимаются простые растровые изображения. Коэффициент сжатия сильно колеблется и во многом зависит от используемого алгоритма и сложности изображения. Например, черно-белое изображение чертежного качества может быть сжато даже в сотню раз, цветные рисунки – в пять-десять раз, а цветные изображения высокого фотографического качества сжимаются менее чем в два раза. Хорошо сжимаются текстовые файлы. Если файл содержит текст, написанный на естественном языке, например, повесть или рассказ, то коэффициент сжатия будет равен двум-трем, а если в файле записан текст программы на языке программирования, то коэффициент сжатия может достигать пяти и выше. Коэффициент сжатия исполняемых файлов также сильно колеблется, однако, в среднем он равен примерно трем.

Использование универсальных методов сжатия применительно ко звуку редко дает хорошие результаты – звуковой файл сокращается всего на 20-40%. То же самое касается и высококачественных изображений, имеющих много деталей. Поэтому, для этих типов изображений используются специальные методы сжатия, особо хорошие результаты дают так называемые алгоритмы сжатия с потерями. Одна из идей этих алгоритмов состоит в том, что человеческий глаз и ухо не очень восприимчивы к некоторым мелким деталям изображения или звука, поэтому лишнюю информацию можно просто отбросить. Разумеется, кроме отбрасывания лишней информации, используются и другие алгоритмы, в результате чего достигается несравнимый коэффициент сжатия при минимальных потерях качества (с точки зрения восприятия человека). Такой подход используется в файлах формата JPEG, предназначенного для хранения статичных изображений и MPEG, предназначенного для хранения видео- и аудиоинформации. Сегодня особенно популярны такие форматы, как MPEG-3 (или MP3), предназначенный для хранения аудиоинформации, и позволяющий достигнуть десятикратного сжатия почти без потери качества, и MPEG-4, используемый для хранения видеофильмов.

Важно заметить, что те файлы, которые уже были сжаты тем или иным методом, почти не сжимаются дальше (чаще наоборот – увеличиваются в объеме), поэтому попытки сделать двойное архивирование редко дают положительный результат.

Подведем итог. Хорошо архивируются файлы, содержащие изображение с небольшим количеством деталей в несжатом виде (.BMP, .PSD и др.), текстовые файлы (.TXT, .DOC, .PAS и др.), большинство исполняемых файлов (.EXE).

Средне архивируются файлы, содержащие в несжатом виде звук (.WAV, .AU и др.), изображения фотореалистичного качества (.BMP, .PSD (были выше) и др.).

Плохо архивируются, либо вообще увеличиваются в размере файлы, данные в которых уже сжаты, в том числе архивы (.RAR, .ZIP, .ARJ и др.), графические файлы тех форматов, которые имеют собственное сжатие (.GIF, .JPG, .PNG и др.), аудиофайлы (.MP3), видеофайлы (.MPG, .AVI и др.), самораспаковывающиеся архивы (.EXE).