logo search
Конспект лекций дисциплины Компьютерные технологии в науке и образовании

3.3.2. Формат pdf

Формат PDF (Portable Document Format) - переносимый формат документов, разработанный компанией Adobe Systems, используется как основа для создания электронных изданий в среде программного пакета Adobe Acrobat. Формат PDF - это файловый текстовой формат, предназначенный для представления публикаций или других документов на любой аппаратной платформе и в любой операционной среде. PDF-файл содержит PDF-публикацию и специальные данные.

PDF-публикация (документ) содержит одну или более страниц. Каждая страница может включать любые компоненты электронного издания: текст, графику и иллюстрации, анимацию, видео- и аудиоинформацию в аппаратно-независимом формате, в виде так называемого страничного описания (page description). PDF-публикация может также содержать информацию, обеспечивающую навигацию в гипертекстовой электронной публикации.

Характерными особенностями PDF-файла являются:

PDF-файл может содержать объекты, подобные гипертекстовым ссылкам, доступные только при интерактивном просмотре;

для упрощения процесса описания страниц PDF не использует конструкции программных языков;

PDF создает определенную структуру файла, которая позволяет программным приложениям иметь доступ к любой части документа;

PDF файл содержит информацию о размерах шрифта и т.п.;

PDF-файл не может быть прямо преобразован в PostScript-публикацию для печати;

PDF-файл строится на основе либо 7-битового ASCII-файла, либо на базе бинарного файла. Если это ASCII-файл, в нем используются только печатные символы 7-битового ASCII-кода, пробел, табуляция, возврат каретки и перевод строки. В случае бинарного файла могут быть использованы все символы 8-битового кода. Считается, что ASCII-код - наиболее удобный для переноса вид кодировки.

Для уменьшения размера файла PDF использует различные методы сжатия изображений:

JPEG - для полноцветных иллюстраций и изображений в градациях серой шкалы;

CCITT - для черно-белых изображений;

LZW - для компрессии и декомпрессии текстового материала.

Обычный PDF-файл содержит четыре раздела:

заголовок (header);

«тело файла» (body);

таблицу перекрестных ссылок (cross-reference table);

trailer.