4.5. Представление данных во внешней памяти компьютера
Для долговременного хранения данных используются внешние запоминающие устройства (ВЗУ) компьютера. Вся информация, записываемая во внешнюю память, хранится в файлах. Для упорядочения информации создаются папки (каталоги, директории).
Файл – это поименованная совокупность данных, объединенных общим назначением, определенным образом организованных (структурированных, содержащих данные в определенном формате), хранящихся на внешних запоминающих устройствах. Чаще всего используются дисковые файлы.
Именование файлов обеспечивает для пользователей и программистов доступ к данным, не зависящий от внешних устройств, их характеристик (пользователь, зная имя файла, может найти его и поработать с ним независимо от того, находится ли этот файл на локальном жестком диске компьютера, на 3‑х или 5‑дюймовой дискете или на сетевом диске). Приемы работы пользователя с файлами не зависят от способа их хранения, размещения на конкретных устройствах.
Присваивая имя файлу, пользователь должен соблюдать определенные правила: длина имени (количество символов в нем) может быть ограничена, некоторые символы (например, пробелы, знаки препинания и т.п.) могут быть запрещены для включения в имя файла. Эти ограничения определяются операционными системами. Например, длина имени в MS‑DOS не должна быть больше 8 символов, в имени не допускаются разделители и т.п., а Windows позволяет работать с длинными именами, снимая многие ограничения.
В файл обычно записывается информация, объединенная общим назначением, способом использования (это может быть, например, текстовый документ, электронная таблица, графическое изображение или презентация). Тип файла (текстовый, графический и.п.) определяет его организацию (структуру), формат представления информации в нем.
Информация о типе файла, его формате (организации) обозначается расширением имени файла, которое присоединяется к имени файла справа, отделяясь от него при записи точкой. Например
REPORT.TXT
представляет собой имя файла, записанное по правилам MS‑DOS (по стандарту «8.3»), где REPORT – имя файла, а TXT – его расширение.
Далее перечислены часто используемые расширения имен файлов: SYS – System – системный файл (например драйвер); BAT – Batch – текстовый командный файл, описывающий последовательность («пакет») команд; EXE – Executable – «исполнимый» программный файл; COM – Compact – «компактный» программный файл; TXT – Text – текстовые файлы; RAR – архивный файл, созданный с помощью программы архивации RAR (WinRAR); ZIP – архивный файл ZIP (WinZip); DOC – Document – файлы документов текстовых процессоров; RTF – Rich Text Format – стандартный формат для обмена текстовыми документами, поддерживается практически всеми продуктами фирмы Microsoft и текстовым редактором Word для Macintosh; XLS, XLA, XLT – файлы электронных таблиц Excel.
Расширение имени файла определяется программой, создавшей этот файл, или пользователем, задающим имя файла, при его сохранении (записи на диск) или при переименовании. Не стоит при присваивании имени файлу (его переименовании) менять его расширение – изменение расширения может привести к потере связи между файлом и создавшей его программой, к невозможности выполнения операций над этим файлом.
Как видно из приведенного списка, файлы, имеющие одинаковое назначение, используемые для хранения информации одного типа (например, текстов или электронных таблиц), имеют разные форматы и, соответственно, различные расширения имени. Даже файлы, имеющие одно и то же расширение имени (TXT или DOC, например), но созданные разными программами (текстовым редактором MS‑DOS или редактором NotePad в Windows, текстовыми процессорами Word разных версий), могут иметь разный формат и не будут «пониматься» другими программами. Вследствие такой несовместимости могут возникнуть проблемы с переносом файлов из одной среды в другую. Для решения этих проблем используются специальные программы-конверторы или фильтры, помогающие программам «понимать» файлы друг друга.
Для хранения текстов используются файлы, которые по форматам можно разбить на три группы:
файлы, содержащие коды символов текста без дополнительной информации;
файлы, содержащие коды символов текста (ASCII или ANSI, например) и управляющую информацию в виде двоичных кодов;
файлы, в которых вся информация (и текст, и управляющая информация) хранится в символьном виде.
К первой группе файлов можно отнести текстовые файлы (TXT-файлы) MS‑DOS, содержащие только текст без форматирования. В них каждый символ представлен в ASCII-коде. Размер файла равен количеству символов в тексте, т.е. эти файлы не содержат никакой управляющей информации. Так же просто устроены файлы, создаваемые простейшим редактором NotePad («Блокнот») в Windows, использующие код ANSI.
Файлы второй группы создаются, например, в Word (DOC-файлы). Для их просмотра и редактирования нужна соответствующая программа. Формат такого файла в общем случае состоит из заголовка, текста и заключения. В заголовке содержится информация, идентифицирующая формат файла. При открытии файла эта информация используется для проверки его типа, возможности его распознавания. Кроме того, в заголовке может храниться информация, описывающая содержимое файла (например, количество текстовых блоков, некоторые параметры форматирования). Текст документа хранится в текстовых блоках, в которых записываются коды символов и служебная информация. Дополнительной управляющей информацией является информация о параметрах форматирования документа, об элементах его оформления. Она может содержаться в заголовке файла, может сопровождать текстовые блоки, размещаться в заключительной области файла. Вся служебная информация записывается в двоичном коде (например, количество блоков – это целое двоичное число и т.п.).
Файлы третьего типа создаются такими программами, как TEX, Лексикон (для MS‑DOS) или WordStar. Они могут читаться любым текстовым редактором, так как фактически представляют собой обычный текстовый файл, в котором вся информация хранится, например, в ASCII-коде. Но эти файлы содержат элементы форматирования, заданные специальными операторами форматирования, записанными не в виде двоичных кодов, а в виде последовательностей управляющих символов, как и текст. Эти управляющие последовательности при печати или просмотре документов в соответствующих редакторах не отображаются, но операторы форматирования при необходимости можно удалять или изменять вручную, так как эти файлы читаются обычными текстовыми редакторами. Эти файлы легко переносить с одной машины на другую К этой же группе относятся и файлы в формате RTF, HTML – вся служебная информация в них хранится в символьном виде (в ASCII-коде).
Форматы файлов для хранения графических изображений делятся на две большие группы:
файлы для хранения точечных изображений (растровой графики);
файлы для хранения векторной графики.
В растровом формате изображение хранится в файле в виде совокупности точек. Поскольку сетка (растр) легко обрабатывается и упаковывается, этот формат используется для хранения изображений, отображаемых на экране, получаемых со сканеров. Такой способ используется для обработки фотографий. К растровым относятся форматы файлов BMP (Bitmap), PCX, TIFF, GIF, IMG, JPEG. Но эти форматы имеют недостаток – при изменении размеров растровых изображений они искажаются, так как количество точек не меняется, они лишь увеличиваются или уменьшаются в размерах. Поэтому в программы, которые работают с такими файлами включаются специальные средства, позволяющие изменять размеры изображений с минимальной потерей качества на основе специальных алгоритмов.
Формат файла JPEG (сжатый Bitmap) является доминирующим форматом для хранения оцифрованных фотографических изображений. Алгоритм сжатия JPEG – это алгоритм кодирования с потерями, но JPEG делает ненужным восстановление исходного изображения побитно. Этот способ сжатия плохо обрабатывает изображения с небольшим количеством цветов (для таких изображений более подходящими могут оказаться другие схемы сжатия), но полноцветное изображение восстанавливается практически неотличимо от подлинника, при этом используется около одного бита на пиксел (точку) хранения.
В состав Windows включена стандартная программа Paint, представляющая собой простейший графический редактор, работающий с растровыми изображениями в форматах BMP, GIF и др. Одним из наиболее мощных графических редакторов, работающих с растром, является PhotoShop.
Файлы векторных форматов содержат описание изображений в виде совокупности графических объектов-примитивов (линий, окружностей, прямоугольников и т.п.), т.е. в файле хранятся не сами изображения, а описывающие их математические модели. Изображения в таких форматах легко масштабируются. Такой формат представления графики удобен для использования в программах автоматизации инженерных работ (в программах инженерной графики, например, в AutoCAD, деловой графики (Microsoft Visio)). Наиболее известным графическим редактором, поддерживающим иллюстративную векторную графику, является CorelDraw!.
Представление графического изображения на основе описания совокупности графических объектов, составляющих это изображение, используется также и в метафайлах (WMF).
Векторные форматы непригодны для хранения и обработки фотографий, сканирования изображений, хотя существуют специальные программы, позволяющие выполнить векторизацию растровых изображений.
Многочисленные мультимедиа-приложения используют различные форматы файлов для хранения мультимедиа-данных. Например, для хранения звуковой информации разработаны несколько форматов аудиофайлов (VOC – формат фирмы Creative Labs, WAV – формат Microsoft и др. ); AVI-файлы – это файлы для записи видеоизображения (видеоклипов) и т.п. Звуковая информация также сжимается при хранении. Для кодирования звуковой информации с потерями, как и для кодирования графической информации, используются специальные алгоритмы. Форматы кодирования мультимедийной информации описаны выше
Современные приложения позволяют осуществлять обмен данными, создавать составные документы (например, вставлять в текстовый файл изображения или фрагменты электронных таблиц). Для реализации таких возможностей разработаны специальные механизмы (DDE, OLE).
Для хранения резервных копий файлов и их переноса с одного компьютера на другой удобнее не копировать файлы в том же формате, в котором они используются для обработки данных, а создавать с помощью специальных программ упаковки и архивации сжатые копии этих файлов. Архивный файл – это набор из одного или нескольких файлов, помещенных в сжатом (упакованном) виде в один файл, из которого исходные файлы (все или выборочно) можно извлечь при необходимости в первоначальном виде. Архивы содержат оглавление и контрольную информацию. В оглавлении хранится вся информация об упакованных в архив файлах, необходимая для их поиска в архиве и извлечения. Наиболее известными архиваторами для среды Windows являются WinZip и WinRar. Они создают архивные файлы с расширением RAR и ZIP соответственно.
Для удобства поиска информации файлы объединяются в специальные структуры (директории, каталоги данных для хранения служебной информации), складываются в папки в соответствии со своим назначением или принадлежностью. Причем папки также могут вкладываться друг в друга.
Справочники (директории, каталоги, папки) содержат важнейшие сведения о характеристиках файлов, их состоянии, информацию обо всех размещенных в них папках и файлах. Каталог представляет собой служебный файл, содержащий справочную информацию, поэтому для именования каталогов используются те же правила, что и для именования файлов.
Файловая структура практически во всех современных ОС имеет иерархическую (древовидную) организацию. Для того чтобы начать работу с файлом, нужно найти его, раскрыв всю цепочку папок, в которую он вложен (рис. 1.6).
На каждом внешнем устройстве (диске) при его разметке (форматировании) создается собственная файловая структура.
Организация файловых систем подробнее рассматривается ниже.
- Основы информатики и информационных технологий
- Оглавление
- Глава 8. Сети и сетевые технологии 112
- Глава 9. Ащита информации 129
- Предисловие
- Раздел 1. Введение в информатику
- Глава 1. Информатика и предмет ее исследования
- Глава 2. Понятие информации
- 2.1. Определение и свойства информации
- 2.2. Особенности экономической информации
- Глава 3. Роль информации в управлении
- 3.1. Одноконтурная схема управления экономическими системами
- 3.2. Информация и информационные системы в управлении
- Глава 4. Кодирование и представление информации
- 4.1. Основные определения
- 4.2. Связь между системами счисления
- 4.3. Системы счисления, используемые в эвм
- 4.4. Внутреннее представление данных в памяти компьютера
- 4.4.1. Представление чисел
- 4.4.2. Представление текстовых данных
- 4.4.3. Представление мультимедийной информации
- 4.5. Представление данных во внешней памяти компьютера
- Глава 5. Основы алгоритмизации
- 5.1. Определение и свойства алгоритмов
- 5.2. Основные этапы и методы разработки алгоритмов
- 5.3. Основные способы описания алгоритмов
- Раздел 2. Основы информационных технологий
- Глава 6. Аппаратное обеспечение вычислительных систем
- 6.1. Понятие архитектуры и принципы устройства вычислительных систем
- 6.2. Устройство персонального компьютера
- 6.2.1. Конфигурация персонального компьютера
- 6.2.2. Характеристики процессора
- 6.2.3. Организация памяти персонального компьютера
- 6.2.4. Устройства ввода/вывода
- 6.2.5. Внешние запоминающие устройства
- 6.3. Тенденции совершенствования архитектуры
- Глава 7. Программное обеспечение
- 7.1. Понятие программы
- 7.2. Классификация программного обеспечения
- 7.3. Системное программное обеспечение
- 7.3.1. Операционные системы
- Определение и функции операционных систем
- Классификация операционных систем
- Функция управления процессами
- Управление основными ресурсами
- Управление данными. Файловая система
- Управление внешними устройствами и организация ввода/вывода
- Интерфейс с пользователем
- 7.3.2. Операционные оболочки
- 7.3.3. Средства контроля и диагностики
- 7.3.4. Системы программирования
- 7.4. Системы управления базами данных
- 7.4.1. Основные понятия
- 7.4.2. Реляционный подход к управлению бд
- «Магазины»
- «Владельцы»
- «Магазины-Владельцы»
- «Поставки»
- «Товар»
- «Поставки»
- 7.4.3. Назначение и классификация субд
- 7.4.4. Средства описания и манипулирования данными в субд
- 7.4.5. Объектно-ориентированные субд
- 7.4.6. Категории пользователей
- 7.5. Прикладное программное обеспечение
- Глава 8. Сети и сетевые технологии
- 8.1. Определение, назначение и классификация сетей
- 8.2. Способы передачи информации, коммутация и маршрутизация в сетях
- 8.3. Организация взаимодействия в сетях
- 8.4. Топология сетей и методы доступа
- 8.5. Глобальная сеть Internet
- 8.5.1. Идентификация компьютеров в сети
- 8.5.2. Услуги Internet
- 8.5.3. Всемирная паутина World Wide Web
- 8.5.4. Электронная почта
- 8.5.5. Навигационные средства для Internet
- 8.6. Корпоративные сети на основе технологий Internet
- Глава 9. Защита информации
- 9.1. Информация как продукт
- 9.2. Концепция защищенной вс
- 9.2.1. Основные понятия
- 9.2.2. Этапы разработки системы защиты
- 9.2.3. Общая классификация вторжений и характеристика угроз
- 9.2.4. Система защиты
- 9.2.5. Защита объектов на регистрационном уровне и контроль доступа
- 9.3. Криптографические средства защиты информации
- 9.3.1. Основные понятия
- 9.3.2. Криптографические протоколы
- 9.3.3. Электронно-цифровые подписи и открытые сделки
- 9.3.4. Использование криптографической защиты в программных продуктах
- 9.3.5. Условия и ограничения использования криптографической защиты
- 9.4. Программные закладки и вирусы
- 9.5. Хакеры и проблема безопасности информационных систем
- 9.6. Защита информации от потери в результате сбоев
- 9.7. Правовая защита информации и программного обеспечения
- Глава 10. Интегрированные пакеты прикладных программ офисного назначения
- 10.1. Общая характеристика офисных пакетов
- 10.2. Основы редактирования текстовых документов
- 10.3. Использование электронных таблиц
- 10.4. Системы электронного перевода
- 10.5. Системы оптического распознавания текстов
- 10.6. Интеграция систем распознавания текстов, компьютерного перевода и офисных пакетов
- 10.7. Электронные презентации
- 10.8. Графические редакторы
- 10.9. Правовые системы
- 10.10. Учетные системы
- Глава 11. Системы аналитической обработки данных и искусственного интеллекта
- 11.1. Средства анализа данных математических пакетов
- 11.2. Введение в системы искусственного интеллекта
- 11.2.1. Основы экспертных систем
- 11.2.2. Представление и использование нечетких знаний
- 11.2.3. Нейронные системы и сети
- 11.2.4. Системы извлечения знаний
- 11.2.5. Инструментальные средства создания интеллектуальных приложений
- Раздел 3. Современные информационные технологии в экономике и управлении
- Глава 12. Основные понятия
- Глава 13. Эволюция информационных технологий
- Глава 14. Классификация информационных систем
- Глава 15. Корпоративные системы
- 15.1. Типовые технические решения
- 15.2. Корпоративные информационные порталы
- 15.3. Серверы BizTalk как основа средств интеграции информационных систем
- Глава 16. Методы и средства разработки информационных систем
- 16.1. Жизненный цикл информационных систем
- 16.1.1. Процессы жизненного цикла ис
- 16.1.2. Модели жизненного цикла
- 16.2. Методы и средства структурного анализа
- 16.3. Объектно-ориентированный подход к разработке информационных систем
- 16.4. Компонентно-ориентированные средства разработки ис
- Глава 17. Стандарты создания информационных систем
- 17.1. Стандарты кодирования и представления информации
- 17.1.1. Единая система классификации и кодирования технико-экономической и социальной информации
- 17.1.2. Нормативная база системы классификации и кодирования
- 17.2. Унификация и стандартизация документов
- 17.3. Поддержка стандартов управления бизнес-системами
- 17.3.1. Информационные технологии и реинжиниринг
- 17.3.2 Описание стандарта mrp II
- Стратегическое планирование
- Бизнес-планирование
- Планирование объемов продаж и производства
- Планирование ресурсов
- Главный план-график производства
- Общее планирование мощностей
- Mrp, или планирование потребностей в материалах
- Crp, или планирование потребностей в мощностях
- Drp, или планирование потребностей в распределении
- Глава 18. Основы электронной коммерции
- 18.1. Этапы развития электронной коммерции
- 18.2. Секторы рынка электронной коммерции
- 18.3. Инструментарий электронной коммерции
- 18.4. Электронные платежные системы
- Глава 19. Введение в мобильный бизнес
- 19.1. Возможности мобильного бизнеса
- 19.2. Обзор существующих технологий мобильного бизнеса
- 19.2.1. Терминальные устройства
- 19.2.2. Современные технологии построения цифровых каналов связи
- 19.2.3. Стандарты мобильного Internet
- 19.2.4. Проблемы мобильного Internet
- 19.2.5. Операционные системы для мобильных устройств
- 19.2.6. Средства разработки приложений мобильного бизнеса
- Библиографический список