Книга по БД(Вальке А

7.2. Обеспечение сохранности данных.

В подавляющем большинстве информационных систем (ИС) стоимость имеющейся в них информации превышает стоимость той аппаратуры, того программного обеспечения, на котором данная ИС работает. Поэтому обеспечить максимальную сохранность данных - одна из важнейших задач как разработчиков ИС, так и тех, кто ее обслуживает (администраторов, системных программистов и т.д.).

Очевидно, что не бывает ни абсолютно безошибочных программ, ни абсолютно надежных компьютеров. Так же как и не бывает людей, не совершающиъ ошибок. Следовательно, сделать абсолютно надежную ИС (в том смысле, чтобы разработчики и эксплуатационщики могли гарантировать бессбойную безошибочную работу ИС в течении нескольких лет) невозможно. Поэтому, говоря о сохранности информации в ИС следует говорить о таких понятиях, как среднее время простоя в год, вероятность сбоя, время восстановления работоспособности системы после сбоя и т.д. В любом из этих случаев обязательным является требование сохранить всю информацию или, в крайнем случае, минимировать потери информации.

Рассмотрим вопрос сохранности информации более подробно. Прежде всего, выделим основные причины, по которым информация может быть утрачена:

Отказ оборудования. Например, в системе питания твердого диска произошло короткое замыкание и от нагрева был испорчен сам носитель. К ошибкам подобного рода стоит отнести и ошибки в системном программном обеспечении (ОС).
Ошибка в прикладном программном обеспечении. Например, программа может неправильно формировать критерий удаления данных и пользователь, сам того не желая, может удалить несколько нужных записей вместо одной, только что неправильно введеной.
Человеческая ошибка. Администратор может опечататься и вместо нового, только что вставленного в систему жесткого диска, отформатировать старый диск с важными данными. Сюда же стоит отнести и преднамеренное уничтожение информации.

Единственным принципом, на котором может базироваться решение проблемы обеспечения сохранности информации (и, как следствие, гарантии доступности информации) - это тот или иной способ дублирования данных. Дублирование данных может быть постоянным, то есть имеющиеся в системе данные постоянно копируются в некоторую резервную среду хранения и, соответственно, резервные данные сооответствуют текущему состоянию данных (возможно, с некоторой задержкой). Другой вариант дублирования данных - это архивация, то есть создание некоторой копии данных в их текущем состоянии и консервация этой копии.

Рассмотрим принципиальные достоинства и недостатки постоянного дублирования данных и архивации. Затем рассмотрим основные способы постоянного дублирования и архивации.

Постоянное дублирование данных позволяет в высокой степени обезопасить систему от отказа оборудования. В зависимости от того или иного способа дублирования время восстановления системы может быть сведено практически к нулю (варианты постоянного дублирования рассматриваются ниже). Программная ошибка в прикладной программе, повлекшая за собой потерю информации, никак не сможет быть исправлена при постоянном дублировании, так как ошибочные изменения будут продублированы и в резервном экземпляре данных. Точно так же, постоянное дублирование не спасает и от человеческой ошибки или умышленного уничтожения данных.

Достоинством постоянного дублирования является очень быстрое восстановление работоспособности системы и минимальные потери информации после сбоя аппаратуры или системного программного обеспечения. Недостатком постоянного дублирования является невозможность вернуть информационную систему в состояние, которое было до момента потери данных в результате ошибки в прикладной системе или человеческой ошибки.

Архивирование предполагает создание некоторого “слепка” состояния ИС в фиксированный момент времени. Как правило, архивирование - это достаточно длительный процесс как с точки зрения создания архива, так и с точки зрения восстановления состояния ИС из сделанного ранее архива. Архивирование обычно выполняется на внешние носители (ленты, магнито-оптику, и т.д), которые хранятся отдельно от основной вычислиетльной системы, что повышает сохранность данных в случае чрезвычайных обстоятельств (пожара, землятресения и т.д.). Наличие архивных копий позволяет восстановить информацию после любой из рассмотренных выше причин потери информации.

Основным достоинством архивации по сравнению с постоянным дублированием является большая устойчивость к разным причинам потери информации, возможность вернуть ИС в то состояние, которое она имела на некоторый момент времени до каких-либо событий. Недостатком архивации является достаточно большое время возвращения ИС в нужное состояние (иногда, измеряемое часами и, даже, сутками). Также недостатком архивации является то, что теряется информация, занесенная в ИС в интервал между созданием последнего архива и моментом потери информации. При неразумно построенной политике создания архивных копий потерянной информации может быть недопустимо много.

Итак, видно, что постоянное дублирование и архивация данных взаимно дополняют друг друга. Другими словами, при разработке и эксплуатации ИС в целях снижения времени простоя и минимизации потери информации необходимо предусмотреть как дублирование, так и создание архивов.

Содержание