7.6. Компьютерные технологии распределенной обработки данных
Системы управления базами данных, реализованные на базе компьютерной сети (совмещенные с сетевыми компьютерными технологиями), в зависимости от их архитектуры, классифицируются на:
- системы с сетевым (распределенным) доступом;
- системы, предоставляющие распределенную обработку данных;
- распределенные базы данных.
1. Первый класс систем позволяют осуществить распределенный (сетевой) доступ к централизованной базе данных. Они построены с помощью сетевых версий программ на основе оборудования и программного обеспечения различных локальных вычислительных сетей. Архитектура систем с сетевым доступом предполагает выделение одного из компьютеров сети в качестве центрального. Этот компьютер обеспечивает функционирование той части сетевой версии СУБД, которая осуществляет управление данными, и называется сервером файлов (File Server). Основное требование к нему - наличие жесткого диска большой емкости, достаточной для хранения совместно используемой централизованной базы данных. Все другие машины сети выполняют функции рабочей станции (Workstation). Ими поддерживается доступ пользователей системы к централизованной базе данных на сервере. В соответствии с запросом пользователя необходимые ему файлы базы данных на сервере копируются и передаются на рабочую станцию, которая затем производит его обработку. Таким образом, вся обработка данных ведется на рабочей станции. Указанная архитектура системы баз данных характеризуется большим сетевым трафиком, что отрицательно сказывается на ее производительности и надежности. Другой недостаток таких систем заключается в том, что каждая рабочая станция должна быть достаточно мощной (а значит и дорогой) - иметь значительные собственные ресурсы для обработки приложений и обеспечения приемлемого уровня реактивности при обработке запросов пользователя.
Сетевые версии программ отличаются от локальных тем, что они рассчитаны на мультипользовательскую обстановку. Специальные механизмы, позволяющие многим пользователям совместно обращаться к общим ресурсам централизованной базы данных, реализуют:
- синхронизацию трансакций, основанную на технике блокирования ресурсов (иногда с точностью до поля) и позволяющие производить обновление данных при параллельной работе различных пользователей;
- управление доступом, обеспечивающее пользователям операции над базой данных в рамках тех полномочий, которые им предоставлены.
2. Распределенная обработка данных предполагает обработку приложений несколькими территориально распределенными машинами, при этом в приложениях, связанных с обработкой базы данных, собственно управление базой данных может выполняться централизованно. Системы, предоставляющие распределенную обработку данных, опираются на архитектуру «клиент - сервер». Сервер базы данных представляет собой мультипользовательскую версию СУБД, параллельно обрабатывающую запросы, поступившие со всех рабочих станций. В его задачу входит реализация логики обработки трансакций с применением необходимой техники синхронизации - с поддержкой протоколов блокирования ресурсов, с обеспечением предотвращения и/или устранения тупиковых ситуаций.
В ответ на пользовательский запрос рабочая станция получает не копию файла для последующей обработки, а готовые результаты. Программное обеспечение рабочей станции при такой архитектуре играет роль внешнего интерфейса централизованной системы управления данными. Это позволяет существенно уменьшить сетевой трафик, сократить время на ожидание ресурсов данных в мультипользовательском режиме, разгрузить рабочие станции, а значит использовать для них более дешевые компьютеры. Для современных сетевых СУБД архитектура «клиент - сервер» стала стандартом.
Прикладная программа (приложение), реализованная в рамках архитектуры «клиент - сервер» имеет распределенный характер: часть ее функций реализуется в программе-клиенте, другая часть - в программе-сервере. Технология «клиент - сервер» базируется на разделении функций стандартного интерактивного приложения на четыре группы: функции ввода и отображения данных; прикладные функции, характерные для предметной области; функции хранения и управлении ресурсами (базами данных); служебные функции.
Как следствие, любое приложение состоит из следующих компонентов: компонент представления (функции 1-й группы); прикладной компонент (функции 2-й группы); компонент доступа к информационным ресурсам (функции 3-й группы и протокол их взаимодействия).
3. СУБД и централизация обработки информации позволили устранить такие недостатки файловых систем, как несвязанность, несогласованность и избыточность данных. В централизованной базе данных легче обеспечить безопасность, целостность и непротиворечивость информации при обновлениях. В то же время, с ростом объема баз данных и количества трансакций возникают следующие проблемы: низкая надежность и общая производительность, а также повышенные затраты на разработку системы.
Решение указанных проблем связано с децентрализацией данных, иначе говоря, с использованием распределенных баз данных. Распределенная база данных - это набор файлов (отношений), хранящихся в разных узлах информационной сети и логически связанных таким образом, чтобы составлять единую совокупность данных (связь может быть функциональной или через копии одного и того же файла). При децентрализации данных достигается следующее:
- более высокая степень параллельности обработки вследствие распределения нагрузки;
- улучшенное использование данных на местах при выполнении удаленных (дистанционных) запросов; простота управления.
- затраты на создание сети, в узлах которой находятся малые ЭВМ, значительно ниже, чем на создание аналогичной системы с использованием высокопроизводительной большой ЭВМ.
Распределенная база данных предполагает хранение и выполнение функций управления данными в нескольких узлах и передачу данных между этими узлами в процессе выполнения запросов. Такая база данных состоит из нескольких локальных баз данных, однако у пользователя сохраняется иллюзия работы с централизованной базой данных. Его не интересует, каким образом распределены данные между компьютерами. В основе этого эффекта лежит использование некоторого общего представления о данных - глобальной концептуальной схемы. Определение данных в такой концептуальной схеме аналогичным определению в централизованной базе данных. Принято выделять следующие основные свойства идеальной распределенной базы данных, реализуемые внутрисистемными средствами.
Локальная автономия - означает, что управление данными на каждом из узлов распределенной системы выполняется локально. Будучи фрагментом распределенной системы, она в то же время функционирует как полноценная локальная база данных; управление ею выполняется локально и независимо от других узлов системы. Независимость от центрального узла - все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. База данных на каждом из узлов самодостаточна - она включает полный собственный словарь данных и полностью защищена от несанкционированного доступа. Непрерывные операции - возможность непрерывного доступа к данным независимо от их расположения и от операций, выполняемых на локальных узлах. Прозрачность расположения данных - пользователь ничего не знает о реальном, физическом размещении данных в узлах компьютерной системы и выполняет операции над данными без учета их местонахождения. Прозрачность фрагментации данных - возможность распределенного - на различных узлах - размещения данных, логически представляющих собой единое целое. Прозрачность тиражирования данных - это асинхронный процесс переноса изменений объектов исходной базы данных в базы, расположенные на других узлах распределенной системы. Обработка распределенных запросов - возможность выполнения операций выборки над распределенной базой данных, сформулированных в рамках обычного запроса на языке SOL. Обработка распределенных трансакций - возможность выполнения операций обновления распределенной базы данных не разрушая целостность и согласованность данных. Независимость от оборудования - качестве узлов распределенной системы могут выступать компьютеры любых моделей и производителей. Независимость от операционных систем - означает многообразие операционных систем, управляющих узлами распределенной системы. Прозрачность сети - в распределенной системе возможны любые сетевые протоколы. Независимость от баз данных – в сети возможны операции поиска и обновления в базах данных различных моделей и форматов, различных производителей.
- Московский государственный университет
- Оглавление
- Раздел 1. Методология информационных технологий управления
- Глава 1. Информация и управление
- 1.1. Понятие информации.
- Свойства информации.
- 1.3. Виды информации
- Источники информации
- Виды информации на различных уровнях управления
- Глава 2. Структура информационных технологий управления
- 2.1. Сущность информационной технологии управления
- 2.2. Виды информационных технологий управления
- 2.3. Объекты информационных технологий управления
- 2.4. Элементы информационных технологий управления
- 2.5. Методология проектирования автоматизированных информационных технологий управления
- 2. Технические науки.
- 2.2. Информатика
- 5.1. Геология, геохимия, геофизика и горные науки.
- 6.2. Философия, социология, психология и правовые науки.
- Раздел 2. Организация и средства информационных технологий обеспечения управленческой деятельности
- Глава 3. Информационная база управления
- 3.1. Предметная область использования информационных технологий
- 3.2. Понятие и структура информационной базы управления
- 3.3. Информационные ресурсы и фонды
- 3.4. Языковые средства
- 3.5. Словари.
- 3.6. Ведение словарей
- Глава 4. Информационные процессы
- 4.1. Понятие и виды информационных процессов
- 4.2. Сбор (получение) информации.
- 4.3. Оценка информации в управлении
- 4.4. Передача информации.
- 4.5. Накопление информации
- 4.6. Хранение информации
- 4.7. Обработка информации
- 4.8. Выдача (представление) информации
- Глава 5. Информационные потоки
- 5.1. Информационные потоки в системе управления
- 5.2. Виды информационных потоков
- 5.3. Методы исследования информационных потоков
- 5.6. Оптимизация информационных потоков
- Глава 6. Аппаратные средства информационных технологий
- 6.1. Организационная техника
- 6.2. Вычислительная техника
- 6.3. Персональные компьютеры
- 6.4. Суперкомпьютеры
- 6.5. Периферийные устройства персонального компьютера
- 6.6. Презентационная техника
- Раздел 3. Организация компьютерных информационных систем
- Глава 7. Инструментальные средства компьютерных технологий информационного обслуживания управленческой деятельности
- 7.1. Основы построения инструментальных средств информационных технологий
- 7.2. Компьютерные технологии подготовки текстовых документов
- 7.3. Компьютерные технологии обработки экономической информации на основе табличных процессоров
- 8.4. Технологии использования систем управления базами данных
- 7. 5. Сетевые компьютерные технологии
- 7.6. Компьютерные технологии распределенной обработки данных
- 7.7. Компьютерные технологии поиска документальной информации
- 7.8. Технологии интегрированных программных пакетов
- 7.9. Компьютерные технологии интеллектуальной поддержки управленческих решений
- Темы курсовых работ
- Информация как главное средство управления.
- Информационные ресурсы в предпринимательстве.
- Вопросы для подготовки к экзамену
- Литература