logo search
Instrumentalnye_sredstva_informatsionnykh_siste

Отказоустойчивый кластер

Отказоустойчивым кластером (Failover Cluster) называют группу компьютеров, которая функционирует как единая система для обеспечения высокой доступности. Пользователь или программа видят такой кластер, как один виртуальный сервер. Когда кластеризованный ресурс на одном из узлов выходит из строя, управление им возлагается на другой сервер. При восстановлении ресурса исходный сервер возвращает себе функции управления и переходит в оперативный режим. Прелесть в том, что весь процесс восстановления после отказа полностью прозрачен для пользователей.

Чаще всего технология отказоустойчивых кластеров применяется для реализаций высоконагруженных Web-серверов, баз данных, файловых служб. Рассмотрим некоторые реализации подробнее.

Файловый кластер

Файловые серверы – это самый распространенный серверный функционал во всех организациях. Решение кластеризации файлового сервера позволяет минимизировать время недоступности файловых ресурсов по причине выхода из строя аппаратной части сервера. Отказоустойчивость достигается за счет физического разделения систем управления (серверов) и систем хранения информации (файловые хранилища).

Область приминения:

Функциональная схема:

Главным преимуществом использования файлового кластера является гарантированная реализация сервисов в масштабах предприятия. В отличие от отказоустойчивых RAID-массивов использование кластера дает гарантию от сбоев электронных компонентов сервера, например, при выходе из строя материнской платы.

Централизация файловых ресурсов в рамках одного отказоустойчивого файлового кластера позволяет избежать расходов на создание отдельных распределенных систем, а также снизить стоимость сопровождения и обслуживания.

Нередко возникает необходимость увеличения производительности серверов. Это означает необходимость миграции и продолжительного простоя. При использовании кластера миграцию выполнить намного легче и можно сделать это с минимальным временем простоя. В кластер добавляется новый узел, выполняется установка всех необходимых обновлений. Затем, с помощью процедуры перехода на резервный ресурс выполняется перенос сервера на новый узел, а старый исключается из кластера. Время простоя ограничивается временем перехода на резервный ресурс, т.е. занимает лишь несколько минут, вместо нескольких часов или даже нескольких суток без использования кластера.

Web-кластер

Решение для реализации балансировки нагрузки между несколькими web-узлами для повышения производительности и доступности данных. Основой решения является использование службы Network Load Balancing (NLB), позволяющей выполнять динамическое распределение поступающих сетевых запросов по различным узлам кластера.

Основная цель использования балансировки нагрузки – распределение сетевых запросов на различные узлы кластера с целью недопущения образования "узких мест", связанных с производительностью конкретного сервера. Доступ к информации при этом осуществляется по единому виртуальному адресу. Возможно динамическое добавление и удаление элементов кластера. В отличии от других технологий балансировки нагрузки, например, RRDNS, NLB, не допускает передачу запроса на вышедший из строя или не отвечающий на запросы сервер.

Использование данного вида кластеризации позволяет на порядок повысить не только доступность веб-узлов, но и скорость доступа к информации, которая на них находится.

Область применения:

Функциональная схема:

Главным преимуществом использования web-кластера является динамическое распределение нагрузки внутри серверной группы на основе загруженности основных серверных компонентов. Это позволяет создать систему высокой доступности, работающую в режиме 24/7. Часто в работе серверных интернет-приложений могут возникать ситуации с зависанием пользовательских сессий или длительностью выполнения операций с большим объемом отображаемых данных, в этом случае механизмы NLB начнут перенаправлять запросы на элементы кластера, где нагрузка минимальна. При этом все процессы происходят в считанные секунды и "прозрачны" для пользователя, который всегда будет использовать единый адрес web-узла вне зависимости от количества кластерных серверов в нем.

Кластер баз данных

Решение для повышения отказоустойчивости и доступности корпоративных информационных систем. Основой решения является программный продукт Microsoft Cluster Service (CS). Отказоустойчивость достигается за счет дублирования всех активных компонентов и встроенной системы мониторинга работоспособности.

Основная цель использования кластера – обеспечение высокой доступности базы данных. Сегодня для приложений всё чаще выдвигаются такие бизнес – требования, как обеспечение доступа к данным в режиме 24/7, и недоступность базы данных из-за выхода из строя оборудования или из-за необходимости выполнения операций по обслуживанию сервера часто просто недопустима. Использование кластера серверов баз данных может помочь предотвратить недоступность данных из-за выхода из строя сервера, вызванного сбоем в программном обеспечении, необходимостью выполнения операций по обслуживанию сервера или из-за потери сетевого соединения с сервером. Использование кластеризации позволяет повысить на порядок уровень доступности баз данных MS SQL Server и СУБД Oracle.

Область применения:

Решение идеально подходит для построения на его основе высокодоступных корпоративных систем управления, таких как различные конфигурации 1С, MS Dynamics NAV (Navision) и AХ (Axapta), Oracle E-Business Suite и прочих, включая системы собственной разработки, использующие MS SQL Server и СУБД Oracle.

Данное решение также может быть использовано для кластеризации различных серверных приложений и сервисов.

Функциональная схема:

В состав кластера входит два и более узлов (серверов), каждый из которых конфигурируется таким образом, чтобы приложение (в данном случае SQL Server) могло работать на любом из них. При этом само приложение виртуализируется, т.е. становится независимым от какого-либо узла. Обязательным условием является наличие общей для всех узлов системы хранения. Наиболее часто для этого используется архитектура SAN. Основное приложение и все необходимые для его работы ресурсы, такие как файловые ресурсы или сетевое подключение, определяются в общую кластерную группу. В случае недоступности одного из ресурсов кластерной группы управляющее приложение инициирует перевод работы основного приложения и всей кластерной группы на другой узел.

Для мониторинга состояния узлов кластер использует как открытую локальную, так и кластерную сеть. Каждые 5 секунд выполняется проверка LooksAlive (как живой), а каждые 60 секунд – более глубокая проверка IsAlive (действительно живой). В случае неуспешности проверка выполняется еще 5 раз, после чего кластер переведет группу на другой узел, передав другому серверу в монопольное владение все ресурсы данной группы. После того, как группа ресурсов будет передана, экземпляр SQL Server инициирует процедуру стартовой регенерации (recovery), после исполнения recovery для баз данных SQL Server переходит в состояние готовности к работе и обслуживанию запросов пользователей.

Пользовательские приложения должны будут выполнить повторное подключение к серверу баз данных. Приложение, которое соединяется с экземпляром SQL Server, использует виртуальный, а не физический IP - адрес. Фактическая принадлежность виртуального IP - адреса управляется кластером, поэтому приложение никогда не будет знать, на каком узле фактически находится адресуемый экземпляр.

Главным преимуществом от установки серверов баз данных в кластер является исключение длительного простоя в работе приложений, вызванного всевозможными отказами аппаратных средств, которые весьма вероятны для современных серверов, сложность которых постоянно растёт.

Нередко возникает необходимость увеличения производительности серверов. Это означает необходимость миграции и продолжительного простоя. При использовании кластера миграцию выполнить намного легче и с минимальным временем простоя. В кластер добавляется новый узел, выполняется установка всех необходимых обновлений. Затем с помощью процедуры перехода на резервный ресурс выполняется перенос сервера на новый узел, а старый исключается из кластера. Время простоя ограничивается временем перехода на резервный ресурс, т.е. лишь несколько минут, вместо нескольких часов или даже нескольких суток без использования кластера.