106. Центр обработки данных. Ключевые характеристики цод. Управление цод.

Центр обработки данных (ЦОД) – совокупность спланированных определенным образом помещений, внешних площадок, инженерных систем обеспечения и обслуживающего персонала, образующая общее физическое пространство и технологическую среду для размещения серверного, вычислительного или иного оборудования для приема, передачи, хранения и обработки информации, а также обеспечивающая нужную степень готовности в заданном режиме функционирования.

Назначение ЦОД — обеспечение гарантированной безотказной работы информационной системы предприятия с заданными уровнями доступности, надежности, безопасности и управляемости. Использование технологии создания центров обработки данных позволяет создавать резервные штаб-квартиры предприятий с сохранением максимально возможной функциональности информационной системы при чрезвычайных обстоятельствах.

ЦОД должен обеспечивать безопасность бизнеса и минимизировать риски простоя, отвечая следующим требованиям:

Отказоустойчивость. Это свойство технической системы сохранять свою работоспособность после отказа одного или нескольких составных компонентов.
Высокая доступность. Это свойство системы определяет её надёжность, возможность выполнять требуемую функцию при заданных условиях в данный момент времени или в течение заданного интервала времени при соблюдении определенного набора условий.
Непрерывность бизнеса. Она включает в себя процессы и методы, направленные на обеспечение безостановочного выполнение критичных бизнес-функций.
Катастрофоустойчивость. Это способность к восстановлению после катастрофы т.е. устойчивость к воздействию аварий и природных катаклизмов.

Главная характеристика ЦОДа – отказоустойчивость, но не менее важными являются стоимость эксплуатации, показатель расхода электроэнергии и энергоэффективности (PUE). При определении требований к ЦОДу необходимо учитывать тенденции развития информационных систем и телекоммуникаций, предусмотреть варианты расширения мощностей ЦОДу в соответствии с планами развития предприятия.

Управление ЦОД:

Инвентаризация, визуализация и управление активами. Что имеется в ЦОД (монтажные шкафы, серверы, сетевое оборудование), как расположено оборудование, его параметры и характеристики.
Планирование изменений в ЦОД. Любое изменение в высоконагруженном ЦОД (установка нового шкафа, сервера, перемещение оборудования из шкафа в шкаф и т.д.) вызывает целый ряд проблем, связанных с определением возможности и осуществлением такого изменения. Очень много параметров влияют на решение – и наличие места в шкафу и наличие резерва электропитания, охлаждения.
Контроль и управление энергопотреблением ЦОД. Чем ближе измеритель потребляемой мощности к нагрузке, обеспечивающей работу ИТ сервиса и чем больше таких измерителей, тем точнее карта энергопотребления ЦОД. Точные данные по энергопотреблению позволяют рассчитывать коэффициенты энергоэффективности (например, PUE), планировать размещение ИТ активов, отслеживать тенденции.
Мониторинг рабочей среды серверных помещений и организация системы оповещения и противодействия в случаях аварийных ситуаций.
Обеспечение удаленного доступа к ИТ-оборудованию для оперативного управления и устранения проблем;
Мониторинг и управления критичной физической инфраструктурой в ЦОД, к которой можно отнести системы обеспечения бесперебойного питания (генераторы, ИБП), системы охлаждения и вентиляции.
Формализация регламентов по внесению изменений в ЦОД – позволяет точно описать логическую и временную схему заданий каждому сотруднику ЦОД для реализации какого-либо изменения в ЦОД (инсталляция, перенос, вывод из эксплуатации, и т.д.).

107. Хранение Данных. Информация и данные. Большие данные. Системы хранения данных. SAN. Эволюция архитектур хранения данных. Способы хранения данных. Компоненты дискового устройства. Физическая структуры диска. Производительность дискового устройства. Доступ хоста к системе хранения данных. Методы реализации RAID. Компоненты RAID массива. Техники RAID. FC SAN и ее компоненты. Компоненты NAS. Протоколы обеспечения разделяемого доступа к файлам в NAS. Реализации NAS.

Хранение данных - процесс обеспечения целостности, доступности и защищенности данных. Различают три режима хранения данных:

хранение в оперативном режиме, основанное на использовании постоянно доступных запоминающих устройств;
хранение в почти оперативном режиме, основанное на использовании устройств, которые могут стать доступными автоматически;
хранение в автономном режиме, основанное на использовании устройств, носители данных в которые вставляются вручную.

Данные — это совокупность сведений, зафиксированных на определённом носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация — это сведения об объектах и явлениях окружающего мира, уменьшающие степень неопределённости знаний об этих объектах или явлениях.

Большие данные — это совокупность технологий, которые призваны совершать три операции. Во-первых, обрабатывать бо́льшие по сравнению со «стандартными» сценариями объемы данных. Во-вторых, уметь работать с быстро поступающими данными в очень больших объемах. То есть данных не просто много, а их постоянно становится все больше и больше. В-третьих, они должны уметь работать со структурированными и плохо структурированными данными параллельно в разных аспектах. Большие данные предполагают, что на вход алгоритмы получают поток не всегда структурированной информации и что из него можно извлечь больше чем одну идею.

Система Хранения Данных (СХД) - это конгломерат специализированного оборудования и программного обеспечения, который предназначен для хранения и передачи больших массивов информации. Позволяет организовать хранение информации на дисковых площадках с оптимальным распределением ресурсов.

SAN (Storage Area Network) -- сеть хранения данных, представляющая собой решение для подключения устройств хранения данных (дисковых хранилищ, ленточных библиотек, оптические накопителей) к серверам таким образом, чтобы операционная система определила все подключённые внешние ресурсы как локальные.

Эволюция архитектур хранения данных: (по восходящей)

Сервер ---- Жесткий диск
Сервер ---- RAID-массив
Сервер 1 ---- RAID-массив ----Сервер 2
Много серверов ---- SAN ---- Система хранения данных
Много серверов ---- SAN ---- Система хранения данных ----Система резервного копирования

Существует три способа хранения цифровых данных:

Традиционный: «где-то у себя» – на дисках, лентах, локальных хранилищах
В публичных «облаках»: от таких гигантов, как Amazon, Microsoft и Google или от компаний поменьше;
В частных «облаках»: вариант, более характерный для корпоративного сегмента; хранилище входит в инфраструктуру компании и доступно только её сотрудникам.

Компоненты дискового устройства:

Типичный HDD состоит из одного или нескольких круглых дисков, называемых магнитными дисками. Магнитный диск представляет собой жесткий круглый диск, покрытый магнетиком с обеих сторон. Данные кодируются путем поляризации магнитной поверхности диска. Запись или считывание возможны с обеих сторон диска.

Шпиндель собирает все магнитные диски и подключается к двигателю. Двигатель шпинделя вращается с постоянной скоростью.

Головки чтения/записи, считывают и записывают данные на магнитном диске. У каждого магнитного диска две головки чтения/записи - по одной для каждой из сторон диска.

Головки чтения/записи крепятся к рычагу привода, размещающего головку чтения/записи на то место магнитного диска, где нужно считать или записать данные.

Контроллер - это печатная плата, расположенная в нижней части диска. Устройство состоит из микропроцессора, внутренней памяти, схем и встроенных программ.

Физическая структура диска.

Дорожка - зона для записи данных, к которой подводится головка считывания-записи.

Каждая дорожка делится на сектора. У диска на каждой дорожке одинаковое количество секторов. Нумерация секторов производится последовательно с 1 сектора нулевой дорожки до последнего сектора последней дорожки.

Цилиндр - так называют дорожки, расположенные на разных сторонах диска (для жестких дисков и на разных пластинах), но имеющие одинаковый радиус.

Производительность дискового устройства зависит от:

общее время задержки
скорость передачи данных
число дисковых операций

Доступ хоста к системе хранения данных:

Имеющиеся в системе диски можно разбивать на группы и объединять в RAID различных уровней. Получившееся дисковое делится на логические блоки – к ним получают доступ хосты и «видят» их как локальные жёсткие диски.

Методы реализации RAID:

Аппаратный дисковый массив состоит из нескольких жестких дисков, управляемых при помощи специальной платы контроллера RAID-массива.
Программный RAID-массив реализуется при помощи специального драйвера. В программный массив организуются дисковые разделы, которые могут занимать как весь диск, таки его часть. Программные RAID-массивы, как правило, менее надежны, чем аппаратные, но обеспечивают более высокую скорость работы с данными.

Компоненты RAID массива:

Массив RAID заключается корпус, который содержит ряд дисков и соответствующее аппаратное обеспечение для реализации RAID. Подмножество дисков в массиве RAID могут быть сгруппированы внутри массива RAID для формирования логических связей, называемых логическими массивами, также известными как RAID набор или RAID группа.

Техники RAID:

Используются три следующие технологии RAID:

Striping – Распределение/Чередование является технологией распределения данных по нескольким дискам (более одного), чтобы использовать диски параллельно

Mirroring – Зеркалирование. Это технология, в которой одни и те же данные хранятся на двух различных дисках, создавая две копии данных.

Parity – Контроль четности. Четность является методом для защиты распределенных данных от сбоя в работе накопителя без затрат зеркалирования. Добавляется дополнительный диск для хранения четности, математической конструкции, которая позволяет воссоздание недостающих данных.

FC SAN и ее компоненты.

Host Bus Adapters (HBA); НВА устанавливаются в серверы и осуществляют их взаимодействие с SAN по протоколу Fibre Channel.
Ресурсы хранения данных (например, дисковые массивы); устройств, реализующих инфраструктуру SAN (например, коммутаторы — FC-switch);
Программные обеспечения (например, драйверы устройств, менеджер томов — Volume Manager).

Компоненты NAS.

Основное конструктивное отличие NAS-серверов от универсальных серверов состоит в том, что в NAS-серверах есть только те компоненты, которые необходимы для их функционирования (например, им не нужны монитор, клавиатура или "мышь"). Основными компонентами NAS являются процессор и сетевой контроллер, от которых зависит скорость копирования и передачи данных по сети.

Протоколы обеспечения разделяемого доступа к файлам в NAS.

В число протоколов входят TCP/IP для передачи данных, SMB (CIFS), NFS и DAFS для удаленных файловых сервисов, а также NFS, SMB и FTP для совместного использования данных.

Реализации NAS.

Для подсоединения NAS-устройств к сети не требуется каких-либо специфических интерфейсов или специального «железа». Достаточно подключить Network Attached Storage к сети, как все его ресурсы становятся доступны для пользователей, у которых NAS появляется в виде дополнительных дисков.

108. Интеллектуальная система хранения данных. Ключевые компоненты. Техники управления и защиты кэша. Методы предоставления пространства для хранения данных. Типы интеллектуальных систем хранения данных.

Интеллектуальная система хранения данных.

Интеллектуальные системы хранения данных, представляют собой полнофункциональные RAID-массивы, обеспечивающие оптимизированные возможности обработки ввода/вывода. Эти массивы снабжены операционной средой, осуществляющей управление, распределение и использование ресурсов хранения. Такие системы хранения данных конфигурируются с большими объемами памяти, называемой кэш памятью, и используют сложные алгоритмы обработки вводов/выводов для приложений, для которых производительность систем является критичной.

Ключевые компоненты.

Интеллектуальная система хранения данных включает в себя следующие компоненты:

■Внешний блок обеспечивает интерфейс между системой хранения данных и хост-узлом. Этот блок состоит из внешних портов и внешних контроллеров.

■Кэш-память служит высокоскоростным буфером между хостом и физическим диском и должна обеспечивать минимальное время отклика.

■Внутренний блок обеспечивает интерфейс между кэшпамятью и физическими дисками, состоит из внутренних портов и контроллеров.

■Физические диски предназначены для постоянного хранения данных.

Техники управления и защиты кэша.

Кэш-память представляет собой полупроводниковую память, в которую временно помещаются данные для уменьшения времени, требуемого на обслуживание запросов ввода/вывода, полученных от хост-узла Операция записи с использованием кэш-памяти выполняется следующим образом.

■ Кэш с отложенной записью - Write-back cache : данные помещаются в кэш-память, и сразу же на хост-узел отправляется подтверждение. Позднее данные из нескольких запросов на запись переносятся (передаются) на диск. Реагирование на запрос на запись происходит гораздо быстрее, так как операции записи изолированы от механических задержек диска. Тем не менее существует риск, что не перенесенные данные могут быть потеряны в случае неисправности кэш-памяти.

■ Запись через кэш - Write-through cache: данные помещаются в кэш-память и немедленно записываются на диск с отправкой подтверждения на хост-узел. Так как данные переносятся на диск сразу после получения запроса, риск потери данных низкий, но реакция на запись длительнее из-за операций с диском.

Кэш является энергозависимой памятью и перебой в подаче питания или любой сбой в работе кэша может привести к потере данных, еще не переданных на диск. Этот риск потери не переданных данных, находящихся в кэш-памяти, может быть уменьшен при помощи зеркального кэширования и резервирования кэш-памяти.

■ Зеркальное кэширование: каждая запись в кэш-память хранится в двух разных ячейках памяти на двух независимых картах памяти. В случае сбоя в работе кэша данные для записи сохранятся в зеркально отображенной ячейке памяти и смогут быть переданы на диск. Что касается операции чтения, в случае сбоя в работе кэша данные могут быть снова вызваны с диска. Таким образом, зеркальному кэшированию подлежат только данные для записи, и этот метод позволяет более эффективно использовать доступный объем кэш-памяти.

■ Резервирование кэш-памяти: кэш-память подвергается риску потери не переданных на диск данных в случае перебоя в подаче питания. Эта проблема может быть решена различными способами: питанием памяти от батареи до восстановления подачи основного питания или использованием батареи для записи данных, находящихся в кэш-памяти, на диск. Производители систем хранения данных используют группу физических дисков для очистки кэш-памяти во время сбоя в подаче питания. Это называется кэш-резервированием, а диски — резервными дисками. При восстановлении подачи питания данные с этих дисков записываются обратно в кэш, а после этого — на диски назначения.

Методы предоставления пространства для хранения данных.

А) Традиционное обеспечение ресурсов хранения

В традиционной системе обеспечения хранения физические диски логически сгруппированы вместе на требуемом уровне RAID для формирования набора под названием RAID массив. Количество дисков в наборе RAID и уровень RAID определяются доступностью, мощностью и производительностью набора RAID. Настоятельно рекомендуется создавать множество RAID из дисков одного и того же типа, скорости и мощности, чтобы обеспечить максимальную полезную емкость, надежность и последовательности в исполнении.

Б) Виртуальное обеспечение ресурсов хранения

В виртуальной среде хоста LUN назначается гипервизору, который распознает LUN в качестве сырого диска. Этот диск конфигурируется с файловой системы гипервизора, а затем на нем создаются виртуальные диски. Виртуальные диски представляют собой файлы в файловой системе гипервизора. Виртуальные диски затем назначаются виртуальным машинам и появляются для них в виде сырых дисков дисков. Чтобы использовать виртуальный диск для виртуальной машины, выполняются аналогичные шаги как в невиртуальной среде. Здесь пространство LUN может быть доступно одновременно нескольким виртуальным машинам.

Типы интеллектуальных систем хранения данных.

Интеллектуальные системы хранения данных подразделяются на две категории:

■ Системы хранения среднего класса работают по схеме «активный-пассивный»

Системы хранения данных среднего класса, также называемые массивами ≪активный-пассивный», оптимально подходят для небольших и средних предприятий. В массиве ≪активный-пассивный≫ хост-узел может выполнить вводы/выводы логических устройств только по маршруту контроллера, к которому относится это логическое устройство.

■ Высокопроизводительные системы хранения данных работают по схеме «активный-активный»

≪активный-активный», как правило, предназначены для использования на крупных предприятиях для объединения корпоративных данных. Эти массивы снабжаются большим количеством контроллеров и большим объемом кэш-памяти . Массив ≪активный-активный≫ подразумевает, что хост-узел может выполнить вводы/выводы на свои LUN , используя любые имеющиеся пути доступа.

109. Понятие «непрерывность работы бизнеса» (business continuity (BC)) и «доступность информации» (information availability (IA)). Воздействие недоступности информации. Описать процесс планирования BC. Репликация.

Во второй половине 90-х на смену термину "аварийное восстановление" пришел термин "непрерывность бизнеса. Термин "аварийное восстановление" стал использоваться для описания традиционных информационно-технологических вопросов, связанных с резервным копированием и восстановлением данных, тогда как о "непрерывности бизнеса" говорят в связи с бесперебойной деятельностью всей организации, включая производственное оборудование, средства коммуникации и персонал.

Поскольку каждая компания уникальна, то в плане обеспечения непрерывности деятельности должны быть отражены ее особенности: ключевые бизнес-функции, время, необходимое на восстановление работы и обслуживание заказчиков Хороший план будет служить руководством к действию до, во время и после кризиса. Он должен быть составлен таким образом, чтобы ни один важный аспект не был упущен и даже неопытные служащие знали, где, как и чем они будут заниматься в критических ситуациях.

Наличие детального, регулярно испытываемого плана может оградить любую организацию от судебных исков по поводу халатности. Само существование плана послужит доказательством того, что руководство компании не пренебрегало подготовкой к бедствиям.

Составление детального плана обеспечения непрерывной деятельности позволит:

минимизировать потенциальные финансовые потери;
уменьшить юридическую ответственность;
сократить продолжительность сбоя нормальной работы;
быстро восстановить деятельность;
свести к минимуму суммы страховых выплат;
уменьшить нагрузку на ведущих сотрудников;
эффективнее защитить имущество;
обеспечить безопасность персонала и защититься от недобросовестных заказчиков и поставщиков продуктов и услуг;
соблюсти требования законов и инструкций;
уменьшить объем принятия решений во время бедствия

Доступность информации — состояние информации (ресурсов автоматизированной информационной системы), при котором субъекты, имеющие права доступа, могут реализовывать их беспрепятственно. К правам доступа относятся: право на чтение, изменение, хранение, копирование, уничтожение информации, а также права на изменение, использование, уничтожение ресурсов.

Воздействие недоступности информации:

В самом общем виде информационные барьеры делятся на объективные, т.е. возникающие и существующие независимо от человека, и субъективные. В свою очередь, последние можно разделить на:

а) барьеры, создаваемые источником

б) барьеры, возникающие за счёт приёмника информации.

Неосведомленность о наличии информации в конкретных проблемных областях;
Недоступность справочных изданий и баз данных требуемой проблемной ориентации;
Финансовые ограничения по поиску нужной информации;
Предоставление информации на носителях, которые не могут быть использованы данным пользователем;
Временными ограничениями на принятие решений (за время, имеющееся в распоряжении лица, принимающего решения, информация не может быть им получена и обработана);
Недостаток профессиональной подготовки, необходимой для использования предоставленной информации;
Режимные ограничения на доступ к конкретным информационным ресурсам;
Информационное прикрытие.

Описать процесс планирования BC.

Стадии планирования
Анализ последствий бедствий для деятельности организации	Выбор стратегии обеспечения бесперебойной деятельности	Составление, испытание и ведение плана
Этапы каждой стадии планирования
Оценка и управление риском	Разработка стратегий восстановления деятельности	Разработка и внедрение плана
Анализ последствий бедствий	Разработка и внедрение процедур реагирования	Разработка и реализация ознакомительной программы
Анализ результатов	Анализ результатов	Проведение учений

Репликация.

Репликация — механизм синхронизации содержимого нескольких копий объекта (например, содержимого базы данных). Репликация — это процесс, под которым понимается копирование данных из одного источника на другой (или на множество других) и наоборот.

При репликации изменения, сделанные в одной копии объекта, могут быть распространены в другие копии.

В случае синхронной репликации, если данная реплика обновляется, все другие реплики того же фрагмента данных также должны быть обновлены в одной и той же транзакции. Логически это означает, что существует лишь одна версия данных.

В случае асинхронной репликации обновление одной реплики распространяется на другие спустя некоторое время, а не в той же транзакции. Таким образом, при асинхронной репликации вводится задержка, или время ожидания, в течение которого отдельные реплики могут быть фактически неидентичными (то есть определение реплика оказывается не совсем подходящим, поскольку мы не имеем дело с точными и своевременно созданными копиями).

Содержание