logo
администрирование в информационных системах

5. Службы контроля характеристик

Уровень обслуживания – это способность лиц, ответственных за информационные системы, постоянно поддерживать в этих системах максимальный уровень готовности и максимальное время наработки на отказ. Во многих фирмах уровень обслуживания понимают как гарантию и контроль качества ИС. Для обеспечения высокого уровня обслуживания необходимо, чтобы специалисты ИС постоянно следили за всей системой. Это необходимо для того, чтобы не пропустить сигналы о неполадках в ее работе. Обнаружение неполадок – это определение или прогнозирование тех мест в системе, где происходят отказы. В случае выявления отказа все усилия идут на выполнение аварийно-восстановительных работ. Согласно исследованиям фирмы Forrester Research на обнаружение неполадок используется около 40 % информационных ресурсов. Кроме того, 20 % ресурсов, имеющихся в распоряжении сотрудника, отвечающего за ИС, уходит на управление производительностью системы.

Разобраться в мониторинге производительности помогут три основных понятия: пропускная способность, очереди и время ответа.

Пропускная способность – это количество работы, сделанной в единицу времени. Пропускная способность возрастает, когда возрастает количество компонентов или уменьшается время выполнения задания. Пропускная способность зависит от ресурсов. Примерами ресурсов являются время и свободное пространство. Участок с самой медленной работой определяет пропускную способность всей системы. Пропускная способность является показателем производительности.

Очередь. Очереди образуются, если запросы на ресурсы неравномерно распределены во времени. Когда образуется очередь, считают, что образуется “узкое место”. Поиск узких мест в системе является главным в мониторинге производительности и выявлении неисправности, а также в обнаружении неполадок. Если узких мест нет, то систему можно считать здоровой. Но не исключается возможность скорого появления каких–либо узких мест.

Когда в компьютерных системах образуются очереди и узкие места, эти системы уже ни на что не реагируют. Новые запросы на ресурсы процессоров и дисков застопориваются. Когда не удовлетворяются запросы на какие–либо службы, работа информационной системы начинает разваливаться.

Время ответа – это количество времени, прошедшего между началом события (например, запросом на чтение) и ответом системы на него. При увеличении нагрузки на систему время ответа будет расти, потому что система реагирует на другие события и у нее недостаточно ресурсов для того, чтобы обработать новые запросы. Время ответа обычно находят, разделив длину очереди на пропускную способность ресурса.