logo
УМК Стандартизация и сертификация ПО

4.3.1. Надежность

Надежность – свойство комплекса программ обеспечивать достаточно низкую вероятность потери работоспособности – отказа в процессе функционирования ПС в реальном времени.

Стандартом ISO 9126:2 рекомендуется анализировать и учитывать 4 субхарактеристики и до 16 количественных атрибутов надежности, в том числе степень покрытия тестами структуры программы. Надежность функционирования ПС наиболее полно характеризуется устойчивостью или способностью к безотказному функционированию и восстанавливаемостью работоспособного состояния после произошедших сбоев или отказов.

В свою очередь устойчивость зависит от уровня неустраненных дефектов и ошибок (завершенность) и способности ПС реагировать на их проявления так, чтобы это не отражалось на показателях надежности. Последние определяются эффективностью контроля данных, поступающих из внешней среды и от средств обнаружения аномалий функционирования ПС. В реальных условиях по различным причинам исходные данные могут попадать в области значений, не проверенные при разработке и испытаниях, а также не заданные требованиями спецификации и ТЗ, вызывающие сбои и отказы. При этом некорректная программа может функционировать совершенно надежно. Следовательно, надежность функционирования программ является понятием динамическим, проявляющимся во времени.

Завершенность – свойство ПС не попадать в состояние отказов вследствие ошибок и дефектов в программах и данных. Они могут быть обусловлены неполным тестовым покрытием при испытаниях компонентов и ПС в целом, а также недостаточной завершенностью их тестирования. Количество или плотность проявления скрытых и необнаруженных дефектов и ошибок непосредственно отражается на длительности нормального функционирования комплекса программ между сбоями или отказами. Завершенность можно характеризовать измеряемой обычно часами длительностью наработки на отказ при отсутствии автоматического восстановления – рестарта.

Устойчивость к дефектам и ошибкам – свойство ПС автоматически поддерживать заданный уровень качества функционирования в случаях проявления дефектов и ошибок или нарушения установленного интерфейса. Для этого в ПС должна вводиться временная, программная и информационная избыточность, реализующая оперативное обнаружение дефектов и ошибок функционирования, их идентификацию и автоматическое восстановление (рестарт) нормального функционирования ПС. Относительная доля вычислительных ресурсов, используемых непосредственно для быстрой ликвидации последствий отказов и оперативного восстановления нормального функционирования ПС (рестарт) отражается на повышении надежности программ. Наработка на отказ при наличии оперативного рестарта определяет значение устойчивости.

Восстанавливаемость – свойство ПС в случае отказа возобновлять требуемый уровень качества функционирования, а также поврежденные программы и данные. После отказа ПС иногда бывает неработоспособно в течение некоторого периода времени, продолжительность которого определяется его восстанавливаемостью. Для этого необходимы вычислительные ресурсы и время на выявление и прерывание неработоспособного состояния, диагностику причин отказа и на реализацию процессов восстановления.

Основными показателями процесса восстановления являются его длительность и вероятностные характеристики. Восстанавливаемость характеризуется также полнотой восстановления нормального функционирования программ в процессе ручного или автоматического их перезапуска – рестарта. Перезапуск должен обеспечивать возобновления нормального функционирования ПС. На это требуются ресурсы ЭВМ и время, которые можно характеризовать относительной величиной (% от общих ресурсов). Поэтому полнота и длительность восстановления после сбоев и отказов определяет надежность ПС и его функциональную пригодность для использования по прямому назначению.

Доступность или готовность – свойство ПС быть в состоянии выполнять требуемую функцию в данный момент времени при заданных условиях использования. Доступность может оцениваться относительным временем, в течение которого ПС находится в работоспособном состоянии, в пропорциях к общему времени применения. Следовательно, доступность – комбинация завершенности (от которой зависит частота отказов), устойчивости к ошибкам и восстанавливаемости, которые в совокупности обусловливают длительность простоя для рестарта после каждого отказа, а также длительности наработки на отказ. Для определения этой величины измеряется время работоспособного состояния комплекса программ между последовательными отказами. Обобщение характеристик отказов и восстановления производится в критерии коэффициент готовности. Этот показатель отражает вероятность иметь восстанавливаемые программы и данные в работоспособном состоянии в произвольный момент времени.

Нижняя граница шкалы атрибутов надежности в табл.4.2 отражена значениями, при которых резко уменьшается функциональная пригодность, а использование данного типа ПС становится неудобным, опасным или нерентабельным. Примером таких наихудших предельных величин для многих классов ПС могут быть наработка на отказ менее 10 часов, коэффициент готовности ниже 0,9 и время восстановления более 10 минут.

С другой стороны, наилучшие значения этих атрибутов практически ограничены теми ресурсами, которые могут быть выделены для их достижения при разработке и эксплуатации. Вычислительные и программные ресурсы объектной ЭВМ на непосредственное обеспечение надежности функционирования ПС обычно находятся в диапазоне от 10% до 90%. Даже для высоконадежных ПС редко наработка на отказ превышает несколько тысяч часов, коэффициент готовности не выше 0,999, а время восстановления при отказах не меньше нескольких секунд.

Перечисленные параметры для конкретных проектов могут выбираться в указанных диапазонах (табл.4.2) в зависимости от назначения и функций комплекса программ, приближаясь к их верхним или нижним границам с учетом влияния на функциональную пригодность и доступных ресурсов на поддержку надежности.

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4