Антонов

Формулировка теоремы Байеса для событий

При построении моделей систем важным вопросом является вопрос обеспечения адекватности модели и системы, для которой строится данная модель. От качества модели зависит достоверность результатов анализа, проводимого с помощью модели. Известен тезис системотехников и системных аналитиков: «Что в модель заложили, то и получили на выходе данной модели!». Одним из параметров, обеспечивающих качество модели, является точность задания показателей и характеристик составных частей модели, описывающих характер функционирования этих частей в процессе жизненного цикла системы и используемых в результате расчетов моделей.

Как уже отмечалось, выборки экспериментальных данных о функционировании анализируемых систем и их составных частей присутствуют в весьма ограниченном объеме. Поэтому, для получения оценок показателей объектов анализа с высокой степенью достоверности необходимо использовать дополнительную информацию. В качестве такого вида информации может применяться информация о функционировании объектов-аналогов, различного рода субъективная информация, учитывающая опыт и квалификацию персонала и т.п. Учет такой информации может быть осуществлен с помощью подхода, основанного на применении формулы Байеса.

В настоящее время перед исследователями стоит задача оценивания элементов и системы в целом с анализом точности и достоверности оценивания, построением доверительных интервалов на оценки.

Рассмотрим схему оценивания, согласно которой предполагается, что у исследователя имеется априорная информация об исследуемых показателях объектов-аналогов. Изложим метод, использующий фор

мулу Байеса и позволяющий проводить оценивание показателей элементов на основании текущей (эксплуатационной) информации с учетом результатов наблюдений, полученных на этапе априорных исследований объектов-аналогов. Байесовские методы находят широкое применение при решении задач оценивания показателей сложных систем.

Формула или теорема Байеса - одна из центральных теорем теории вероятностей. В настоящее время область применения этой теоремы чрезвычайно широка. Это и учет априорной информации в задачах оценивания и применение формулы в самообучающихся системах, в системах диагностики, и, наконец, в экспертных системах.

В простейшем случае формула выводится следующим образом. Пусть имеются два зависимых события А и В. По определению условной вероятности наступления события А при условии, что произошло событие В, имеем

P(AIB) = ^l, (8.1)

P(B)

где P(AB) - вероятность совместного наступления событий А и В; P(B)

вероятность события В.

Аналогично можно записать

P(BIA) = I^Q. (8.2)

P(A)

Определив из равенства (8.2) P(AB) и поставив данное значение в (8.1), получим простейший вариант формулы Байеса [40]

p_{a,b) = ^p^^p±^bL^a\

P(B)

Распространим данную формулу на группу несовместных событий A_i, / = 1, п ■ Пусть событие В может осуществиться С ОДНИМ И ТОЛЬКО

одним из п несовместных событий A_p т.е. B = J_tBA_i. Множество А об-

разует полную группу событий, т.е. J₁P(A₁) = I, BA. к BA - попарно

1*\

несовместимые события ДЛЯ любых I S= ITn , j = 1, п и і * j . Тогда для этих событий можно записать формулу полной вероятности

P(B) = JP(A_i)P(BIA_l).

/-і

Используя эту формулу и записав выражение (8.1), (8.2) для события А, получаем формулу Байеса в виде

^,B)= ртам,

JP(A_i)P(BlA_i) ⁽⁸'³⁾

/=1

Данная формула в теории вероятностей называется также формулой вероятности гипотез. Формула в виде (8.3) справедлива для событий.

Продемонстрируем возможность применения формулы Байеса в задачах, имеющих непосредственное отношение к задачам системного анализа и связанных с принятием решения. На предприятии (например АЭС) готовятся к проведению реконструкции. Для успешного проведения работ по реконструкции отдельных систем необходимо приобрести некоторое оборудование и поставить его вместо отработавшего свой ресурс. Естественно, что реконструкцию имеет смысл проводить только в том случае, если показатели надежности вновь поставляемого оборудования будут выше показателей надежности устройств, которые собираются заменить. Предприятию предлагают приобрести требуемое оборудование, причем завод-изготовитель утверждает, что показатели надежности находятся на достаточно высоком уровне. Например, утверждается, что вероятность безотказной работы (ВБР) изделия в течение требуемого времени не менее, чем P₃_и. Однако из опыта эксплуатации аналогичных устройств на других объектах известно, что показатель ВБР меньше, чем утверждает завод-изготовитель, и находится на уровне опытных значений P_on. Если надежность оборудования такая, как утверждает завод-изготовитель, то предприятию выгодно приобрести его и провести реконструкцию. Если же надежность такая, как сообщает предприятие, уже эксплуатирующее данное оборудование, то реконструкцию проводить нецелесообразно и, следовательно, покупать оборудование нет необходимости.

Пусть заказчик сомневается как в заявлении завода-изготовителя, так и в информации предприятия, эксплуатирующего устройства. (Если бы заказчик был уверен, что кто-то из них прав, то решение задачи было бы тривиально.) Заказчик может сформулировать свою неуверенность следующим образом: «Вероятность того, что прав завод-изготовитель, равна P₁; вероятность того, что верно заявление предприятия, равна P₂= 1-р,». Перед тем, как принять решение о покупке изделий, заказчик намерен провести их испытания. Пусть он провел испытания к изделий в течение времени T, в результате которых т изделий отказало.

Покажем, как сформулировать решение о приобретении устройств, учитывая информацию завода-изготовителя и предприятия, эксплуатирующего аналогичные устройства. Метод вычисления вероятностей, используемых при принятии решения, дает теорема Байеса. Вероятность того, что прав завод-изготовитель, при условии, что при испытании к устройств в течение времени T_p т из них отказало, равна

Р(р = Р_ЗК I отказало т из к устройств) =

_ Р(отказало т из к устройств /р = P_r_и)Р(р = P₃₁₁)

Р(отказало шиз к устройств)

Покажем, как определять величины, стоящие в данном выражении:

Р(отказало т из к устройств / р = P_sm) = С"(I- P₃ „)^т Р_ги'^т),

где С" - число сочетаний из т по к\ Pip -P₃J- первоначальное мнение заказчика о том, что информация завода-изготовителя верна - Pip = P₃_и) = р . Полная вероятность событий, состоящего в том, что отказало т устройств из к испытываемых, вычисляется следующим образом:

Р( отказало т из к устройств) =

= Р(отказало т из к устройств Ip = Р_зи)Р(р = P₃₁₁) +

+Р(отказало т из к устройств Ip = Р_оп)Р(р = P_on).

Здесь Р(отказало т из к устройств / P = P_on) = С” (I - P_on)" PJ*""";

PiP = P₀J = Pz=I-P_l. _w

Рассмотрим числовой пример решения задачи о целесообразности покупки оборудования. Пусть завод-изготовитель утверждает, что ВБР изделия равна 0,98. Предприятие, имеющее опыт эксплуатации указанных изделий, оценивает ВБР на уровне 0,9. Заказчик считает, что вероятность того, что завод-изготовитель верно оценил надежность оборудования, равна 0,4; вероятность того, что верно заявление предприятия, равна 0,6. Далее предприятие-заказчик производит испытания двух объектов в течение времени T и оба объекта за этот период отказывают.

Подсчитаем вероятность события, состоящего в том, что утверждение предприятия, эксплуатирующего аналогичные объекты, верно:

_D Р(отказало 2 из 2 / р = 0,9)Р{р = 0,9)

Р(р = 0,9 / отказало 2 из 2) = — —— -.

Р(отказало 2 из 2)

Произведем расчет каждого из сомножителей:

Р(отказало 2 из 2 / р = 0,9) = (1-0,9)² =0,01; Р(р = 0,9) = 0,6;

Р(отказало 2 из 2) = Р(отказало 2 из 2 Ip = 0,9)Р{р = 0,9) + +Р(отказало 2 из 2 / р = 0,98)Р(р = 0,98)

01-0,6 + 0,0004 • 0,4 = 0,006016.

Окончательно получаем

Р(р = 0,9 / отказало 2 из 2) = —_ 0,97.

0,006016

Таким образом, после проведения независимых испытаний можно принять решение о нецелесообразности закупки оборудования, так как с вероятностью 0,97 верны выводы предприятия, эксплуатирующего указанные объекты.

Другой возможный случай. Оба объекта успешно проходят испытания. Обратимся опять к формуле Байеса и посмотрим, как в этом случае изменится вероятность того, что оценки предприятия верны:

Р(отказов нет / р = 0,9)Р{р = 0,9)

Pip = 0,9 /отказов нет) = ,

Р(отказов нет)

где

Р(отказов нет/ р = 0,9) = 0,9² =0,81; Р{р = 0,9) = 0,6;

Р(отказов нет) = 0,81 ■ 0,6 + 0,9604 -0,4 - 0,87- Окончательно получаем

Pip =0,9/отказов нет) = = 0,56.

0,87

После проведения независимой серии испытаний, закончившихся успешно, вероятность того, что выводы предприятия, имеющего опыт эксплуатации, верны, несколько снизилась, а соответственно вероятность того, что верны утверждения завода-изготовителя, несколько возросла и стала равнар = 1 -р₂= 0,44. Однако значения данных вероятностей таковы, что по ним трудно принять решение и отдать предпочтение

237

выводам какого-либо партнера. Наилучшее решение в данном случае будет заключаться в продолжении испытаний объектов (если это экономически целесообразно).

Теорема Байеса для непрерывных случайных величин

Изложенный вариант теоремы Байеса предполагает простейшую схему оценивания показателей сложных систем. В данной схеме исследователь оперирует с точечными оценками показателей, не затрагивая вопросы точности их определения, доверия к полученному результату.

Рассмотрим более общий вариант теоремы Байеса, позволяющий применять ее для оценивания характеристик, определяемых по результатам наблюдения за реализациями непрерывных случайных величин. Введем ряд предположений.

Производятся наблюдения за непрерывной случайной величиной t є Т, имеющей распределение F(9, t). Функция Fj9, t) дифференцируема, т.е. существует плотность распределения случайной величины
Параметр 9 є 0 - число или вектор с заданной априорной плотностью распределения h(9).
Оценка d параметра 9 задана на множестве возможных решений

Функция потерь и(9, d) определена на (0, D) и выражает потери, обусловленные ошибочным решением.

В общем виде функция потерь выглядит следующим образом:

h(0,</) = A.(0)W(I</-0I), где H^x(O)=O; W(x) - монотонно возрастающая функция, х > 0; А,(9) - положительно определенная конечная функция.

Применяя формулу Байеса, можно записать выражение для апостериорной плотности распределения параметра 9 при условии, что в результате проведения опыта реализовалась случайная величина T [39]:

ЮТ». /«І~~КЄЖЄ~~).

|/({П,тЖ1)Л '•>

где h(9) - априорная плотность распределения искомого параметра 9, /({^>6}) - совместная плотность распределения величин T и 9.

Для определения оценки d параметра 9 введем апостериорную функцию риска:

Д(М) = р\.(0) W(I </(г)-01) h(Q/{T}) dQ.

При квадратичной функции потерь W (I d(t) - 01) = (d(t) - 0)² и X(Q) = 1 функция риска примет вид

R(Q, d) = j(d(t) - Qfh(QJ{T})dQ. (8.5)

Минимизируя данную функцию риска, определяем оценку параметра 9. Возьмем производную от функции (8.5) и приравняем ее нулю:

d(t)Jh(QI{T})dQ -JQh(Q/{T})dQ = 0 .

0 0

Значение jh(QI{T})dQ равно 1, так как представляет собой интеграл от плотности распределения по всей области определения параметра 9, тогда можно записать

d(t) = j6h(B/{T})de. (8.6)

Выражение для дисперсии оцениваемого параметра имеет вид

al=jQ²h(Q/{T})dQ-d²(t). (8.7)

В данных рассуждениях используется понятие априорной плотности распределения оцениваемого параметра. В общем случае обоснование вида априорной плотности является сложной задачей. При традиционном байесовском подходе априорная плотность распределения формируется исходя из опыта и научной интуиции исследователя. Сформированные таким образом суждения получили название субъективной вероятности [40, 41].

Схема проведения исследований при байесовском подходе следующая. Исследования проводит высококвалифицированный в данной области системных исследований специалист. До проведения испытаний у него сформировалось определенное мнение относительно предмета исследования. Исследователь проводит серию испытаний и в своем окончательном выводе учитывает как априорные суждения, сформулированные до испытаний, так и результаты проведенных экспериментов.

Априорная информация может быть сформирована на основании анализа коллективного мнения группы экспертов. При этом группа экспертов формируется из числа высококвалифицированных специалистов в области, к которой относятся организуемые исследования. В данном случае априорная информация будет более объективна, так как представляет собой результат обработки коллективного мнения специалистов.

Приведем пример оценивания показателей надежности элементов применительно к описанной схеме. Пусть в результате длительного опыта эксплуатации элемента в составе изделия у специалиста, обслуживающего данные изделия, имеется мнение, что надежность изделия достаточно высока.

Например, свое мнение он может выразить следующим образом: вероятность безотказной работы элемента за время его эксплуатации T (от одной плановой профилактики до другой) не менее некоторой величины р_и. Или же мнение может состоять в том, что ВБР за время T_p лежит в интервале (р_и, р_в). На указанном интервале значений ВБР (р_и, р_в) специалист не может выделить наиболее вероятное значение, т.е. можно сказать, что в данном интервале все значения р равновероятны. Тогда априорная плотность распределения

Kp) =

О при р < р_н\

при р_н <р<р„;

Р.~ Р«

О при р > p_s.

Пусть далее проводятся испытания по схеме Бернулли, в результате которых из к испытываемых элементов за время T_p отказывает т объектов. Вероятность события, происшедшего при испытаниях

fip/т,к) = С"р^к^т{\-р)^К

к\

где С” = —

т\(к-т)\

Подставляя данное выражение и выражение для априорной плотности распределения в формулу Байеса, получаем

число сочетаний из т по к.

\p'-(\-pydp

Байесовская оценка ВБР

Jp*~^m+I(l-p)^mdp

ВВЕДЕНИЕ 5

Содержание