logo
Антонов

Формулировка теоремы Байеса для событий

При построении моделей систем важным вопросом является воп­рос обеспечения адекватности модели и системы, для которой строит­ся данная модель. От качества модели зависит достоверность резуль­татов анализа, проводимого с помощью модели. Известен тезис сис­темотехников и системных аналитиков: «Что в модель заложили, то и получили на выходе данной модели!». Одним из параметров, обеспе­чивающих качество модели, является точность задания показателей и характеристик составных частей модели, описывающих характер фун­кционирования этих частей в процессе жизненного цикла системы и используемых в результате расчетов моделей.

Как уже отмечалось, выборки экспериментальных данных о фун­кционировании анализируемых систем и их составных частей присут­ствуют в весьма ограниченном объеме. Поэтому, для получения оце­нок показателей объектов анализа с высокой степенью достоверности необходимо использовать дополнительную информацию. В качестве такого вида информации может применяться информация о функциони­ровании объектов-аналогов, различного рода субъективная информация, учитывающая опыт и квалификацию персонала и т.п. Учет такой инфор­мации может быть осуществлен с помощью подхода, основанного на применении формулы Байеса.

В настоящее время перед исследователями стоит задача оценива­ния элементов и системы в целом с анализом точности и достовернос­ти оценивания, построением доверительных интервалов на оценки.

Рассмотрим схему оценивания, согласно которой предполагается, что у исследователя имеется априорная информация об исследуемых показателях объектов-аналогов. Изложим метод, использующий фор­

мулу Байеса и позволяющий проводить оценивание показателей элемен­тов на основании текущей (эксплуатационной) информации с учетом результатов наблюдений, полученных на этапе априорных исследований объектов-аналогов. Байесовские методы находят широкое применение при решении задач оценивания показателей сложных систем.

Формула или теорема Байеса - одна из центральных теорем теории вероятностей. В настоящее время область применения этой теоремы чрезвычайно широка. Это и учет априорной информации в задачах оце­нивания и применение формулы в самообучающихся системах, в сис­темах диагностики, и, наконец, в экспертных системах.

В простейшем случае формула выводится следующим образом. Пусть имеются два зависимых события А и В. По определению услов­ной вероятности наступления события А при условии, что произошло событие В, имеем

P(AIB) = ^l, (8.1)

P(B)

где P(AB) - вероятность совместного наступления событий А и В; P(B)

Аналогично можно записать

P(BIA) = I^Q. (8.2)

P(A)

Определив из равенства (8.2) P(AB) и поставив данное значение в (8.1), получим простейший вариант формулы Байеса [40]

p{a,b) = p^p±bLa\

P(B)

Распространим данную формулу на группу несовместных событий Ai, / = 1, п Пусть событие В может осуществиться С ОДНИМ И ТОЛЬКО

п

одним из п несовместных событий Ap т.е. B = JtBAi. Множество А об-

п

разует полную группу событий, т.е. J1P(A1) = I, BA. к BA - попарно

1*\

несовместимые события ДЛЯ любых I S= ITn , j = 1, п и і * j . Тогда для этих событий можно записать формулу полной вероятности

P(B) = JP(Ai)P(BIAl).

/-і

Используя эту формулу и записав выражение (8.1), (8.2) для собы­тия А, получаем формулу Байеса в виде

^,B)= ртам,

JP(Ai)P(BlAi) (8'3)

/=1

Данная формула в теории вероятностей называется также форму­лой вероятности гипотез. Формула в виде (8.3) справедлива для собы­тий.

Продемонстрируем возможность применения формулы Байеса в задачах, имеющих непосредственное отношение к задачам системно­го анализа и связанных с принятием решения. На предприятии (напри­мер АЭС) готовятся к проведению реконструкции. Для успешного про­ведения работ по реконструкции отдельных систем необходимо приоб­рести некоторое оборудование и поставить его вместо отработавшего свой ресурс. Естественно, что реконструкцию имеет смысл проводить только в том случае, если показатели надежности вновь поставляемо­го оборудования будут выше показателей надежности устройств, кото­рые собираются заменить. Предприятию предлагают приобрести тре­буемое оборудование, причем завод-изготовитель утверждает, что по­казатели надежности находятся на достаточно высоком уровне. Напри­мер, утверждается, что вероятность безотказной работы (ВБР) изде­лия в течение требуемого времени не менее, чем P3 и. Однако из опыта эксплуатации аналогичных устройств на других объектах известно, что показатель ВБР меньше, чем утверждает завод-изготовитель, и нахо­дится на уровне опытных значений Pon. Если надежность оборудования такая, как утверждает завод-изготовитель, то предприятию выгодно приобрести его и провести реконструкцию. Если же надежность такая, как сообщает предприятие, уже эксплуатирующее данное оборудова­ние, то реконструкцию проводить нецелесообразно и, следовательно, покупать оборудование нет необходимости.

Пусть заказчик сомневается как в заявлении завода-изготовителя, так и в информации предприятия, эксплуатирующего устройства. (Если бы заказчик был уверен, что кто-то из них прав, то решение задачи было бы тривиально.) Заказчик может сформулировать свою неуверенность следующим образом: «Вероятность того, что прав завод-изготовитель, равна P1; вероятность того, что верно заявление предприятия, равна P2= 1-р,». Перед тем, как принять решение о покупке изделий, заказ­чик намерен провести их испытания. Пусть он провел испытания к из­делий в течение времени T, в результате которых т изделий отказало.

Покажем, как сформулировать решение о приобретении устройств, учитывая информацию завода-изготовителя и предприятия, эксплуати­рующего аналогичные устройства. Метод вычисления вероятностей, используемых при принятии решения, дает теорема Байеса. Вероят­ность того, что прав завод-изготовитель, при условии, что при испыта­нии к устройств в течение времени Tp т из них отказало, равна

Р(р = РЗК I отказало т из к устройств) =

_ Р(отказало т из к устройств /р = Prи= P311)

Р(отказало шиз к устройств)

Покажем, как определять величины, стоящие в данном выражении:

Р(отказало т из к устройств / р = Psm) = С"(I- P3)т Рги'т),

где С" - число сочетаний из т по к\ Pip -P3J- первоначальное мне­ние заказчика о том, что информация завода-изготовителя верна - Pip = P3 и) = р . Полная вероятность событий, состоящего в том, что отказало т устройств из к испытываемых, вычисляется следующим об­разом:

Р( отказало т из к устройств) =

= Р(отказало т из к устройств Ip = Рзи)Р(р = P311) +

+Р(отказало т из к устройств Ip = Роп(р = Pon).

Здесь Р(отказало т из к устройств / P = Pon) = С” (I - Pon)" PJ*""";

PiP = P0J = Pz=I-Pl. w

Рассмотрим числовой пример решения задачи о целесообразности покупки оборудования. Пусть завод-изготовитель утверждает, что ВБР изделия равна 0,98. Предприятие, имеющее опыт эксплуатации указан­ных изделий, оценивает ВБР на уровне 0,9. Заказчик считает, что веро­ятность того, что завод-изготовитель верно оценил надежность обору­дования, равна 0,4; вероятность того, что верно заявление предприятия, равна 0,6. Далее предприятие-заказчик производит испытания двух объектов в течение времени T и оба объекта за этот период отказыва­ют.

Подсчитаем вероятность события, состоящего в том, что утверж­дение предприятия, эксплуатирующего аналогичные объекты, верно:

D Р(отказало 2 из 2 / р = 0,9)Р{р = 0,9)

Р(р = 0,9 / отказало 2 из 2) = — —— -.

Р(отказало 2 из 2)

Произведем расчет каждого из сомножителей:

Р(отказало 2 из 2 / р = 0,9) = (1-0,9)2 =0,01; Р(р = 0,9) = 0,6;

Р(отказало 2 из 2) = Р(отказало 2 из 2 Ip = 0,9)Р{р = 0,9) + +Р(отказало 2 из 2 / р = 0,98)Р(р = 0,98)

  1. 01-0,6 + 0,0004 • 0,4 = 0,006016.

Окончательно получаем

Р = 0,9 / отказало 2 из 2) = _ 0,97.

0,006016

Таким образом, после проведения независимых испытаний можно принять решение о нецелесообразности закупки оборудования, так как с вероятностью 0,97 верны выводы предприятия, эксплуатирующего указанные объекты.

Другой возможный случай. Оба объекта успешно проходят испы­тания. Обратимся опять к формуле Байеса и посмотрим, как в этом случае изменится вероятность того, что оценки предприятия верны:

Р(отказов нет / р = 0,9)Р{р = 0,9)

Pip = 0,9 /отказов нет) = ,

Р(отказов нет)

где

Р(отказов нет/ р = 0,9) = 0,92 =0,81; Р{р = 0,9) = 0,6;

Р(отказов нет) = 0,81 ■ 0,6 + 0,9604 -0,4 - 0,87- Окончательно получаем

Pip =0,9/отказов нет) = = 0,56.

0,87

После проведения независимой серии испытаний, закончившихся успешно, вероятность того, что выводы предприятия, имеющего опыт эксплуатации, верны, несколько снизилась, а соответственно вероятность того, что верны утверждения завода-изготовителя, несколько возросла и стала равнар = 1 -р2= 0,44. Однако значения данных вероятностей таковы, что по ним трудно принять решение и отдать предпочтение

237

выводам какого-либо партнера. Наилучшее решение в данном случае будет заключаться в продолжении испытаний объектов (если это эко­номически целесообразно).

  1. Теорема Байеса для непрерывных случайных величин

Изложенный вариант теоремы Байеса предполагает простейшую схему оценивания показателей сложных систем. В данной схеме иссле­дователь оперирует с точечными оценками показателей, не затрагивая вопросы точности их определения, доверия к полученному результату.

Рассмотрим более общий вариант теоремы Байеса, позволяющий применять ее для оценивания характеристик, определяемых по резуль­татам наблюдения за реализациями непрерывных случайных величин. Введем ряд предположений.

  1. Производятся наблюдения за непрерывной случайной величиной t є Т, имеющей распределение F(9, t). Функция Fj9, t) дифференцируе­ма, т.е. существует плотность распределения случайной величины

  2. Параметр 9 є 0 - число или вектор с заданной априорной плот­ностью распределения h(9).

  3. Оценка d параметра 9 задана на множестве возможных решений

D.

  1. Функция потерь и(9, d) определена на (0, D) и выражает потери, обусловленные ошибочным решением.

В общем виде функция потерь выглядит следующим образом:

h(0,</) = A.(0)W(I</-0I), где Hx(O)=O; W(x) - монотонно возрастающая функция, х > 0; А,(9) - по­ложительно определенная конечная функция.

Применяя формулу Байеса, можно записать выражение для апос­териорной плотности распределения параметра 9 при условии, что в результате проведения опыта реализовалась случайная величина T [39]:

ЮТ». ІКЄЖЄ).

|/({П,тЖ1'•>

О

где h(9) - априорная плотность распределения искомого параметра 9, /({^>6}) - совместная плотность распределения величин T и 9.

Для определения оценки d параметра 9 введем апостериорную функцию риска:

Д(М) = р\.(0) W(I </(г)-01) h(Q/{T}) dQ.

0

При квадратичной функции потерь W (I d(t) - 01) = (d(t) - 0)2 и X(Q) = 1 функция риска примет вид

R(Q, d) = j(d(t) - Qfh(QJ{T})dQ. (8.5)

0

Минимизируя данную функцию риска, определяем оценку парамет­ра 9. Возьмем производную от функции (8.5) и приравняем ее нулю:

d(t)Jh(QI{T})dQ -JQh(Q/{T})dQ = 0 .

0 0

Значение jh(QI{T})dQ равно 1, так как представляет собой интег­рал от плотности распределения по всей области определения параметра 9, тогда можно записать

d(t) = j6h(B/{T})de. (8.6)

0

Выражение для дисперсии оцениваемого параметра имеет вид

al=jQ2h(Q/{T})dQ-d2(t). (8.7)

є

В данных рассуждениях используется понятие априорной плотнос­ти распределения оцениваемого параметра. В общем случае обосно­вание вида априорной плотности является сложной задачей. При тра­диционном байесовском подходе априорная плотность распределения формируется исходя из опыта и научной интуиции исследователя. Сфор­мированные таким образом суждения получили название субъективной вероятности [40, 41].

Схема проведения исследований при байесовском подходе следу­ющая. Исследования проводит высококвалифицированный в данной области системных исследований специалист. До проведения испыта­ний у него сформировалось определенное мнение относительно пред­мета исследования. Исследователь проводит серию испытаний и в сво­ем окончательном выводе учитывает как априорные суждения, сфор­мулированные до испытаний, так и результаты проведенных экспери­ментов.

Априорная информация может быть сформирована на основании анализа коллективного мнения группы экспертов. При этом группа экс­пертов формируется из числа высококвалифицированных специалистов в области, к которой относятся организуемые исследования. В данном случае априорная информация будет более объективна, так как пред­ставляет собой результат обработки коллективного мнения специалис­тов.

Приведем пример оценивания показателей надежности элементов применительно к описанной схеме. Пусть в результате длительного опыта эксплуатации элемента в составе изделия у специалиста, обслу­живающего данные изделия, имеется мнение, что надежность изделия достаточно высока.

Например, свое мнение он может выразить следующим образом: вероятность безотказной работы элемента за время его эксплуатации T (от одной плановой профилактики до другой) не менее некоторой величины ри. Или же мнение может состоять в том, что ВБР за время Tp лежит в интервале (ри, рв). На указанном интервале значений ВБР (ри, рв) специалист не может выделить наиболее вероятное значение, т.е. можно сказать, что в данном интервале все значения р равноверо­ятны. Тогда априорная плотность распределения

Kp) =

О при р < рн\

1

при рн <р<р„;

Р.~ Р«

О при р > ps.

Пусть далее проводятся испытания по схеме Бернулли, в результа­те которых из к испытываемых элементов за время Tp отказывает т объектов. Вероятность события, происшедшего при испытаниях

fip/т,к) = С"рк т{\-р)К

к\

где С = —

т\(к-т)\

Подставляя данное выражение и выражение для априорной плотно­сти распределения в формулу Байеса, получаем

\p'-(\-pydp

Pb

Байесовская оценка ВБР

Jp*~m+I(l-p)mdp

ВВЕДЕНИЕ 5