Формулировка теоремы Байеса для событий
При построении моделей систем важным вопросом является вопрос обеспечения адекватности модели и системы, для которой строится данная модель. От качества модели зависит достоверность результатов анализа, проводимого с помощью модели. Известен тезис системотехников и системных аналитиков: «Что в модель заложили, то и получили на выходе данной модели!». Одним из параметров, обеспечивающих качество модели, является точность задания показателей и характеристик составных частей модели, описывающих характер функционирования этих частей в процессе жизненного цикла системы и используемых в результате расчетов моделей.
Как уже отмечалось, выборки экспериментальных данных о функционировании анализируемых систем и их составных частей присутствуют в весьма ограниченном объеме. Поэтому, для получения оценок показателей объектов анализа с высокой степенью достоверности необходимо использовать дополнительную информацию. В качестве такого вида информации может применяться информация о функционировании объектов-аналогов, различного рода субъективная информация, учитывающая опыт и квалификацию персонала и т.п. Учет такой информации может быть осуществлен с помощью подхода, основанного на применении формулы Байеса.
В настоящее время перед исследователями стоит задача оценивания элементов и системы в целом с анализом точности и достоверности оценивания, построением доверительных интервалов на оценки.
Рассмотрим схему оценивания, согласно которой предполагается, что у исследователя имеется априорная информация об исследуемых показателях объектов-аналогов. Изложим метод, использующий фор
мулу Байеса и позволяющий проводить оценивание показателей элементов на основании текущей (эксплуатационной) информации с учетом результатов наблюдений, полученных на этапе априорных исследований объектов-аналогов. Байесовские методы находят широкое применение при решении задач оценивания показателей сложных систем.
Формула или теорема Байеса - одна из центральных теорем теории вероятностей. В настоящее время область применения этой теоремы чрезвычайно широка. Это и учет априорной информации в задачах оценивания и применение формулы в самообучающихся системах, в системах диагностики, и, наконец, в экспертных системах.
В простейшем случае формула выводится следующим образом. Пусть имеются два зависимых события А и В. По определению условной вероятности наступления события А при условии, что произошло событие В, имеем
P(AIB) = ^l, (8.1)
P(B)
где P(AB) - вероятность совместного наступления событий А и В; P(B)
вероятность события В.
Аналогично можно записать
P(BIA) = I^Q. (8.2)
P(A)
Определив из равенства (8.2) P(AB) и поставив данное значение в (8.1), получим простейший вариант формулы Байеса [40]
p{a,b) = p^p±bLa\
P(B)
Распространим данную формулу на группу несовместных событий Ai, / = 1, п ■ Пусть событие В может осуществиться С ОДНИМ И ТОЛЬКО
п
одним из п несовместных событий Ap т.е. B = JtBAi. Множество А об-
п
разует полную группу событий, т.е. J1P(A1) = I, BA. к BA - попарно
1*\
несовместимые события ДЛЯ любых I S= ITn , j = 1, п и і * j . Тогда для этих событий можно записать формулу полной вероятности
P(B) = JP(Ai)P(BIAl).
/-і
Используя эту формулу и записав выражение (8.1), (8.2) для события А, получаем формулу Байеса в виде
^,B)= ртам,
JP(Ai)P(BlAi) (8'3)
/=1
Данная формула в теории вероятностей называется также формулой вероятности гипотез. Формула в виде (8.3) справедлива для событий.
Продемонстрируем возможность применения формулы Байеса в задачах, имеющих непосредственное отношение к задачам системного анализа и связанных с принятием решения. На предприятии (например АЭС) готовятся к проведению реконструкции. Для успешного проведения работ по реконструкции отдельных систем необходимо приобрести некоторое оборудование и поставить его вместо отработавшего свой ресурс. Естественно, что реконструкцию имеет смысл проводить только в том случае, если показатели надежности вновь поставляемого оборудования будут выше показателей надежности устройств, которые собираются заменить. Предприятию предлагают приобрести требуемое оборудование, причем завод-изготовитель утверждает, что показатели надежности находятся на достаточно высоком уровне. Например, утверждается, что вероятность безотказной работы (ВБР) изделия в течение требуемого времени не менее, чем P3 и. Однако из опыта эксплуатации аналогичных устройств на других объектах известно, что показатель ВБР меньше, чем утверждает завод-изготовитель, и находится на уровне опытных значений Pon. Если надежность оборудования такая, как утверждает завод-изготовитель, то предприятию выгодно приобрести его и провести реконструкцию. Если же надежность такая, как сообщает предприятие, уже эксплуатирующее данное оборудование, то реконструкцию проводить нецелесообразно и, следовательно, покупать оборудование нет необходимости.
Пусть заказчик сомневается как в заявлении завода-изготовителя, так и в информации предприятия, эксплуатирующего устройства. (Если бы заказчик был уверен, что кто-то из них прав, то решение задачи было бы тривиально.) Заказчик может сформулировать свою неуверенность следующим образом: «Вероятность того, что прав завод-изготовитель, равна P1; вероятность того, что верно заявление предприятия, равна P2= 1-р,». Перед тем, как принять решение о покупке изделий, заказчик намерен провести их испытания. Пусть он провел испытания к изделий в течение времени T, в результате которых т изделий отказало.
Покажем, как сформулировать решение о приобретении устройств, учитывая информацию завода-изготовителя и предприятия, эксплуатирующего аналогичные устройства. Метод вычисления вероятностей, используемых при принятии решения, дает теорема Байеса. Вероятность того, что прав завод-изготовитель, при условии, что при испытании к устройств в течение времени Tp т из них отказало, равна
Р(р = РЗК I отказало т из к устройств) =
_ Р(отказало т из к устройств /р = Prи)Р(р = P311)
Р(отказало шиз к устройств)
Покажем, как определять величины, стоящие в данном выражении:
Р(отказало т из к устройств / р = Psm) = С"(I- P3 „)т Рги'т),
где С" - число сочетаний из т по к\ Pip -P3J- первоначальное мнение заказчика о том, что информация завода-изготовителя верна - Pip = P3 и) = р . Полная вероятность событий, состоящего в том, что отказало т устройств из к испытываемых, вычисляется следующим образом:
Р( отказало т из к устройств) =
= Р(отказало т из к устройств Ip = Рзи)Р(р = P311) +
+Р(отказало т из к устройств Ip = Роп)Р(р = Pon).
Здесь Р(отказало т из к устройств / P = Pon) = С” (I - Pon)" PJ*""";
PiP = P0J = Pz=I-Pl. w
Рассмотрим числовой пример решения задачи о целесообразности покупки оборудования. Пусть завод-изготовитель утверждает, что ВБР изделия равна 0,98. Предприятие, имеющее опыт эксплуатации указанных изделий, оценивает ВБР на уровне 0,9. Заказчик считает, что вероятность того, что завод-изготовитель верно оценил надежность оборудования, равна 0,4; вероятность того, что верно заявление предприятия, равна 0,6. Далее предприятие-заказчик производит испытания двух объектов в течение времени T и оба объекта за этот период отказывают.
Подсчитаем вероятность события, состоящего в том, что утверждение предприятия, эксплуатирующего аналогичные объекты, верно:
D Р(отказало 2 из 2 / р = 0,9)Р{р = 0,9)
Р(р = 0,9 / отказало 2 из 2) = — —— -.
Р(отказало 2 из 2)
Произведем расчет каждого из сомножителей:
Р(отказало 2 из 2 / р = 0,9) = (1-0,9)2 =0,01; Р(р = 0,9) = 0,6;
Р(отказало 2 из 2) = Р(отказало 2 из 2 Ip = 0,9)Р{р = 0,9) + +Р(отказало 2 из 2 / р = 0,98)Р(р = 0,98)
01-0,6 + 0,0004 • 0,4 = 0,006016.
Окончательно получаем
Р(р = 0,9 / отказало 2 из 2) = —_ 0,97.
0,006016
Таким образом, после проведения независимых испытаний можно принять решение о нецелесообразности закупки оборудования, так как с вероятностью 0,97 верны выводы предприятия, эксплуатирующего указанные объекты.
Другой возможный случай. Оба объекта успешно проходят испытания. Обратимся опять к формуле Байеса и посмотрим, как в этом случае изменится вероятность того, что оценки предприятия верны:
Р(отказов нет / р = 0,9)Р{р = 0,9)
Pip = 0,9 /отказов нет) = ,
Р(отказов нет)
где
Р(отказов нет/ р = 0,9) = 0,92 =0,81; Р{р = 0,9) = 0,6;
Р(отказов нет) = 0,81 ■ 0,6 + 0,9604 -0,4 - 0,87- Окончательно получаем
Pip =0,9/отказов нет) = = 0,56.
0,87
После проведения независимой серии испытаний, закончившихся успешно, вероятность того, что выводы предприятия, имеющего опыт эксплуатации, верны, несколько снизилась, а соответственно вероятность того, что верны утверждения завода-изготовителя, несколько возросла и стала равнар = 1 -р2= 0,44. Однако значения данных вероятностей таковы, что по ним трудно принять решение и отдать предпочтение
237
выводам какого-либо партнера. Наилучшее решение в данном случае будет заключаться в продолжении испытаний объектов (если это экономически целесообразно).
Теорема Байеса для непрерывных случайных величин
Изложенный вариант теоремы Байеса предполагает простейшую схему оценивания показателей сложных систем. В данной схеме исследователь оперирует с точечными оценками показателей, не затрагивая вопросы точности их определения, доверия к полученному результату.
Рассмотрим более общий вариант теоремы Байеса, позволяющий применять ее для оценивания характеристик, определяемых по результатам наблюдения за реализациями непрерывных случайных величин. Введем ряд предположений.
Производятся наблюдения за непрерывной случайной величиной t є Т, имеющей распределение F(9, t). Функция Fj9, t) дифференцируема, т.е. существует плотность распределения случайной величины
Параметр 9 є 0 - число или вектор с заданной априорной плотностью распределения h(9).
Оценка d параметра 9 задана на множестве возможных решений
D.
Функция потерь и(9, d) определена на (0, D) и выражает потери, обусловленные ошибочным решением.
В общем виде функция потерь выглядит следующим образом:
h(0,</) = A.(0)W(I</-0I), где Hx(O)=O; W(x) - монотонно возрастающая функция, х > 0; А,(9) - положительно определенная конечная функция.
Применяя формулу Байеса, можно записать выражение для апостериорной плотности распределения параметра 9 при условии, что в результате проведения опыта реализовалась случайная величина T [39]:
ЮТ». /«ІКЄЖЄ).
|/({П,тЖ1)Л '•>
О
где h(9) - априорная плотность распределения искомого параметра 9, /({^>6}) - совместная плотность распределения величин T и 9.
Для определения оценки d параметра 9 введем апостериорную функцию риска:
Д(М) = р\.(0) W(I </(г)-01) h(Q/{T}) dQ.
0
При квадратичной функции потерь W (I d(t) - 01) = (d(t) - 0)2 и X(Q) = 1 функция риска примет вид
R(Q, d) = j(d(t) - Qfh(QJ{T})dQ. (8.5)
0
Минимизируя данную функцию риска, определяем оценку параметра 9. Возьмем производную от функции (8.5) и приравняем ее нулю:
d(t)Jh(QI{T})dQ -JQh(Q/{T})dQ = 0 .
0 0
Значение jh(QI{T})dQ равно 1, так как представляет собой интеграл от плотности распределения по всей области определения параметра 9, тогда можно записать
d(t) = j6h(B/{T})de. (8.6)
0
Выражение для дисперсии оцениваемого параметра имеет вид
al=jQ2h(Q/{T})dQ-d2(t). (8.7)
є
В данных рассуждениях используется понятие априорной плотности распределения оцениваемого параметра. В общем случае обоснование вида априорной плотности является сложной задачей. При традиционном байесовском подходе априорная плотность распределения формируется исходя из опыта и научной интуиции исследователя. Сформированные таким образом суждения получили название субъективной вероятности [40, 41].
Схема проведения исследований при байесовском подходе следующая. Исследования проводит высококвалифицированный в данной области системных исследований специалист. До проведения испытаний у него сформировалось определенное мнение относительно предмета исследования. Исследователь проводит серию испытаний и в своем окончательном выводе учитывает как априорные суждения, сформулированные до испытаний, так и результаты проведенных экспериментов.
Априорная информация может быть сформирована на основании анализа коллективного мнения группы экспертов. При этом группа экспертов формируется из числа высококвалифицированных специалистов в области, к которой относятся организуемые исследования. В данном случае априорная информация будет более объективна, так как представляет собой результат обработки коллективного мнения специалистов.
Приведем пример оценивания показателей надежности элементов применительно к описанной схеме. Пусть в результате длительного опыта эксплуатации элемента в составе изделия у специалиста, обслуживающего данные изделия, имеется мнение, что надежность изделия достаточно высока.
Например, свое мнение он может выразить следующим образом: вероятность безотказной работы элемента за время его эксплуатации T (от одной плановой профилактики до другой) не менее некоторой величины ри. Или же мнение может состоять в том, что ВБР за время Tp лежит в интервале (ри, рв). На указанном интервале значений ВБР (ри, рв) специалист не может выделить наиболее вероятное значение, т.е. можно сказать, что в данном интервале все значения р равновероятны. Тогда априорная плотность распределения
Kp) =
1
при рн <р<р„;
Р.~ Р«
О при р > ps.
Пусть далее проводятся испытания по схеме Бернулли, в результате которых из к испытываемых элементов за время Tp отказывает т объектов. Вероятность события, происшедшего при испытаниях
fip/т,к) = С"рк т{\-р)К
к\
где С” = —
т\(к-т)\
Подставляя данное выражение и выражение для априорной плотности распределения в формулу Байеса, получаем
число сочетаний из т по к.
\p'-(\-pydp
Pb
Байесовская оценка ВБР
Jp*~m+I(l-p)mdp
ВВЕДЕНИЕ 5
- Введение
- Глава I определениясистемного анализа
- Системность - общее свойство материи
- Определения системного анализа
- Понятие сложной системы
- Характеристика задач системного анализа
- Особенности задач системного анализа
- Глава 2 характеристика этапов системного анализа
- Процедуры системного анализа
- Анализ структуры системы
- Построение моделей систем
- Исследование ресурсных возможностей
- Определение целей системного анализа
- Формирование критериев
- Генерирование альтернатив
- Реализация выбора и принятия решений
- Внедрение результатов анализа
- Глава 3 построение моделей систем
- Понятие модели системы
- Агрегирование - метод обобщения моделей
- Глава 4 имитационное моделирование - метод проведения системных исследований
- Сущность имитационного моделирования
- Композиция дискретных систем
- Содержательное описание сложной системы
- Глава 5 теория подобия - методология обоснования применения моделей
- Модели и виды подобия
- Основные понятия физического подобия
- Элементы статистической теории подобия
- Глава 6 эксперимент - средство построения модели
- Характеристика эксперимента
- Обработка экспериментальных данных
- Глава 7 параметрические методы обработки экспериментальной информации
- 7.1. Оценивание показателей систем и определениеихточности
- 7.2. Использование метода максимального правдоподобия для оценивания параметров законов распределения
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- 7.5. Примеры оценки показателей законов распределения
- Глава 8
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Формулировка теоремы Байеса для событий
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- 8.3. Вычисление апостериорной плотности при последовательном накоплении информации
- Достаточные статистики
- Сопряженные распределения
- 8.9. Оценивание параметров семейства гамма-распределений
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Глава 9
- Общие замечания
- Ядерная оценка плотности
- Глава 10
- Задача линейного программирования
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Метод искусственных переменных
- Дискретное программирование
- Нелинейное программирование
- Глава 11 системный анализ и модели теории массового обслуживания
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Замкнутые системы с ожиданием
- 11.5. Пример расчета надежности системы с ограниченным количеством запасных элементов
- Глава 12 численные методы в системном анализе
- Метод последовательных приближений
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Глава 13 выбор или принятие решений
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53