logo
МИРЭА / Методичка_2010 / Методичка_2010

Анализ свидетельств

Пусть дан набор попарно независимых гипотез A, составляющих полную группу событий, и наблюдается некоторое событие B. Как известно, в этом случае формула Байеса имеет вид:

P(Ai/B)=[P(Ai)P(B/Ai)]/[{P(Ai)P(B/Ai)}].

Пусть теперь наблюдается изображение Im, и необходимо определить апостериорную вероятность некоторой гипотезы H относительно видимой сцены. Тогда формула Байеса принимает вид

P(H/Im)=[P(H)P(Im/H)]/[P(H)P(Im/H)+P(HС)P(Im/HС)], (*.7)

где HС - гипотеза "не H"; под событием (event) E(H) подразумевается событие "H - истинно".

Изображение Im здесь также рассматривается как событие или, точнее, должно рассматриваться событие E(Im), связанное с данным изображением. Далее будем считать, что в процессе анализа изображения Im происходит ряд событий, совокупность которых и составляет E(Im). Иными словами, если каждый существенный факт, установленный в ходе анализа изображения Im, есть событие ek, то

E(Im)=e1e2..eK, (*.8)

где K - общее число таких событий. Таким образом, для проверки любой гипотезы H относительно изображения Im необходимо вычислить выражение (7) с учетом (8).

Если предположить, что события {ek} независимы в совокупности, то из (.7) и (.8) следует

P(H/Im)=[P(H){P(ek/H)}]/[P(H){P(ek/H)}+P(HС){P(ek/HС)}], (.7’)

где {xk}=x1x2...xK.

Выражение (7’) дает возможность определить важное понятие "влияющего события" или "свидетельства". Пусть даны некоторое событие e и некотрая гипотеза H, причем P(e/H)=P(e/HC). Тогда из (.7’) следует, что

(P(e/H)=P(e/HC))(P(H/{Im\e})=P(H/{Ime})),

иными словами, наличие или отсутствие события e никак не влияет на апостериорную вероятность гипотезы H. Таким образом

Определение.1. Любое событие e, такое что P(e/H)(P(e/HC) является влияющим событием для гипотезы H.

В дальнейшем без потери общности будем считать, что произведение в формуле (.7’) берется не по всем событиям вообще, а только по совокупности влияющих событий для каждой исследуемой гипотезы.

Определение.2. Событийной вероятностной моделью изображения объекта называется набор PE(H)={{p(ek/H),p(ek/HC),ekE(Im)}, p(H)}, где Im - изображение, H - гипотеза о присутствии некоторого объекта на изображении, HC - ее дополнение; E(Im)={ek} - множество влияющих событий относительно гипотезы H, регистрируемых на данном изображении Im.

Вообще говоря, переход от изображения, представленного в виде дискретного двумерного числового поля Im={Imxy}, x=1..DimX, y=1..DimY, Imxy[0..2N-1] к представлению в виде множества событий E(Im)={ek} не является ни очевидным ни даже обоснованным. Попробуем его обосновать.

Пусть известна вероятностная модель изображения объекта PM(H)={p(Im/H), p(Im/HC), p(H)}. И пусть решение об обнаружении объекта принимается на основании значения апостериорной вероятности P(H/Im) в соответствии с выражением (.7). Пусть дан также набор событий E(Im)={ek}=func(Im), характеризуемый соответственно событийной моделью PE(H)={p(E(Im)/H), p(E(Im)/HC), p(H)}. При каких условиях решения, принятые на основании модели PE(H), будут в точности равны решениям, принятым на основании модели PM(H)? Очевидно, в том случае, когда

P(H/Im)=P(H/E(Im)), (.9)

то есть выражения (.7) и (.7’) дают одинаковый результат.

Определение.3. Пусть u и v - два описания изображения, причем u=u(v) - некоторая функция от v. Пусть также некоторый параметр x принимает свои значения на соответствующем множестве. Тогда u называется достаточной статистикой для v относительно параметра x или семейства распределений {p(v/x): xX}, если условная плотность p(v/u,x) не зависит от х.

В работе [1] доказано следующее достаточное условие достаточности статистики при проверке альтернативных гипотез:

Утверждение 1. Пусть u и v - два описания изображения, причем u=u(v). Пусть также дан некоторый набор альтернативных гипотез H={Hi:HiHj=}, составляющих полную группу событий. Тогда u будет достаточной статистикой для v относительно гипотез из H или семейства распределений {p(v/Hi): HiH}, если справедливо равенство P(Hi/v)=P(Hi/u) для всех HiH.

Определение.4. Пусть u и v - два описания изображения, причем u=u(v). Пусть H={H,HC} - набор альтернативных гипотез, составляющих полную группу событий. Тогда вероятностные модели P(v,H)={p(v/H),p(v/HC),p(H)} и P(u,H)={p(u/H),p(u/HC),p(H)}, связанные условием

P(H/v)=P(H/u)

будем называть адекватными относительно H.

Таким образом из введенных определений, утверждения 1 и условия (.9) следует, что переход от описания Im к описанию E(Im) является обоснованным только в том случе, когда E(Im) является достаточной статистикой для Im относительно гипотезы H. Только при этом условии вероятностные модели PE(H) и PM(H) будут адекватными.

Дадим следующую семантическую интерпретацию условию достаточности статистики вида “p(v/u,x) не зависит от х”. Пусть под множеством событий E(Im) понимается совокупность контурных точек вместе с их координатами, и гипотеза Hi состоит в том, что на изображении находится объект некоторой i-й формы. Конкретные значения пикселов зависят, очевидно, от условий регистрации (освещенность + параметры камеры), между тем, контурный препарат является инвариантным к этим условиям носителем искомой информации. В этом случае действительно при любом объекте Hi справедливо равенство p(Im/E(Im),Hi) =p(Im/E(Im)), где p(Im/E(Im)) - вероятность некоторой полутоновой “раскраски” контурного изображения, описывающая условия регистрации изображения, никак не зависящие от характера наблюдаемого объекта.

Полезным с практической точки зрения представляется также ввести следующее понятие:

Определение.5. Пусть u и v - два описания изображения, причем u=u(v). Пусть H={H,HC} - набор альтернативных гипотез, составляющих полную группу событий. Тогда вероятностная модель P(u,H)={p(u/H),p(u/HC),p(H)} называется загрублением модели P(v,H)={p(v/H),p(v/HC),p(H)}, если P(H/v)(P(H/u).

Использование загрубленных моделей может быть полезно на предварительном этапе тестирования гипотез, когда необходимо обеспечить только отсутствие ошибок второго рода (т.е. пропусков), и предполагается что ошибки первого рода (ложные обнаружения) будут отбракованы в дальнейшем.

Так или иначе, далее под обозначением P(H/Im) мы будем всегда понимать P(H/E(Im)), где E(Im) - событийное описание изображения.