logo search
Антонов

Достаточные статистики

В ряде задач системного анализа исследователю для проведения работы не обязательно хранить всю информацию о функционировании объектов, т.е. не нужно при расчетах иметь выборку о реализациях наблюдаемой случайной величины, на основании которой оценивают параметры системы для включения в дальнейшем их в модель.

Объем требуемой для расчетов информации можно существенно со­кратить, если вычислить заранее значения некоторого количества чис­ловых характеристик. При этом необходимо убедиться, что рассчитан­ные значения характеристик содержат всю информацию, имевшуюся в первоначальных данных.

Рассмотрим следующую модель оценивания. Пусть имеется слу­чайная величина или случайный вектор Т, который принимает значения Tv T2, ...,Tn. Требуется оценить некоторый вектор в. При этом предпо­лагается, что оценивание параметра 0 производится по наблюдениям F1, T2, ..., Tn. Случайная величина T и параметр 0 связаны условной плотностью распределения/(770) при 0=0.

Введем статистику M(T), которая является функцией наблюдаемой случайной величины.

Приведем байесовское определение достаточной статистики. Со­гласно [41] статистику M называют достаточной, если при любом ап­риорном распределении параметра 0 его апостериорное распределение зависит от значения T только через M(T). Статистику с такими свой­ствами называют достаточной потому, что для вычисления апостери­орного распределения 0, исходя из любого априорного распределения, исследователю достаточно знать лишь значение M(T). При этом нет необходимости сохранять значения самого случайного вектора Т, ко­торый может иметь большую размерность.

На практике это обстоятельство является важным при проведении автоматизированных расчетов, так как использование вместо массива случайных величин T достаточных статистик M(T) резко сокращает объем требуемой памяти ЭВМ.

Приведем теорему, которая дает простой способ распознавания до­статочных статистик.

Теорема. Статистика M достаточна для семейства плотностей распределения/(770) тогда и только тогда, когда функцию J(TIQ) мож­но представить в виде произведения следующим образом:

f (Tl В) = u(T)v[M (T),Q]

для всех Te 3 и 0є 0.

Здесь функция и положительна и не зависит от 0; функция v неотри­цательна и зависит от T только через M(T).

Доказательство теоремы приведено в [41].

Пример 1. Пусть Tv T2, ...,Tn- выборка, подчиняющаяся нормаль­ному распределению с неизвестными значениями математического ожидания т и среднего квадратического отклонения о.

Совместная плотность распределения/^; т, о2) выборки Tv T1,..., Tn задается следующим образом:

(8.11)

(2ла2)"72 ЄХР

fn(TvT2,...,Tn,m,c2)-

Л 1 п

Введем обозначение т = - У Т.

Пы\ '

Произведем некоторые преобразования:

Jj(Ti-M)2 =Yi(Ti-M)2 + п(т)2,

1=1 ,=1

и получим, что плотность распределения (8.11) зависит от результатов

наблюдений TvTv ...,Tn только через величины т a J(T )2. Таким

^,J(Ti-M)2

образом, для данной плотности распределения двумерная векторная статистика

M (Т{2,....,Tn)=

будет являться достаточной статистикой.

Пример 2. В теории надежности широкое распространение при расчетах получил экспоненциальный закон распределения. Пусть T, T2,..., Tn - выборка наработок до отказа, подчиняющаяся экспоненци­альному закону распределения с неизвестным параметром X. Совмес­тная плотность распределения/^; X) выборки Tv T1, ...,Tn задается фор­мулой

ж,T2,...,Tn-X)=X" ехр -XjTi L

Л 1 п

Введем обозначение Tn = -JTi. Откуда следует ” 1=1

fn(Ti>T2,...,Tn;X) = Xn ехр(-Хмп).

В данном выражении совместная плотность зависит только от величи­ны т, которая является для экспоненциального закона распределения

достаточной статистикои.

Из примеров 1 и 2 видно, что имеется достаточная статистика, ко­торую можно представить одной или двумя скалярными функциями от результатов наблюдения {Tv T1, ..., TJ. Независимо от объема выбор­ки наблюдаемой случайной величины размерность достаточной стати­стики одна и та же. Обработка результатов наблюдений и анализ ха­рактеристик сложной системы существенно упрощаются, если наблю­дения описываются функцией распределения, обладающей достаточ­ной статистикой фиксированной размерности.