Ядерная оценка плотности
Гистограммные оценки плотности распределения, рассмотренные в предыдущих параграфах, обладают существенным недостатком, а именно, плотность или функция распределения, полученные данным методом, являются ступенчатыми функциями. Реальные функции распределения являются непрерывными функциями. Следовательно, гистограммные оценки хорошо аппроксимируют функции распределения только в случае больших объемов наблюдений, когда п —> <*>. в ситуации, когда наблюдения производят за функциональными характеристиками сложных систем, хотелось бы иметь более гладкие оценки плотности или функции распределения. Шагом в получении такой оценки явилась модель построения так называемой ядерной оценки плотности.
Ядерные оценки впервые были введены в работах Парзена [44] и Розенблатта [45]. Рассмотрим методику построения ядерных оценок для плотности распределения непрерывной случайной величины. Пусть в результате наблюдения за объектом исследования получена выборка T, T2,..., Tn. На основании данных результатов построим гистограмм- ную оценку функции распределения. Гистограммную оценку функции распределения будем строить несколько отличающимся способом по сравнению с тем, как это было сделано в п. 9.2. Будем полагать, что изменение функции распределения происходит в каждой точке наблюдения, причем величина такого изменения равна 1/п. Построенная таким образом функция распределения изображена на рис. 9.3. Ее можно записать в виде
Fn(t) = Р(Т, < 0 = -XfCTl <t) = -Jff(Tl), (9.9)
Tl /_і п ,=I
где І(Т< і) - индикаторная функция,равная 1, когда условие в скобках выполняется, и 0 в противном случае; H(T) - функция Хевисайта, равная 1 при / > Tp и 0 при t < T1.
т- (9.12) т
л-1 In п-2/п
t-T,
h< I.
3/л
2/л
при -I <t <1;
2
0 при t < —I, t > 1.
Вид функции представлен на рис. 9.4. Если в качестве ядра взять данную функцию и сузить интервал определения, т.е. определить ее на интервале [-h, h],h< 1, то получим оценку плотности в виде
(9.13)
Плотность распределения, построенная на основании формулы (9.13), будет представлять собой непрерывную функцию. В последующих за исследованиями Парзена и Розенблатта работах было предложено множество других функций, используемых в качестве ядра. Отметим некоторые из них. Так называемая треугольная (рис. 9.5) функция имеет вид
0 при t < -1,
I+t при -1<г<0,
Tr = • 1 при t = 0,
1-г при 0<г<1,
при t> 1.
Т, ... T1 (9.11)
1 ехр >/2я 1 t-T І, ехр nh\[2u і=і j 5(f)* = 1, °\b(t-u)f(u)du = f(t). Функция, определяемая выражением (9.10), называется ядерной оценкой плотности, а функция, стоящая под знаком суммы, называется ядром. Графическое изображение такой плотности распределения будет представлять собой набор вертикальных прямых, берущих начало в точках Т. и уходящих в бесконечность. Наглядность такого представления пока не очень высока и не отличается в лучшую сторону по сравнению с гистограммным представлением. Заменим в выражении (9.10) функцию Дирака некоторой конечной функцией, удовлетворяющей свойствам (9.11). Парзен и Розенблатт впервые предложили в качестве ядра вместо функции Дирака использовать функцию K(t), определенную следующим образом: 292 Изображение функции приведено на рис. 9.6. Ядерная оценка плотности распределения будет получаться путем подстановки в выражение (9.13) соответствующего ядра, например, G(t) вместо ядра K(t). Так, для гауссовского ядра получим выражение плотности распределения в виде Качество восстановленной с помощью ядерного оценивания плотности зависит от выбора величины параметра h. Параметр локальнос- IzZLt yfih J G(t) = ^-JC2
ти А выступает в качестве основного управляющего параметра. Его значение оказывает существенное влияние на вид оценок плотностей распределения и их точность.
Можно показать, что дисперсия оценки Dfn ~ —. Следовательно,
nh
А нельзя брать бесконечно малым, так как при этом дисперсия оценки плотности распределения будет стремиться к бесконечности. С другой стороны, нельзя брать параметр А слишком большим, поскольку при
этом увеличивается систематическая ошибка: A
Таким образом, возникает оптимизационная задача выбора параметра сглаживания. Приведем метод определения оптимального значения параметра А, основанный на вычислении функции правдоподобия. Суть метода состоит в следующем. Пусть имеется выборка Tv T2, ..., Tn. На первом шаге выбираем произвольное значение параметра A1. Далее исключаем из выборки значение T1 и на основании оставшихся значений Т., ..., T
2’ 3 ’л
строим плотность /„.,(A,,t). За- 294
тем определяем значение плотности в точке Tv В результате получаем (^,T1). На следующем шаге исключаем значение T2. На основании оставшихся значений Tv Tv ..., Tn строим плотность /л2_,(IilJ). Далее вычисляем значение ядерной оценки плотности в точке T2. Получаем /п2_! (A1, T2). Повторяем данную процедуру по всем Ti до Tn. Получаем массив {/„‘-,(Л,,^)}, | = 1, п. На основании вычисленных значений оценок плотностей в точках строим функцию правдоподобия
UKJi) = YlfU(KJi).
J=1
На втором этапе устанавливаем значение константы А, равное A2, и повторяем описанную процедуру заново. Вычисляем функцию правдоподобия
ДА2,T1) = YlfL(KJ) и т.д.
J=I
Оптимальное значение А выбираем как результат решения выражения
/Jom. =argma\L(hjfT). hi
Данная процедура сложна в реализации, но обеспечивает вычисление оптимального значения параметра А.
В работе [46] приводятся результаты исследования сходимости ядерных оценок. В частности отмечено, что оптимальная скорость сходимости ядерной оценки плотности обеспечивает выбор параметра А на уровне
hn=(aWn)us, (9.14)
где а = J AT2 (t)dt, р = (JV ЛГ (t)dt )2 J/"(O2 <*• При этом также предполагается, что An-> 0, nhn —> оо, при п —> оо и/(0 - ограниченная плотность, имеющая две непрерывные производные, и j(f"(t))2dt < . Данный результат также можно использовать для определения оптимального значения параметра А. В приведенной формуле (9.14) неизвестным показателем является плотность/(0, используемая для определения коэффициента р. Заменим данную плотность ее ядерной оценкой. Поскольку ядерная оценка зависит от параметра А, то для поиска оптимального значения параметра необходимо организовать итеративную процедуру проведения расчетов. На первом этапе выбираем произвольное значе-
ниє параметра ZilC I. Для данного значения строим ядерную оценку плот- ности/„(/»,, t) и на ее основании рассчитываем значения коэффициентов a,, P1. Далее подставляем полученные значения коэффициентов в формулу (9.14), вычисляем новое значение параметра hr На основании данного значения параметра строим новую ядерную оценку fn(hv t). Полученное значение плотности используем вновь для расчета коэффициентов а, р. Повторяем данную процедуру до тех пор, пока не будет выполняться условие сходимости результата вычисления оптимизируемого параметра h, а именно, \hm - hm J < є, где є - малое число, определяющее заданную точность проведения расчетов.
Проекционное оценивание плотности распределения
Следующим шагом в развитии непараметрических методов оценивания плотности распределения непрерывной случайной величины явились проекционные методы. Впервые метод оценивания плотности распределения, получивший название проекционный, был предложен в работе Н.Н. Ченцова [47]. Для построения оценки плотности распределения были использованы результаты теории ортогональных функций. Для получения проекционной оценки Ченцов использовал разложение функции в ряд Фурье. Итак, пусть f(t) - функция, имеющая область определения [0,1]. Следовательно, ее можно разложить в ряд Фурье:
до=Хс/Р; (')>
м
где {<р.(/)} _ ортонормированная тригонометрическая система на [0,1].
ф2, (0 = л/2 cos 2nlt;
Фгі+і (0 = V2sin 2nlt;
ф,(0 =1,/ > 1.
Оценка функции/(t) тогда будет определяться по формуле
Лл(0 = Іс>,( о, (9.15)
т.е. в разложении в ряд Фурье берется конечное число членов суммирования. Оценки коэффициентов в разложении определяются по формуле
Оценка (9.15) называется проекционной оценкой Ченцова. Условие t є [0,1] не ограничивает общности. Функция f(t) может быть определена на любой ограниченной области D е R1. Отнормировав данную область, можно обеспечить условие t є [0,1]. После построения плотности распределения на интервале [0,1] необходимо выполнить обратный переход в область определения функции D.
В выражении (9.15) неопределенной осталась величина AT, которая представляет собой число слагаемых в разложении функции в ряд Фурье. Данный параметр называется параметром сглаживания. В [46] отмечается, что тригонометрическая система недостаточно богата для оценивания любых плотностей. Однако этот недостаток уравновешивается рядом преимуществ проекционных оценок, в частности их превосходным поведением в случае, когда разложение плотности распределения в ряд содержит конечное число членов или является бесконечным с быстро убывающими коэффициентами. Известна оценка для определения оптимального числа гармоник Nn состоящая в следующем:
N° = argminNc[U] Anjv, (9.16)
rAeAllN =P(N) + •%-, P(N)=Jc2y
Zn jsfi
В работе [48] показано, что для выбора порядка числа гармоник (9.16) можно пользоваться оценкой
Na = argmin1<N<1I TNj
2N
где Xn = X с).
j*N+l
В литературе (например [48]) приводится значительное количество ортонормальных систем, которые можно использовать для построения проекционных оценок плотности распределения. Помимо тригонометрической системы это полиномы Лежандра, которые образуют ортонор- мальную систему на [-1, 1], оценки с рядом Эрмита. Функции с рядом Эрмита образуют ортонормальную систему, определенную на [-о°, «>]. Оценка с рядом Лагерра образует также ортонормальную систему, определенную на [0, °°]. Ортонормальная система Xaapa отличается от всех предыдущих тем, что она является базисом в области определения [0, 1]. Формулы разложения для данных систем, а также свойства проекционных оценок с этими разложениями приведены, например, в [48].
Рассмотренные в последних трех главах методы обработки статистической информации используются для определения параметров элементов, составных частей и подсистем сложных систем на этапе построения моделей систем. Рассмотренные методы обработки информации претендуют на полноту охвата моделей, используемых при решении задачи статистического оценивания. Так, рассмотрены параметрические методы, которые представлены моделями максимального правдоподобия и байесовскими процедурами, а также непараметрические методы, включающие в себя гистограммные, ядерные и проекционные оценки. Представленный материал преследует цель получения оценок статистических показателей сложной системы с высокой степенью точности и соответственно высокой достоверностью. Высокая степень достоверности оценок достигается за счет использования цензурированных данных, а также за счет использования априорной информации.
Таким образом, в представленном материале рассмотрен комплекс вопросов, касающихся методологии системного анализа, процедуры проведения системных исследований, построения моделей систем. Вопросы построения моделей систем охватывают широкий комплекс проблем, начиная от классификации моделей, подходов к построению имитационных моделей, и заканчивая методами проверки адекватности моделей и оценки параметров систем.
- Введение
- Глава I определениясистемного анализа
- Системность - общее свойство материи
- Определения системного анализа
- Понятие сложной системы
- Характеристика задач системного анализа
- Особенности задач системного анализа
- Глава 2 характеристика этапов системного анализа
- Процедуры системного анализа
- Анализ структуры системы
- Построение моделей систем
- Исследование ресурсных возможностей
- Определение целей системного анализа
- Формирование критериев
- Генерирование альтернатив
- Реализация выбора и принятия решений
- Внедрение результатов анализа
- Глава 3 построение моделей систем
- Понятие модели системы
- Агрегирование - метод обобщения моделей
- Глава 4 имитационное моделирование - метод проведения системных исследований
- Сущность имитационного моделирования
- Композиция дискретных систем
- Содержательное описание сложной системы
- Глава 5 теория подобия - методология обоснования применения моделей
- Модели и виды подобия
- Основные понятия физического подобия
- Элементы статистической теории подобия
- Глава 6 эксперимент - средство построения модели
- Характеристика эксперимента
- Обработка экспериментальных данных
- Глава 7 параметрические методы обработки экспериментальной информации
- 7.1. Оценивание показателей систем и определениеихточности
- 7.2. Использование метода максимального правдоподобия для оценивания параметров законов распределения
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- 7.5. Примеры оценки показателей законов распределения
- Глава 8
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Формулировка теоремы Байеса для событий
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- 8.3. Вычисление апостериорной плотности при последовательном накоплении информации
- Достаточные статистики
- Сопряженные распределения
- 8.9. Оценивание параметров семейства гамма-распределений
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Глава 9
- Общие замечания
- Ядерная оценка плотности
- Глава 10
- Задача линейного программирования
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Метод искусственных переменных
- Дискретное программирование
- Нелинейное программирование
- Глава 11 системный анализ и модели теории массового обслуживания
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Замкнутые системы с ожиданием
- 11.5. Пример расчета надежности системы с ограниченным количеством запасных элементов
- Глава 12 численные методы в системном анализе
- Метод последовательных приближений
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53
- Глава 13 выбор или принятие решений
- Глава I определения системного анализа 7
- Глава 2 33
- Глава 3 построение моделей систем 53