Четыре способа сломать космический аппаратНаиболее громкие катастрофы космических аппаратов, которые произошли в результате ошибок обслуживающего персонала (Ракета "Протон-М" со спутниками ГЛОНАСС, метеорологический спутник NOAA-N Prime, ракета Ariane 5, зонды "Фобос-1" и "Фобос-2". Далее... |
непараметрические методы
НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ - совокупность
приёмов и методов матем. статистики, основанных на непараметрич. представлении
ф-ции распределения. Н. м. особенно эффективны в задачах анализа эксперим. данных
на стадии разведочного анализа (см. Анализ данных ),они имеют преимущество
перед пара-метрич. методами, т. к. используют лишь непрерывность ф-ции распределения.
В эксперим. физике Н. м. применяют для оценивания плотности вероятности и проверки
статистических гипотез.
Оценивание плотности вероятности. Пусть
имеется ряд наблюдений {хi}, i = 1, ..., N, т. е. последовательность
независимых, одинаково распределённых случайных величин с неизвестной ф-цией
плотности вероятности р(х), и требуется построить непараметрич. оценку
для р(х). Обычно применяемый метод непараметрич. оценивания - построение гистограмм. Числовую ось, на к-рой определены xi, делят на ряд областей
rj, j = 1, ..., К, а
задают константой
в каждой области rj, причём
где k(N)- коэф. нормировки, gj(x) - индикаторная ф-ция каждой области rj:
Тогда оценка плотности вероятности определяется
выражением
Если на отрезке числовой оси, на к-ром определён
ряд наблюдений {xi}, i = 1, ..., N, задать набор
ортогональных ф-ций {yj(x)},
j = 1, ..., М,
djl - символ Кронекера, то с помощью этого набора также можно определить непараметрич.
оценку ф-ции плотности вероятности р(х):
где
Хотя эти методы довольно популярны и просты,
результаты являются несостоятельными оценками, т. е. при N они
не стремятся к р(х).
Из состоятельных Н. м. оценивания ф-ции плотности
вероятности следует отметить метод ближайших соседей. Пусть имеются случайные
числа x1 <= х2 <= ... <=xN и надо оценить их плотность вероятности в точке х. Задают целое число
R(1 < R < N)и находят такой отрезок с центром в
точке х, чтобы он содержал R чисел хi. Тогда
оценкой плотности вероятности в точке х будет
= R/Nh, где h - длина найденного отрезка. В отличие от метода
гистограмм, плотность вероятности здесь оценивают не по разному кол-ву случайных
чисел, попавших в неперекрывающиеся отрезки фиксиров. длины, а по фиксиров.
кол-ву случайных чисел, попавших в перекрывающиеся отрезки разной длины. Ошибка
оценки в этом методе равна d
~ /R,
т. е. относит. ошибка d/р(х)постоянна и не зависит от х (если только х не слишком близко
к х1 или xN), в отличие от оценки
по гистограмме.
Проверка гипотез. При параметрич. проверке
гипотез предполагают, что плотность распределения р(х)является членом
параметризов. семейства р(х|а). Задача состоит в том, чтобы принять или
отвергнуть гипотезу, что а имеет заранее известное значение, или выбрать
значение из нескольких возможных значений.
При непараметрич. проверке гипотез ф-ции распределения
этих гипотез не принадлежат параметрич. семейству. Для них предполагают выполненными
лишь качественные свойства типа непрерывности и т. п., поэтому усложняется выбор
критериев проверки гипотез.
Обычно непараметрич. проверку гипотез используют
в след. задачах: 1) имеется набор независимых случайных величин {хп},
п = 1, ..., N с неизвестной ф-цией распределения F(x), нужно
проверить гипотезу H0 : F(x) = F0(x), где F0(х)- нек-рая заданная ф-ция распределения
(задача сравнения результатов эксперимента с теоретич. моделью); 2) имеются
два набора независимых случайных величин {хп}, п = 1, ...,
N и {yт}, т = 1, ..., М с ф-циями распределения
F(x)и G(x), нужно проверить гипотезу Н0
: F(x) = G(x).
При гистограммном способе представления данных
обычно используют следующие статистические критерии, проверки гипотез.
Пусть N случайных величин хп сгруппированы в гистограмму
с К ячейками и в ячейку с номером i попало ni величин
хп. Согласно гипотезе Н0, можно вычислить
вероятность pi попадания величины х в ячейку с номером
i. В качестве проверочных статистик используют отношения правдоподобия
и статистику Пирсона
где Dij - ковариационная матрица для ni. Независимо от вида F0 оказывается,
что -2lnl и X2
при N
распределены согласно c2-распределению
с числом степеней свободы К - 1. Поэтому можно вычислить критич. значения
-2lnl и X2
по заданной вероятности а того, что при справедливости гипотезы Н0
эти критич. значения могут быть превышены. Следовательно, если реализовавшиеся
значения превышают критические, можно отвергнуть гипотезу Н0.
Более эффективными являются критерии, использующие
в качестве проверочных статистик разл. "расстояния" между эксперим.
(выборочной) ф-цией распределения FN(x)и ф-цией F0(x). Выборочную ф-цию распределения определяют след. образом:
Критерий Смирнова основан на проверочной статистике
где f(x)- плотность ф-ции распределения
F0(x), a критерий Колмогорова - на статистике
Используют и др. критерии.
Лит.: Большев Л. Н., Смирнов Н. В., Таблицы
математической статистики, 3 изд., М., 1983; Кендалл М., Стьюарт А., Статистические
выводы и связи, пер. с англ., М., 1973; Статистические методы в экспериментальной
физике,
пер. с англ., М., 1976; Тюрин Ю. Н., Непараметрические
методы статистики, М., 1978. В. П. Жигуков, С. В. Клименко.