Стартовая Предметный указатель Новости науки и техники
Новости науки и техники
Четыре способа сломать космический аппарат
Наиболее громкие катастрофы космических аппаратов, которые произошли в результате ошибок обслуживающего персонала (Ракета "Протон-М" со спутниками ГЛОНАСС, метеорологический спутник NOAA-N Prime, ракета Ariane 5, зонды "Фобос-1" и "Фобос-2". Далее...

Крушения космических аппаратов

непараметрические методы

НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ - совокупность приёмов и методов матем. статистики, основанных на непараметрич. представлении ф-ции распределения. Н. м. особенно эффективны в задачах анализа эксперим. данных на стадии разведочного анализа (см. Анализ данных ),они имеют преимущество перед пара-метрич. методами, т. к. используют лишь непрерывность ф-ции распределения. В эксперим. физике Н. м. применяют для оценивания плотности вероятности и проверки статистических гипотез.

Оценивание плотности вероятности. Пусть имеется ряд наблюдений i}, i = 1, ..., N, т. е. последовательность независимых, одинаково распределённых случайных величин с неизвестной ф-цией плотности вероятности р(х), и требуется построить непараметрич. оценку 3106-48.jpg для р(х). Обычно применяемый метод непараметрич. оценивания - построение гистограмм. Числовую ось, на к-рой определены xi, делят на ряд областей rj, j = 1, ..., К, а 3106-49.jpg задают константой 3106-50.jpg в каждой области rj, причём

3106-51.jpg

где k(N)- коэф. нормировки, gj(x) - индикаторная ф-ция каждой области rj:

3106-52.jpg

Тогда оценка плотности вероятности определяется выражением

3106-53.jpg

Если на отрезке числовой оси, на к-ром определён ряд наблюдений {xi}, i = 1, ..., N, задать набор ортогональных ф-ций {yj(x)}, j = 1, ..., М,

3106-54.jpg

djl - символ Кронекера, то с помощью этого набора также можно определить непараметрич. оценку ф-ции плотности вероятности р(х):

3106-55.jpg

где

3106-56.jpg

Хотя эти методы довольно популярны и просты, результаты являются несостоятельными оценками, т. е. при N 3106-57.jpgони не стремятся к р(х).

Из состоятельных Н. м. оценивания ф-ции плотности вероятности следует отметить метод ближайших соседей. Пусть имеются случайные числа x1 <= х2 <= ... <=xN и надо оценить их плотность вероятности в точке х. Задают целое число R(1 < R < N)и находят такой отрезок с центром в точке х, чтобы он содержал R чисел хi. Тогда оценкой плотности вероятности в точке х будет 3106-58.jpg = R/Nh, где h - длина найденного отрезка. В отличие от метода гистограмм, плотность вероятности здесь оценивают не по разному кол-ву случайных чисел, попавших в неперекрывающиеся отрезки фиксиров. длины, а по фиксиров. кол-ву случайных чисел, попавших в перекрывающиеся отрезки разной длины. Ошибка оценки в этом методе равна d ~ 3106-59.jpg/R, т. е. относит. ошибка d/р(х)постоянна и не зависит от х (если только х не слишком близко к х1 или xN), в отличие от оценки по гистограмме.

Проверка гипотез. При параметрич. проверке гипотез предполагают, что плотность распределения р(х)является членом параметризов. семейства р(х|а). Задача состоит в том, чтобы принять или отвергнуть гипотезу, что а имеет заранее известное значение, или выбрать значение из нескольких возможных значений.

При непараметрич. проверке гипотез ф-ции распределения этих гипотез не принадлежат параметрич. семейству. Для них предполагают выполненными лишь качественные свойства типа непрерывности и т. п., поэтому усложняется выбор критериев проверки гипотез.

Обычно непараметрич. проверку гипотез используют в след. задачах: 1) имеется набор независимых случайных величин п}, п = 1, ..., N с неизвестной ф-цией распределения F(x), нужно проверить гипотезу H0 : F(x) = F0(x), где F0(х)- нек-рая заданная ф-ция распределения (задача сравнения результатов эксперимента с теоретич. моделью); 2) имеются два набора независимых случайных величин п}, п = 1, ..., N и {yт}, т = 1, ..., М с ф-циями распределения F(xG(x), нужно проверить гипотезу Н0 : F(x) = G(x).

При гистограммном способе представления данных обычно используют следующие статистические критерии, проверки гипотез. Пусть N случайных величин хп сгруппированы в гистограмму с К ячейками и в ячейку с номером i попало ni величин хп. Согласно гипотезе Н0, можно вычислить вероятность pi попадания величины х в ячейку с номером i. В качестве проверочных статистик используют отношения правдоподобия

3106-60.jpg

и статистику Пирсона

3106-61.jpg

где Dij - ковариационная матрица для ni. Независимо от вида F0 оказывается, что -2lnl и X2 при N3106-62.jpg распределены согласно c2-распределению с числом степеней свободы К - 1. Поэтому можно вычислить критич. значения -2lnl и X2 по заданной вероятности а того, что при справедливости гипотезы Н0 эти критич. значения могут быть превышены. Следовательно, если реализовавшиеся значения превышают критические, можно отвергнуть гипотезу Н0.

Более эффективными являются критерии, использующие в качестве проверочных статистик разл. "расстояния" между эксперим. (выборочной) ф-цией распределения FN(x)и ф-цией F0(x). Выборочную ф-цию распределения определяют след. образом:

3106-63.jpg

Критерий Смирнова основан на проверочной статистике

3106-64.jpg

где f(x)- плотность ф-ции распределения F0(x), a критерий Колмогорова - на статистике

3106-65.jpg

Используют и др. критерии.

Лит.: Большев Л. Н., Смирнов Н. В., Таблицы математической статистики, 3 изд., М., 1983; Кендалл М., Стьюарт А., Статистические выводы и связи, пер. с англ., М., 1973; Статистические методы в экспериментальной физике,

пер. с англ., М., 1976; Тюрин Ю. Н., Непараметрические методы статистики, М., 1978. В. П. Жигуков, С. В. Клименко.

  Предметный указатель