Стартовая Предметный указатель Новости науки и техники
Новости науки и техники
Самовосстанавливающийся чип
Европейская наука приближает день, когда устройства смогут самовосстанавлливаться.
Ученые не сидят, сложа руки и предвидя момент, когда размеры транзисторов и чипов станут настолько малы, что не смогут сохранять текущий уровень устойчивости к внешним воздействиям, придумали, как решить проблему. Далее...

Чип

статистическое оценивание

СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ - один из осн. разделов матем. статистики, посвящённый оцениванию параметров теоретич. моделей по косвенным измерениям или распределений случайной величины х по наблюдению её реализаций. Если предполагается, что распределение является элементом параметрич. семейства8067-93.jpg , то возникает задача параметрического оценивания. Когда вид распределения неизвестен, говорят о задаче непараметрического оценивания. При параметрич. оценивании различают два подхода: точечное оценивание и интервальное оценивание.

Точечное оценивание. Пусть распределение случайной величины х - заданная ф-ция8067-94.jpg с неизвестными параметрами а, а x = (x1,x2,...,xN) - вектор возможных значений х. Точечное оценивание заключается в выборе ф-ции8067-95.jpg, значение к-рой при заданном аг можно использовать вместо параметра а в качестве его приближённого значения. Ф-цию8067-96.jpg наз. оценкой параметра а, принцип выбора ф-ции - методом оценивания. Очевидно, что можно предложить много оценок, поэтому необходимо изучить следующие осн. свойства оценок.

Состоятельность. При увеличении объёма N наблюдений (измерений) оценка должна приближаться к истинному значению параметра. Оценку8067-97.jpg называют состоятельной по вероятности, если для любых8067-98.jpg,•8067-99.jpg существует такое N, что вероятность реализации неравенства8067-100.jpg будет меньше8067-101.jpg Примером состоятельной оценки служит выборочное среднее8067-102.jpg, к-рое является оценкой ср. значения величины8067-103.jpg, если ф-ция ллотности вероятности р(х)имеет конечную дисперсию.

Смещение. Под смещением оценки8067-104.jpg принято понимать отклонение её ср. значения8067-105.jpg от истинного значения8067-106.jpg. Оценку8067-107.jpg наз. несмещённой, если при любых N и а имеем8067-108.jpg , или8067-109.jpg . Несмещённая оценка обычно предпочтительнее смещённой, т. к. смещение является систематич. ошибкой в оценке, к-рая зависит от истинного значения параметра а и поэтому редко поддаётся вычислению. Выборочное среднее является несмещённой оценкой, тогда как выборочная дисперсия

8067-110.jpg является смещённой оценкой дисперсии8067-111.jpg

Эффективность. Простейшей характеристикой точности оценки является ср. значение квадрата её расстояния от истинного значения:
8067-112.jpg

где8067-113.jpg - дисперсия оценки8067-114.jpg, равная
8067-115.jpg

Дисперсия характеризует «ширину» распределения, т. е. «шумовую» составляющую ошибки8067-116.jpg оценки8067-117.jpg . Поэтому в классе оценок с данным смещением8067-118.jpg предпочтительнее оценка с мин. дисперсией. Справедливо неравенство Крамера - Рао:
8067-119.jpg

к-рое и определяет максимально достижимую точность (в смысле8067-120.jpg в классе оценок с данным смещением8067-121.jpg по выборке х. Величину
8067-122.jpg

где8067-123.jpg - ф-ция плотности распределения8067-124.jpg, называют количеством информации по Р. Фишеру (R. Fisher) о параметре а в оценке Величину8067-125.jpg
8067-126.jpg

где8067-127.jpg - ф-ция правдоподобия, а8067-128.jpg - плотность ф-ции распределения х, называют количеством информации по Р. Фишеру о параметре в выборке х. В классе несмещённых оценок
8067-129.jpg

и информац. смысл величин8067-130.jpg и8067-131.jpg становится очевидным: их значение определяет минимально достижимое расстояние8067-132.jpg от а. Первое неравенство в (1), (3) превращается в равенство лишь тогда, когда ф-ция плотности распределения оценки имеет экспоненц. форму:
8067-133.jpg

то и второе неравенство в (1), (3) превращается в равенство. Такую оценку называют эффективной в смысле Крамера - Рао. Оценку, для к-рой выполняется равенство (5), т. е. такую, в к-рой количество информации о параметре а такое же, как в самой выборке х, называют достаточной статистикой. Условием существования достаточной статистики8067-134.jpg является факторизация ф-ции правдоподобия:8067-135.jpg. Неравенство Крамера - Рао полезно тем, что позволяет ещё на стадии планирования эксперимента оценить максимально достижимую точность «измерения» параметров изучаемых распределений.

Требования (3) и (4) являются достаточно жёсткими, поэтому при конечных N эфф. оценки редки. В связи с этим рассматривают поведение8067-136.jpg при8067-137.jpg и наз. оценку асимптотически эффективной, если при8067-138.jpg. Заметим, что асимптотич. несмещённость следует из состоятельности оценки. Рассмотрим наиб. общие и распространённые методы получения точечных оценок.

Метод максимума правдоподобия (подробнее см. Максимального правдоподобия метод).

В этом методе вероятность реализации вектора наблюдений х,8068-1.jpg , после подстановки в неё реализовавшихся значений х рассматривают как ф-цию параметров а и называют ф-цией правдоподобия:8068-2.jpg . В качестве оценки в методе макс. правдоподобия для вектора параметров а берут то значение8068-3.jpg, к-рое соответствует макс. значению ф-ции правдоподобия. При нек-рых общих предположениях оценки в методе макс. правдоподобия состоятельны, асимптотически эффективны и асимптотически нормально распределены. При конечных N оценка в методе макс. правдоподобия имеет оптим. свойства только в том случае, когда существует достаточная статистика. Метод наименьших квадратов (подробнее см. Наименьших квадратов метод ),В этом методе в качестве оценки вектора параметров а берут то значение8068-4.jpg, к-рое соответствует минимуму квадратичной формы.
8068-5.jpg

где D - матрица ошибок измерений хп. При нек-рых общих предположениях оценка в методе наим. квадратов состоятельна и асимптотически нормально распределена, но не является асимптотически эффективной. Если8068-6.jpg - линейные ф-ции параметров а, то в классе линейных несмещённых оценок оценки8068-7.jpg в методе наим. квадратов имеют наим. дисперсии.

Метод моментов. Пусть mi - выборочные моменты,8068-8.jpg - моменты ф-ции плотности распределения, . В методе моментов выбирают в8068-9.jpg качестве оценки параметров а решение8068-10.jpg системы ур-ний8068-11.jpg. Оценки в методе моментов состоятельны, асимптотически несмещены, но не являются асимптотически эффективными,8068-12.jpg -метод. Если объём выборки х велик и данные хп сгруппированы в гистограмму ,то для оценки параметров а используют8068-13.jpg-метод, являющийся частным случаем метода наим. квадратов. Пусть У; - число наблюдений, попавших в Z-канал гистограммы, а8068-14.jpg - их ожидаемое число:
8068-15.jpg

В качестве оценки параметров а берут значение8068-16.jpg, соответствующее минимуму квадратичной формы
8068-17.jpg

либо модифицированный8068-18.jpg-метод
8068-19.jpg

Оценки в8068-20.jpg-методе и модифицированном8068-21.jpg-методе состоятельны, асимптотически нормально распределены и асимптотически эффективны. Своё название эти методы получили по той причине, что при больших Yl (приближение нормального распределения)8068-22.jpg распределено по8068-23.jpg-распределению с числом степеней свободы k = L - I - 1, где L - число каналов гистограммы, I - число параметров.

Интервальное оценивание состоит в отыскании интервала [a1,a2], к-рый с заданной вероятностью8068-24.jpg содержит истинное значение параметра а. Др. словами, нужно найти такой интервал [a1,a2] (как ф-цию вектора наблюдений х), к-рый «накроет» с вероятностью В истинное значение а при данном значении х. Это т. н. доверительный интервал с вероятностным содержанием8068-25.jpg (или коэф. доверия8068-26.jpg). Такое определение неоднозначно, его обычно доопределяют требованием минимальности длины среди всех интервалов с коэф. доверия8068-27.jpg

Пусть распределение8068-28.jpg зависит от одного параметра а и8068-29.jpg - к--л. точечная оценка а, ф-ция плотности вероятности к-рой равна8068-30.jpg. Тогда центр. доверит. интервал определяется как решение ур-ний
8068-31.jpg

Такой доверит. интервал может и не быть минимальным. Однако, если точечная оценка8068-32.jpg асимптотически эффективна, то при больших N этот интервал будет близок к минимальному.

Более общий подход к получению доверит. интервалов заключается в поиске такой ф-ции от оценки и параметра, распределение к-рой не зависит от искомого параметра. Напр., пусть вектор оценок8068-33.jpg распределён по многомерному Гаусса распределению со средним а и матрицей вторых моментов D. Тогда квадратичная форма8068-34.jpg распределена по закону8068-35.jpg (см. Распределение ),к-рое не зависит от а. Задаваясь вероятностью8068-36.jpg того, что8068-37.jpg, находим8068-38.jpg и доверит. область для а:8068-39.jpg, имеющую вид гиперэллипсоида с центром в точке8068-40.jpg Этот пример имеет практич. применение, т. к. асимптотически, при больших N, мн. методы оценивания дают нормально распределённые оценки параметров.

Непараметрическое оценивание. В этом случае не делают к--л. предположений о плотности ф-ции распределения. В качестве точечной оценки часто используют гистограмму. В этом методе оценивания числовую ось, на к-рой определены хп, делят на ряд областей rj (j = 1, 2,...,k), называемых каналами гистограммы. Тогда8068-41.jpg задают константами8068-42.jpg в каждой области rj, причём8068-43.jpg. Здесь C(N) - коэф. нормировки, gj(x) - индикаторная ф-ция области rj:
8068-44.jpg

Более формально оценки ф-ции плотности вероятности записывают в виде
8068-45.jpg

Гистограмма является простой в вычислит. плане, но смещённой и несостоятельной оценкой. Поэтому используют более сложные, но состоятельные оценки, напр. метод ближайших соседей (см. Непараметрические методы статистики). В качестве точечной оценки ф-ции распределения можно взять выборочную ф-цию распределения:
8068-46.jpg

где подразумевается, что х1, ..., хN расположены в порядке их возрастания. Эта оценка оказывается несмещённой и состоятельной. Ф-ция распределения Р(х)допускает и интервальную оценку. Рассмотрим статистику8068-47.jpg , для к-рой асимптотич. распределением является8068-48.jpg=8068-49.jpg . Т. к. это распределение не зависит от Р(х), можно вычислить8068-50.jpg , для к-рого вероятность8068-51.jpg равна8068-52.jpg , и задать доверит. зону для Р(х):8068-53.jpg

Считается, что асимптотич. распределение справедливо при N8068-54.jpg 80.

Лит.: Митропольский А. К., Техника статистических вычислений, 2 изд., М., 1971; Р а о С. Р., Линейные статистические методы и их применения, пер. с англ., М., 1968; Кендалл М., Стьюрт А., Статистические выводы и связи, пер. с англ., М., 1973; Статистические методы в экспериментальной физике, пер. с англ., М., 1976. В. П. Жигунов, С. В. Клименко.

  Предметный указатель