Какая оценка параметра называется состоятельной
Состоятельная оценка
Смотреть что такое «Состоятельная оценка» в других словарях:
Состоятельная оценка — в математической статистике это точечная оценка, сходящаяся по вероятности к оцениваемому параметру. Содержание 1 Определения 2 Свойства 3 … Википедия
СОСТОЯТЕЛЬНАЯ ОЦЕНКА — сокращенный вариант термина лсостоятельная последовательность оценок … Математическая энциклопедия
ОЦЕНКА СТАТИСТИЧЕСКАЯ — функция от случайных величин, применяемая для оценки неизвестных параметров теоретич. распределения вероятностей. Методы теории О. с. служат основой современной теории ошибок; обычно в качестве неизвестных параметров выступают измеряемые физич.… … Математическая энциклопедия
ОЦЕНКА СОСТОЯТЕЛЬНАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ … Социология: Энциклопедия
Пробит-регрессия — (пробит модель, англ. probit) применяемая в различных областях (эконометрика, токсикология и др.) статистическая (нелинейная) модель и метод анализа зависимости качественных (в первую очередь бинарных) переменных от множества… … Википедия
Какая оценка параметра называется состоятельной
Состоятельность, несмещенность и эффективность оценок
Как сравнивать методы оценивания между собой? Сравнение проводят на основе таких показателей качества методов оценивания, как состоятельность, несмещенность, эффективность и др.
Рассмотрим оценку θn числового параметра θ, определенную при n = 1, 2, … Оценка θn называется состоятельной, если она сходится по вероятности к значению оцениваемого параметра θ при безграничном возрастании объема выборки. Выразим сказанное более подробно. Статистика θn является состоятельной оценкой параметра θ тогда и только тогда, когда для любого положительного числа ε справедливо предельное соотношение
Пример 3. Из закона больших чисел следует, что θn = является состоятельной оценкой θ = М(Х) (в приведенной выше теореме Чебышёва предполагалось существование дисперсии D(X); однако, как доказал А.Я. Хинчин [6], достаточно выполнения более слабого условия – существования математического ожидания М(Х)).
Пример 4. Все указанные выше оценки параметров нормального распределения являются состоятельными.
Вообще, все (за редчайшими исключениями) оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются состоятельными.
Пример 5. Так, согласно теореме В.И. Гливенко, эмпирическая функция распределения Fn(x) является состоятельной оценкой функции распределения результатов наблюдений F(x).
При разработке новых методов оценивания следует в первую очередь проверять состоятельность предлагаемых методов.
Второе важное свойство оценок – несмещенность. Несмещенная оценка θn – это оценка параметра θ, математическое ожидание которой равно значению оцениваемого параметра: М(θn) = θ.
поэтому оценки s 2 и (σ 2 )** не являются состоятельными оценками дисперсии σ 2 нормального распределения.
Оценки, для которых соотношение М(θn) = θ неверно, называются смещенными. При этом разность между математическим ожиданием оценки θn и оцениваемым параметром θ, т.е. М(θn) – θ, называется смещением оценки.
Смещение оценки s 2 стремится к 0 при n → ∞.
Оценка, для которой смещение стремится к 0, когда объем выборки стремится к бесконечности, называется асимптотически несмещенной. В примере 7 показано, что оценка s 2 является асимптотически несмещенной.
(3)
т.е. математическое ожидание квадрата ошибки складывается из дисперсии оценки и квадрата ее смещения.
Для подавляющего большинства оценок параметров, используемых в вероятностно-статистических методах принятия решений, дисперсия имеет порядок 1/n, а смещение – не более чем 1/n, где n – объем выборки. Для таких оценок при больших n второе слагаемое в правой части (3) пренебрежимо мало по сравнению с первым, и для них справедливо приближенное равенство
(4)
где с – число, определяемое методом вычисления оценок θn и истинным значением оцениваемого параметра θ.
С дисперсией оценки связано третье важное свойство метода оценивания – эффективность. Эффективная оценка – это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.
Доказано [11], что и
являются эффективными оценками параметров m и σ 2 нормального распределения. В то же время для выборочной медианы
справедливо предельное соотношение
Другими словами, эффективность выборочной медианы, т.е. отношение дисперсии эффективной оценки параметра m к дисперсии несмещенной оценки
этого параметра при больших n близка к 0,637. Именно из-за сравнительно низкой эффективности выборочной медианы в качестве оценки математического ожидания нормального распределения обычно используют выборочное среднее арифметическое.
Понятие эффективности вводится для несмещенных оценок, для которых М(θn) = θ для всех возможных значений параметра θ. Если не требовать несмещенности, то можно указать оценки, при некоторых θ имеющие меньшую дисперсию и средний квадрат ошибки, чем эффективные.
Несмещенные и эффективные оценки характеристики
Выборочные характеристики. Состоятельные,
В начале курса были рассмотрены такие понятия как классическая и статистическая вероятности.
=
ifi / n,
для дисперсии D(x) эмпирическим аналогом будет статистическая дисперсия :
S 2 (x) = (xi —
) 2 fi / n.
Эмпирические характеристики , S 2 (x), W(A) являются оценками параметров М(x), D(x), P(A). В тех случаях, когда эмпирические характеристики определяются на основе большого числа опытов, использование их в качестве теоретических параметров не приведет к существенным ошибкам в исследовании, однако в тех случаях, когда число опытов ограничено, ошибка при замене будет существенна. Поэтому к эмпирическим характеристикам, являющимися оценками теоретических параметров предъявляются 3 требования:
оценки должны быть состоятельными, несмещенными и эффективными.
Оценка называется состоятельной, если вероятность отклонения ее от оцениваемого параметра на величину меньшую как угодно малого положительного числа стремится к единице при неограниченном увеличении числа наблюдений n,т.е.
Оценка называется несмещенной, если математическое ожидание этой оценки равно оцениваемому параметру:
М ( / ) =
.
Примером состоятельной и несмещенной оценки систематического ожидания является средняя арифметическая:
М () =
.
Примером состоятельной и смещенной оценки является
Поэтому, чтобы получить несмещенную оценку теоретической дисперсии D(x) надо эмпирическую дисперсию S 2 (x) умножить на n/(n – 1) , т.е.
S 2 (x) = (xi —
) 2 fi / n
n /(n – 1) =
(xi —
) 2 fi/(n – 1).
Практически эту поправку вносят при вычислении оценки дисперсии в тех случаях, когда n
Такая оценка, у которой дисперсия будет наименьшей относительно оцениваемого параметра, называется эффективной. Например, из двух оценок центра рассеивания нормального распределения М(x) эффективной оценкой является , а не
, так как дисперсия
меньше дисперсии
. Сравнительная эффективность этих оценок при большой выборке приближенно равна: D(
) / D
= 2/
= 0,6366.
Практически это означает, что центр распределения генеральной совокупности (назовем его0 ) определяется по
с той же точностью при n наблюдениях, как и при 0,6366 n наблюдениях по средней арифметической
.
4.4. Свойства выборочных средних и дисперсий.
1. Если объем выборки достаточно велик, то на основе закона больших чисел с вероятностью близкой к единице, можно утверждать, что средняя арифметическая и дисперсия S 2 будут как угодно мало отличаться от М(x) и D(x), т.е.
М(x), S 2 (x)
D(x),
2. Ошибка вычисления М(x) по средней выборки зависит от ее объема n и равна
S /
.
Ошибка вычисления среднеквадратического отклонения генеральной совокупности по среднеквадратическому отклонению выборки зависит от ее объема и равна S /
.
3. Если случайная величина X в генеральной совокупности имеет нормальное распределение со средней М(x) и дисперсией D() , то и средние арифметические
выборок из этой совокупности будут подчинены также нормальному распределению со средней
и дисперсией D(
), каков бы не был объем выборок n, лишь бы число выборок было достаточно велико.
4. Когда дисперсия D(x), генеральной совокупности неизвестна, тогда для больших значений n с большей вероятностью малой ошибки можно дисперсию выборочных средних вычислить приближенно по равенству:
D() = S 2 (x) / n,
где S 2 (x) = (xi —
) 2 fi / n— дисперсия большой выборки.
Статистические оценки параметров генеральной совокупности
Определение статистической оценки. Точечные статистические оценки: смещенные и несмещенные, эффективные и состоятельные. Интервальные статистические оценки. Точность и надежность оценки; определение доверительного интервала; построение доверительных интервалов для средней при известном и неизвестном среднеквадратическом отклонении.
Определение статистической оценки
Точечные статистические оценки
Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам. Поэтому нужно потребовать, чтобы математическое ожидание оценки было равно оцениваемому параметру. Соблюдение требования устраняет систематические ошибки.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки ) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при стремится к нулю, то такая оценка оказывается также состоятельной.
Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещённости, эффективности и состоятельности оценивают генеральную среднюю и дисперсию.
Пусть изучается дискретная генеральная совокупность относительно количественного признака. Генеральной средней называется среднее арифметическое значений признака генеральной совокупности. Она вычисляется по формуле
где — значения признака генеральной совокупности объема ; — соответствующие частоты, причем
где — значения, признака в выборочной совокупности объема ; — соответствующие частоты, причем
Если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит- от объема выборки: чем больше объем выборки, тем меньше выборочная средняя отличается от генеральной.
Интервальные оценки
Наряду с точечным оцениванием, статистическая теория оценивания параметров занимается вопросами интервального оценивания. Задачу интервального оценивания можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадежна.
Доверительный интервал для генеральной средней при известном значении среднего квадратического отклонения и при условии, что случайная величина (количественный признак ) распределена нормально, задается выражением
где — наперед заданное число, близкое к единице, а значения функции приведены в таблице прил. 2.
Доверительный интервал для генеральной средней нормального распределения признака при неизвестном значении среднего квадратического отклонения задается выражением
Несмещенные, эффективные и состоятельные оценки
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Ниже указаны эти требования.
Пусть 0* — статистическая оценка неизвестного параметра 0 теоретического распределения. Допустим, что по выборке объема п найдена оценка 0*. Повторим опыт, т.е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку 0*. Повторяя опыт многократно, получим числа 0*, ©2, 0J, которые, вообще говоря, различны между собой. Таким
образом, оценку 0* можно рассматривать как случайную величину, а числа 0*, 0*, 0^ — как ее возможные значения.
Представим себе, что оценка 0* дает приближенное значение 0 с избытком; тогда каждое найденное по данным выборок число
Несмещенной называют статистическую оценку 0*, математическое ожидание которой равно оцениваемому параметру 0 при любом объеме выборки, т.е.
Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Однако было бы ошибочным считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения 0* могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия 0(0*) может быть значительной. В этом случае найденная поданным одной выборки оценка, например 0<, может оказаться весьма удаленной от среднего значения 0* а значит, и от самого оцениваемого параметра 0; приняв 0* в качестве приближенного значения 0, мы допустили бы большую ошибку. Если же потребовать, чтобы дисперсия 0* была малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффективности.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую возможную дисперсию.
При рассмотрении выборок большого объема (п велико!) к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при п —> °° стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при я —> °о стремится к нулю, то такая оценка оказывается и состоятельной.