точечная и интервальная
Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Статистическая оценка неизвестного параметра генеральной совокупности одним числом называется точечной. Рассмотрим следующие точечные оценки: смещенные и несмещенные, эффективные и состоятельные.
Для того чтобы статистические оценки давали хорошие приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Укажем эти требования. Пусть Θ^* есть статистическая оценка неизвестного параметра Θ теоретического распределения. Допустим, что по выборке объема n найдена оценка Θ1^*. . Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку Θ2^* и т. д. Получим числа Θ1^*, Θ2^*, …, Θk^*, которые будут различаться. Таким образом, оценку Θ^* можно рассматривать как случайную величину, а числа Θ1^*, Θ2^*, …, Θk^* — как возможные ее значения.
Несмещенной называют статистическую оценку Θ^*, математическое ожидание которой равно оцениваемому параметру Θ, то есть M(Θ^*)=Θ
Смещенной называют статистическую оценку Θ^*, математическое ожидание которой не равно оцениваемому параметру.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при n→∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n→∞ стремится к нулю, то такая оценка оказывается также состоятельной.
Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещённости, эффективности и состоятельности оценивают генеральную среднюю и дисперсию.
Генеральная и выборочная средняя?
Генеральной дисперсией Dg
называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения x¯¯¯g
, которое вычисляется по формуле
Для того чтобы охарактеризовать рассеяние наблюденных значений количественного признака выборки вокруг своего среднего значения хв, вводят сводную характеристику — выборочную дисперсию. Выборочной дисперсией
Dv
называется среднее арифметическое квадратов отклонений наблюденных значений признака от их среднего значения
x¯¯¯v
, которое вычисляется по формуле
Кроме дисперсии для характеристики рассеяния значений признака генеральной (выборочной) совокупности вокруг своего среднего значения используют сводную характеристику — среднее квадратическое отклонение. Генеральным средним квадратическим отклонением называют квадратный корень из генеральной дисперсии:
. Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии:
Интервальные оценки
Наряду с точечным оцениванием, статистическая теория оценивания параметров занимается вопросами интервального оценивания. Задачу интервального оценивания можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадежна.
Доверительным интервалом
для параметра
Θ
называется такой интервал, относительно которого с заранее выбранной вероятностью
p=1−α
, близкой к единице, можно утверждать, что он содержит неизвестное значение параметра
Θ
, то есть
. Чем меньше для выбранной вероятности число
, тем точнее оценка неизвестного параметра
Θ
. И, наоборот, если это число велико, то оценка, проведенная с помощью данного интервала, малопригодна для практики. Так как концы доверительного интервала зависят от элементов выборки, то значения
могут изменяться от выборки к выборке. Вероятность
p=1−α
принято называть доверительной (надежностью). Обычно надежность оценки задается наперед, причем в качестве p берут число, близкое к единице. Выбор доверительной вероятности не является математической задачей, а определяется конкретной решаемой проблемой. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999..