Точечные статистические оценки свойства оценок реферат

Обновлено: 05.07.2024

Статистическое оценивание

Числовые характеристики генеральной совокупности, как правило, неизвестные (средняя, дисперсия и др.), называются параметрами генеральной совокупности (обозначаются , , ). Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей (обозначается p ).

По данным выборки рассчитываются числовые характеристики, которые называют статистиками (обозначают , , , ). Статистики, получаемые по различным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из выборки, является только оценкой неизвестного параметра генеральной совокупности. Выборочная характеристика, используемая в качестве приближенного значения неизвестной генеральной характеристики, называется ее точечной статистической оценкой . Точечная означает, что оценка представлена одним числом или точкой на числовой оси.

Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки (; ). Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя, выборочной доли – генеральная доля.

Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия ().

Выборочная средняя является точечной оценкой генеральной средней.

Генеральная дисперсия имеет 2 точечные оценки: – выборочная дисперсия (вычисляется при ) и S 2 – исправленная выборочная дисперсия (при n

Иногда для нахождения используют равенство , т.е. , и, следовательно, .

При больших объемах выборки и практически совпадают.

Генеральное среднее квадратическое отклонение также имеет 2 точечные оценки: - выборочное среднее квадратическое отклонение и S – исправленное среднее квадратическое отклонение. используется для оценивания при , а S – для оценивания при n

Выборочная доля w является точечной оценкой генеральной доли.

6.2. Ошибки выборки. Объем выборки.

Так как выборочная совокупность представляет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристики не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности: , либо .

Наибольшее отклонение выборочной средней (или доли) от генеральной средней (или доли), которое возможно с заданной доверительной вероятностью, называется предельной ошибкой выборки () .

Применительно к выборочному методу из теоремы Чебышева при следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала.

Запись показывает, что о величине расхождения между оцениваемым параметром и выборочной статистикой можно судить лишь с определенной вероятностью, от которой зависит величина z . Отсюда следует, что .

При повторном отборе средняя ошибка выборки определяется по формуле

При бесповторном отборе ошибка выборки при нахождении средней определяется по формуле

Аналогично в случае повторного отбора средняя ошибка выборки при определении доли , так как .

При бесповторном отборе ошибка выборки при нахождении доли определяется по формуле .

Одной из важнейших проблем выборочного метода является определение необходимого объема выборки. От объема выборки зависит размер средней ошибки и экономичность проводимого выборочного наблюдения, так как чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибка выборки.

Из формулы предельной ошибки и формул средних ошибок выборки определяются формулы необходимой численности выборки.

При повторном отборе пользуются формулой , а при бесповторном отборе пользуются формулой, где z – корень уравнения или .

6.3. Понятие об интервальных оценках и доверительных интервалах.

Пусть . Если представляет собой предел, которым ограничена сверху абсолютная величина , то . Следовательно, . Из теоремы Чебышева следует, что .

Интервальной оценкой называют оценку, которая определяется двумя числами – концами интервала, который с определенной вероятностью накрывает параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом . Для его определения вычисляется предельная ошибка выборки , позволяющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен находиться параметр генеральной совокупности.

  1. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности (на практике – при большом объеме выборки, т.е. ) и собственно-случайном повторном отборе используется формула
  1. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности (на практике – при большом объеме выборки, т.е. ) и собственно-случайном бесповторном отборе используется формула
  1. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней при неизвестном среднем квадратическом отклонении генеральной совокупности (на практике – при малом объеме выборки, т.е. n собственно-случайном повторном отборе используется формула
  1. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней при неизвестном среднем квадратическом отклонении генеральной совокупности (на практике – при малом объеме выборки, т.е. n собственно-случайном бесповторном отборе используется формула
  1. Для оценки генеральной доли р нормально распределенного количественного признака Х по выборочной доле (при большом объеме выборки, т.е. ) и собственно-случайном повторном отборе используется формула

Границы p 1 и p 2 доверительного интервала для р более точно могут быть найдены по формуле:

Уровень значимости обычно обозначают греческой буквой (альфа).

Статистическая значимость результата представляет собой меру уверенности в его истинности (в смысле репрезентативности выборки). Более точно, уровень значимости α - это показатель, обратно пропорциональный надежности результата. Более высокий уровень соответствует более низкому уровню доверия найденным в выборке результатам, например, зависимостям между переменными. А именно, уровень значимости представляет собой вероятность ошибки, связанной с обобщением наблюдаемого результата на всю популяцию.

Например, α = 0.05 (т.е. 1/20) показывает, что имеется 5% вероятность того, что найденная в выборке зависимость между переменными является лишь случайной особенностью данной выборки. Иными словами, если данная зависимость в популяции отсутствует, а вы многократно проводили бы подобные эксперименты, то примерно в одном из двадцати повторений эксперимента можно было бы ожидать такой же или более сильной зависимости между изучаемыми переменными. Во многих исследованиях α =0.05 рассматривается как приемлемая граница уровня ошибки.

Параметр
Параметр – это величина, обычно неизвестная и, следовательно, подлежащая оценке, которая представляет определенную характеристику генеральной совокупности. Например, математическое ожидание μ распределения – это параметр, характеризующий центральную тенденцию. По имеющейся у нас выборке мы можем посчитать значение статистики, используемой для оценки параметра .

Например , среднее выборки дает информацию о среднем μ генеральной совокупности, из которой была сделана эта выборка. Поскольку выборка случайна, это значение также случайно.
Параметры часто обозначают греческими буквами (например, ), а соответствующие статистики – латинскими (например, s ).

Точечные и интервальные оценки.

Оценки неизвестных параметров бывают двух видов – точечные и интервальные .
Точечная оценка - оценка имеющая конкретное числовое значение. Например, среднее арифметическое:

где: - среднее арифметическое (точечная оценка математического ожидани я μ );
x1,x2. xn - выборочные значения; n - объем выборки.

Интервальная оценка - оценка представляемая интервалом значений, внутри которого с задаваемой исследователем вероятностью 1- α находится истинное значение оцениваемого параметра. Интервал в интервальной оценке называется доверительным интервалом , задаваемая исследователем вероятность, 1- α, называется доверительной вероятностью . В практике статистических вычислений применяются стандартные значения доверительной вероятности: 0,95, 0,98 и 0,99 (95%, 98% и 99% соответственно).

Например, пусть интервальная оценка математического ожидани я μ равна (3; 8) при доверительной вероятности 0,95. Это означает, что μ лежит в пределах от 3 до 8 с вероятностью 0,95, следовательно вероятность того, что μ меньше 3 или больше 8 не превышает α =0.05.

Выборочное среднее

Перечень всех значений, которые может принимать среднее выборки (или выборочное среднее), а также указание того, как часто эти значения встречаются, называется выборочным распределением выборки. В соответствии с центральной предельной теоремой, при увеличении размера выборкиn выборочные средние начинают подчиняться нормальному распределению вероятностей и концентрироваться вокруг среднего значения генеральной совокупности. Это утверждение оказывается верным независимо от распределения совокупности, из которой была получена выборка.

Распределение всех возможных выборочных средних является приблизительно нормальным для выборок достаточно большого размера.

Изменчивость (стандартное отклонение) выборочного распределения измеряется стандартными ошибками. Стандартная ошибка среднего рассчитывается по формуле:

По мере увеличения размера выборки изменчивость среднего снижается.

Доверительный интервал - это допустимое отклонение наблюдаемых значений от истинных. Размер этого допущения определяется исследователем с учетом требований к точности информации.

Доверительные интервалы для среднего задают область вокруг среднего, в которой с заданным уровнем доверия содержится "истинное" среднее популяции. Если среднее в вашей выборке равно 23, а нижняя и верхняя границы для =0.05 равны 19 и 27 соответственно, то вы можете заключить, что с 95% вероятностью среднее выборки больше 19 и меньше 27.

Говоря более точно, если вы последовательно вычисляете доверительный интервал по большому количеству независимых случайных выборок одинакового размера, то 95% этих интервалов будут, действительно, включать в себя истинные значения среднего, т. е. в 95% случаев вы окажетесь правы, утверждая, что истинное значение среднего содержится внутри данного доверительного интервала.

Если вы установите меньшее значение -уровня, то интервал будет шире, и увеличится "уверенность" в оценке, и наоборот; как мы знаем из прогнозов погоды, чем "неопределеннее" прогноз (т.е. шире доверительный интервал), тем скорее он сбудется. Заметим, что ширина доверительного интервала зависит от размера выборки и дисперсии наблюдений. Вычисление доверительных интервалов основывается на предположении, что переменная в совокупности нормально распределена .

Точечная и интервальная оценки параметров распределения. Несмещенность, состоятельность, эффективность и достаточность оценок. Статистическая оценка выборки, сумма и разность двух выборок. Распространение результатов выборки на генеральную совокупность.

Рубрика Экономика и экономическая теория
Вид реферат
Язык русский
Дата добавления 08.01.2015
Размер файла 60,7 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

1. Статистическая оценка параметров распределения

2. Статистическая оценка выборки

1. Статистическая оценка параметров распределения

статистическая оценка распределение выборка

Оценка - это приближение значений искомой величины, полученное на основании результатов выборочного наблюдения. Оценки являются случайными величинами. Они обеспечивают возможность формирования обоснованного суждения о неизвестных параметрах генеральной совокупности. Примером оценки генеральной средней является выборочная средняя генеральной дисперсии - выборочная дисперсия и т.д.

Основываясь на положениях теории вероятностей, можно доказать, что из таких выборочных характеристик, как средняя арифметическая, мода и медиана, только средняя арифметическая представляет собой состоятельную, несмещенную, эффективную и достаточную оценку генеральной средней. Этим и обуславливается предпочтение, отдаваемое средней арифметической в ряду остальных выборочных характеристик.

Несмещенность оценки проявляется в том, что ее математическое ожидание при любом объеме выборки равно значению оцениваемого параметра в генеральной совокупности. Если это требование не выполняется, то оценка является смещенной.

Условие несмещенности оценки направлено на устранение систематических ошибок оценивания.

При решении задач оценивания применяют также асимптотически несмещенные оценки, для которых при увеличении объема выборки математическое ожидание стремится к оцениваемому параметру генеральной совокупности.

Состоятельность статистических оценок проявляется в том, что с увеличением объема выборки оценка все больше и больше приближается к истинному значению оцениваемого параметра или, как говорят, оценка сходится по вероятности к искомому параметру, или стремится к своему математическому ожиданию. Лишь состоятельные оценки имеют практическую значимость.

- это такая оценка несмещенного параметра, которая обладает наименьшей дисперсией при данном объеме выборки. На практике дисперсия оценки обычно отождествляется с ошибкой оценки.

В качестве меры эффективности оценки принимают отношение минимально возможной дисперсии к дисперсии другой оценки.

Оценка, обеспечивающая полноту использования всей содержащейся в выборке информации о неизвестной характеристике генеральной совокупности, называется достаточной (исчерпывающей).

Соблюдение рассмотренных выше свойств статистических оценок дает возможность считать выборочные характеристики для оценки параметров генеральной совокупности лучшими из возможных.

Основная задача получения статистических оценок заключается в выборе и обосновании наилучших оценок, обеспечивающих возможность содержательной оценки неизвестных параметров генеральной совокупности.

Задача оценки неизвестных параметров может быть решена двумя способами:

1. неизвестный параметр характеризуется одним числом (точкой) - используется метод точечной оценки;

2. интервальная оценка, то есть определяется интервал, в котором с некоторой вероятностью может находиться искомый параметр.

Точечная оценка неизвестного параметра заключается в том, что конкретное числовое значение выборочной оценки принимается за наилучшее приближение к истинному параметру генеральной совокупности, то есть неизвестный параметр генеральной совокупности оценивается одним числом (точкой), определенным по выборке. При таком подходе всегда существует риск совершить ошибку, поэтому точечная оценка должна дополняться показателем возможной ошибки при определенном уровне вероятности.

В качестве средней ошибки оценки принимается ее среднее квадратическое отклонение.

Тогда точечная оценка генеральной средней может быть представлена в виде интервала

где - выборочная средняя арифметическая.

При точечной оценке применяют несколько методов получения оценок по выборочным данным:

1. метод моментов, при котором моменты генеральной совокупности заменяются моментами выборочной совокупности;

2. метод наименьших квадратов;

3. метод максимального правдоподобия.

Во многих задачах требуется найти не только числовую оценку параметра генеральной совокупности, но и оценить ее точность и надежность. Особенно это важно для выборок относительно малого объема. Обобщением точечной оценки статистического параметра является его интервальная оценка - нахождение числового интервала, содержащего с определенной вероятностью оцениваемый параметр.

В связи с тем, что при определении генеральных характеристик по выборочным данным всегда присутствует некоторая ошибка, практичнее определить интервал с центром в найденной точечной оценке, внутри которого с некоторой заданной вероятностью находится истинное искомое значение оцениваемого параметра генеральной характеристики. Такой интервал называют доверительным.

Доверительный интервал - это числовой интервал, который с заданной вероятностью г накрывает оцениваемый параметр генеральной совокупности. Такую вероятность называют доверительной. Доверительная вероятность г - это вероятность, которую можно признать достаточной в рамках решаемой задачи для суждения о достоверности характеристик, полученных на основе выборочных наблюдений. Величину

вероятности допустить ошибку называют уровнем значимости.

Для выборочной (точечной) оценки И * (тета) параметра И генеральной совокупности с точностью (предельной ошибкой) Д и доверительной вероятностью г доверительный интервал определяется равенством:

Доверительная вероятность г дает возможность установить доверительные границы случайного колебания изучаемого параметра И для данной выборки.

В качестве доверительной вероятности принимают зачастую следующие значения и соответствующие им уровни значимости

Таблица 1. - Наиболее употребительные доверительные вероятности и уровни значимости

Даны 3 выборки из генеральных совокупностей (Приложение А) и 3 интервальных вариационных ряда (Приложение Б). По представленным данным выполнить следующие задания:
1) По сгруппированным данным (интервальным вариационным рядам), полученным в лабораторной работе №1, рассчитать точечные оценки для следующих характеристик генеральной совокупности: Математическое ожидание;
Дисперсия; Среднеквадратическое отклонение; Коэффициент асимметрии; Коэффициент эксцесса; Мода; Медиана
2) С помощью надстройки Excel (описательная статистика) получить оценки перечисленных выше характеристик генеральной совокупности по исходным выборкам.

Содержание

Задание………………………………………………………………………… 3
1 Теоретическая часть ……………………………………………………… 4
1.1 Задача точечного оценивания. Требования к точечным оценкам. …. 4
1.2 Методы построения точечных оценок.…………………………….…… 5
2 Практическая часть ……………………………………………………….. 10
2.1 Оценки характеристик по сгруппированным данным..………………… 10
2.2 Оценки характеристик по исходным данным………..………………… 12
2.3 Сравнение полученных результатов…………………………………… 13
2.4 Интерпретация характеристик генеральных совокупностей………… 14
Приложение А – Исходные данные………………………………………… 17
Приложение Б – Интервальные вариационные ряды……………………… 18

Вложенные файлы: 1 файл

Laba_2.docx

Министерство образования и науки Российской Федерации

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

Факультет экономики и управления

Кафедра математических методов и моделей в экономике

По лабораторной работе №2

_______________ Д.В. Корнейченко

“____ “ _______________ 2013 г.

cтудент группы 11Эк(б)ФК-2

“____ “ ______________ 2013 г.

Содержание

1 Теоретическая часть ……………………………………………………… 4

1.1 Задача точечного оценивания. Требования к точечным оценкам. ..…. 4

1.2 Методы построения точечных оценок.…………………………….…… 5

2 Практическая часть …………………………… ………………………….. 10

2.1 Оценки характеристик по сгруппированным данным..……… ………… 10

2.2 Оценки характеристик по исходным данным………..………………… 12

2.3 Сравнение полученных результатов…………………………………… 13

2.4 Интерпретация характеристик генеральных совокупностей………… 14

Приложение А – Исходные данные………………………………………… 17

Приложение Б – Интервальные вариационные ряды……………………… 18

Задание

Даны 3 выборки из генеральных совокупностей (Приложение А) и 3 интервальных вариационных ряда (Приложение Б). По представленным данным выполнить следующие задания:

1) По сгруппированным данным (интервальным вариационным рядам), полученным в лабораторной работе №1, рассчитать точечные оценки для следующих характеристик генеральной совокупности:

  • Математическое ожидание;
  • Дисперсия;
  • Среднеквадратическое отклонение;
  • Коэффициент асимметрии;
  • Коэффициент эксцесса;
  • Мода;
  • Медиана

2) С помощью надстройки Excel (описательная статистика) получить оценки перечисленных выше характеристик генеральной совокупности по исходным выборкам.

3) Провести анализ результатов, полученных по сгруппированным данным в пункте 1 и по исходным данным – выборкам – в пункте 2. Если значения различаются, объяснить, почему так?

4) Написать содержательную интерпретацию характеристик генеральной совокупности.

1 Теоретическая часть

1.1 Задача точечного оценивания. Требования к точечным оценкам

Задача оценивания неизвестных параметров возникает в тех случаях, когда закон распределения генеральной совокупности известен с точностью до параметров (т.е. вид закона известен, параметры неизвестны)

Статистику , выборочное значение которой для любой реализации x1,n, принимают за наилучшее приближенное к неизвестному параметру , называют точечной оценкой параметра , а значение - значением точечной оценки.

Очевидно, что статистику , можно строить по-разному на основе . Возникает вопрос: какими свойствами должна обладать статистика, чтобы являться точечной оценкой? Очевидно, необходимо чтобы , с высокой вероятностью давало значение, близкое к

Требования к точечным оценкам:

I. Статистика называется состоятельной оценкой параметра, если при она стремится по вероятности к, т.е.

Как правило, требование состоятельности обеспечивается теоремами больших чисел.

II. Следующим естественным требованием, независящем от n, является требование несмещенности оценки, согласно которому оценка не дает систематической погрешности в сторону завышения либо занижения значения.

Статистику называют несмещенной оценкой параметра , если математическое ожидание равно оценки равно значению оценки:

Если это требование невыполнимо, то оценку называют смещенной.

Следует отметить, что различные несмещенные оценки могут иметь разную дисперсию, что в дальнейшем сказывается на точности оценки.

III. Третьим требованием является требование эффективности.

Если в некотором классе несмещенных оценок параметра существует такая оценка , которая по сравнению с другими оценками из этого класса обладает наименьшей дисперсией, то оценка называется эффективной.

Эффективная оценка может быть только одна, что следует из теоремы единственности эффективности оценки.

Для доказательства эффективности оценки в случае, когда вид закона распределения генеральной совокупности известен, используется следующая теорема – неравенство Рао-Крамера:

Если - несмещенная оценка параметра генеральной совокупности с плотностью распределения, то имеет место неравенство:

Где – дисперсия оценки,

– количество информации (по Фишеру), содержащемся в одном наблюдении.

Оценка называется эффективной по Рао-Крамеру, если

Эффективная оценка по Рао-Крамеру является эффективной.

1.2 Методы построения точечных оценок

I. Метод аналогии:

Таблица 1 – Распределение генеральной совокупности

Построим с помощью этого метода оценки основных числовых характеристик ξ:

  • математическое ожидание;
  • – дисперсия;
  • – среднеквадратическое отклонение;
  • – коэффициент асимметрии;
  • – коэффициент эксцесса;
  • – мода;
  • – медиана.

1. Среднее арифметическое (выборочное среднее) – является выборочным аналогом математического ожидания. Математическое ожидание характеризует положение распределения случайной величины на оси х. Выборочная средняя равна оценке начального момента первого порядка.

Точечная оценка математического ожидания:

Значение точечной оценки математического ожидания:

На рисунке 1 приведены графики плотности нормального распределения вероятностей с разными значениями математического ожидания.

Рисунок 1 - Плотность нормального распределения вероятностей с разными значениями математического ожидания (на графике по оси абсцисс – значения случайной величины; по оси ординат – вероятность появления данного значения случайной величины)

2. Характеристики степени рассеяния значений случайной величины дают представление о том, как сильно могут отклоняться от своего центра группирования выборочные наблюдения. Выборочная дисперсия определяется как второй центральный момент.

Точечная оценка выборочной дисперсии:

Значение точечной оценки выборочной дисперсии:

3. Выборочное среднеквадратическое отклонение (СКО) используется наряду с выборочной дисперсией для характеристики степени отклонения наблюдаемых значений от среднего значения и оказывается в ряде случаев более удобным и естественным, так как СКО имеет ту же размерность, что и сама анализируемая случайная величина и соответственно характеристики центра группирования.

Точечная оценка среднеквадратического отклонения:

Значение точечной оценки среднеквадратического отклонения:

На рисунке 2 представлен вид плотности нормального распределения вероятностей при разных СКО и одинаковом математическом ожидании.

Рисунок 2 - Плотность нормального распределения вероятностей при разных СКО и одинаковом математическом ожидании

4. В качестве характеристики формы распределения, отражающей асимметрию распределения, служит коэффициент асимметрии – характеристика степени скошенности распределения. Выборочный коэффициент асимметрии рассчитывается с помощью второго и третьего центральных выборочных моментов.

Точечная оценка коэффициента асимметрии:

Значение точечной оценки коэффициента асимметрии:

Все симметричные распределения имеют нулевой коэффициент асимметрии. Положительная асимметрия – вершина распределения слева от центра симметрии (или длинная часть распределения справа); отрицательная асимметрия - вершина распределения справа от центра симметрии (длинная часть распределения слева) (см. рисунок 3).

Рисунок 3 - Плотности распределения вероятностей с разными коэффициентами асимметрии

Точечная оценка коэффициента эксцесса:

Значение точечной оценки коэффициента эксцесса:

6. Модой Mo называется варианта, имеющая наибольшую частоту или относительную частоту.

7. Медианой Me называется варианта, которая делит вариационный ряд на две части, равные по числу вариант

Полученные формулы позволяют рассчитать оценки числовых характеристик на основе исходной выборки.

2. Методы наименьших квадратов. Согласно этому методу оценка стоится исходя из минимизации суммы квадратов отклонений выборочных данных относительно точечной оценки.

3. Метод максимального правдоподобия. Согласно этому методу, необходимо построить функцию правдоподобия случайно выборки ξ1,n из генеральной совокупности ξ с плотностью распределения .

Оценкой максимального правдоподобия параметра называют статистику , значения которой для любой выборки удовлетворяют условию:

2 Практическая часть

2.1 Оценки характеристик по сгруппированным данным

Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.

Естественно, что замена исследования генеральной совокупно­сти исследованием выборки порождает ряд вопросов:

1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?

2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?

3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характе­ристикам, которые могут быть получены из генеральной сово­купности.

Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обыч­но не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом при­ближенного статистического оценивания значений этих парамет­ров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.

Примечание. Строго говоря, в статистике оценка — это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значе­ние.

Различают оценки точечные и оценки интервальные.

Точечная оценка параметров распределения

Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x).

Числовые характеристики этой выборки называются выборочными (эмпирическими) числовыми характеристиками.

Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.

Точечной называют статистическую оценку, которая определяется одним числом.

Точечная оценка характеризуется свойствами:несмещенность, состоятельность и эффективность.

Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.

Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..

В математической статистике показывается, что состоятельной, несмещенной оценкой генерального среднего значения а является выборочное средне:

где хi – варианта выборки, ni – частота варианты хi, – объем выборки.

Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия

Более удобна формула .

Итак, если дана выборка из распределения F(x) случайной величины Х с неизвестным математическим ожиданием а и дисперсией s 2 , то для вычисления значений этих параметров мы имеем право пользоваться следующими приближенными формулами:

Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.

Доверительный интервал

Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.

Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.

Длина доверительного интервала характеризует точность интервального оценивания и зависит от объема выборки и доверительной вероятности. При увеличении объема выборки длина доверит. интервала уменьшается (точность увеличивается), а при стремлении доверительной вероятности к 1 длина доверит. интервала увеличивается (точность уменьшается) Наряду с доверительной вероятностью р часто на практике используют уровень значимости α = 1 - p.

Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.

Доверительный интервал для математического ожидания имеет вид: где S – СКО, - критическое значение распределения Стьюдента (Смотри ПРИЛОЖЕНИЕ 1 к Теме 7)

Доверительный интервал для дисперсии имеет вид

где - обратное распределение хи-квадрат (Смотри ПРИЛОЖЕНИЕ 2 к Теме 7)

ЗАДАЧА. Дана выборка 5, 6, 8, 2, 3, 1, 1, 4. Записать данные в виде вариационного ряда. Определить оценки среднего, дисперсии, и стандартного отклонения а также построить доверительные интервалы для среднего и дисперсии на уровне значимости a=0,05.

Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Так как n = 8, то выборочное среднее и исправленная выборочная дисперсия равны

По таблицам из ПРИЛОЖЕНИЯ 1 и ПРИЛОЖЕНИЯ 2 к Теме 7. находим: ,

Получаем доверительный интервал для математического ожидания

Доверительный интервал для дисперсии

Основные идеи славянофильства: Славянофилы в своей трактовке русской истории исходили из православия как начала.

Читайте также: