Интервальные оценки параметров распределения кратко

Обновлено: 05.07.2024

Цель работы формирование умений вычисления несмещенных оценок среднего значения, дисперсии и среднего квадратического отклонения генеральной совокупности, построения доверительных интервалов.

Краткие теоретические сведения.

Статистические оценки параметров распределения.

Пусть известно распределение генеральной совокупности, но неизвестны ее числовые характеристики. Одной из задач математической статистики является нахождение оценок неизвестных параметров по выборке.

Оценки неизвестных параметров бывают точечные и интервальные.

Выборочная характеристика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется ее точечной статистической оценкой или статистикой.

Пусть - неизвестная характеристика генеральной совокупности. Ее точечной оценкой называется любая функция , полученная по выборке .

Для того, чтобы точечная оценка хорошо представляла числовую характеристику генеральной совокупности, она должна обладать следующими свойствами:

1. Оценка неизвестного параметра называется несмещенной, если ее математическое ожидание равно неизвестному параметру :

если , то оценка называется смещенной.

2. Оценка называется состоятельной, если

На практике это означает, что чем больше объем выборки, тем точнее оценка.

Точечные оценки числовых характеристик генеральной совокупности.

  1. Выборочную среднюю принимают в качестве оценки генеральной средней a. Это несмещенная и состоятельная оценка.

, где объем выборки.

  1. В качестве точечной оценки генеральной дисперсии принимают исправленную дисперсию . Это несмещенная и состоятельная оценка.

Исправленная выборочная дисперсия:

,где объем выборки, выборочная дисперсия

, где -выборочная средняя, объем выборки.

  1. В качестве оценки генерального среднего квадратического отклонения прини- мают стандартное отклонение S:

, где исправленная выборочная дисперсия.

Интервальные оценки.

Интервальной называют оценку, которая определяется двумя числами - концами интервалов.

Пусть - неизвестный параметр генеральной совокупности и n - его точечная оценка, полученная по выборке. Обозначим через δ – точность оценки, т. е. Для получения интервальной оценки строим доверительный интервал. Для этого задаем доверительную вероятность (или надежность) γ и находим значение δ из соотношения:

, γ – вероятность, близкая к единице.

Это означает, что интервал заключает в себе (покрывает) неизвестный параметр θ с вероятностью γ.

Доверительный интервал–это интервал , который покрывает неизвестный параметр θ с заданной надежностью γ.

Построение доверительных интервалов для числовых характеристик нормальной генеральной совокупности.

Пусть генеральная совокупность имеет нормальное распределение.

1.Доверительный интервал для генеральной средней а имеет вид :

- выборочная средняя, S – стандартное отклонение, полученное по выборке,

- значение распределения Стьюдента с (n-1) степенями свободы для двусторонней критической области с α = 1-γ, где - доверительная вероятность; n – объем выборки.

Значение - называется предельной ошибкой выборки.

2. Доверительный интервал для дисперсии генеральной совокупности:

S 2 - исправленная выборочная дисперсия, n- объем выборки,

U1 и U2 - значения из таблицы с ( n-1) степенями свободы при условии , что

3. Доверительный интервал для среднего квадратического отклонения генеральной совокупности:

S – стандартное отклонение, n- объем выборки, значения U1 и U2 - находятся по таблице с ( n-1) степенями свободы из условия, что

Иногда нужно проводить исследования с заданной точностью . В этом случае необходимо рассчитать объем выборки по формуле:

S 2 - исправленная выборочная дисперсия, - точность оценки, - значение распределения Стьюдента с (n-1) степенями свободы для двусторонней критической области с α = 1-γ, где - доверительная вероятность.

Порядок выполнения работы.

1. Изучить теоретические сведения по теме.

2. Выполнить задания №1 -№ 4, считая, что заданные преподавателем статистические данные получены из генеральных совокупностей с нормальным распределением.

3. Оформить отчет.

Задание №1.

А) Вычислить по третьему и четвертому столбцу ( F3 и F4) выборки D несмещенные оценки генеральной средней а, дисперсии 2 и среднего квадратического отклонения : , S 2 , S.

В) В программе Excel найти по третьему и четвертому столбцу ( F3 и F4) выборки D несмещенные оценки генеральной средней а, дисперсии 2 и среднего квадратического отклонения , используя инструмент Пакет анализа средство Описательная статистика и сравнить результаты.

Задание №2 А) Построить доверительные интервалы для средней а, дисперсии 2 и среднего квадратического отклонения генеральных совокупностей при доверительной вероятности , если из генеральных совокупностей сделаны выборки, используемые в задаче № 1.

В) В программе Excel найти доверительные интервалы для средней а, дисперсии 2 и среднего квадратического отклонения генеральных совокупностей при доверительной вероятности по выборкам из задачи № 1, используя инструмент Пакет анализа средство Описательная статистика. Для нахождения значений таблицы распределения хи-квадрат и Стьюдента использовать Статистические функции.

Задание №3.

Вычислить несмещенные оценки генеральных средних, дисперсий и средних квадратических отклонений по второй тройке столбцов X, Y, Z выборки С, а также найти доверительные интервалы для средних значений генеральных совокупностей при доверительной вероятности , используя Пакет анализа табличного процессора Excel.

Задание №4.

Считая выборки, заданные в задаче №1 пробными, определить минимальный объем выборки n для нахождения доверительного интервала для среднего значения а генеральной совокупности с точностью и доверительной вероятностью ( по выборке F3 и F4 отдельно).

Решение типовых заданий.

Задание 1. Вычислить по выборке F3 несмещенные оценки генеральной средней а, дисперсии 2 и среднего квадратического отклонения : , S 2 , S.

Решение. Исходные данные:

1). Вычислим по данным вариационного ряда F3 выборочную среднюю , которая является несмещенной оценкой генеральной средней по формуле:

2). Вычислим по данным вариационного ряда F3 исправленную дисперсию S 2 , которая является несмещенной оценкой генеральной дисперсии по формуле:

,где объем выборки, выборочная дисперсия.

3). Вычислим по данным вариационного ряда F3 стандартное отклонение S , которое является несмещенной оценкой генерального среднего квадратического отклонения по формуле:

Задание №2. Построить доверительные интервалы для средней а, дисперсии 2 и среднего квадратического отклонения генеральной совокупности при доверительной вероятности =0,8 по данным выборки F3.

1) Построим доверительный интервал для средней генеральной совокупности, пользуясь формулой:

- выборочная средняя, S – стандартное отклонение, полученное по выборке,

- значение распределения Стьюдента с (n-1) степенями свободы для двусторонней критической области с α = 1-γ, где - доверительная вероятность; n – объем выборки.

В нашем случае = 111,7 , доверительная вероятность =0,8 , α = 1-0,8=0,2, n =7, S =7,01.

Из таблицы распределения Стьюдента для двусторонней критической области найдем = = 1,44. Далее находим предельную ошибку выборки:

и строим доверительный интервал:

(111,7-3,8; 111,7+3,8) и получаем (107,9; 115,5).

2) Доверительный интервал для дисперсии генеральной совокупности строим по формуле:

, где S 2 - исправленная выборочная дисперсия, n- объем выборки, U1 и U2 - значения из таблицы с ( n-1) степенями свободы при условии , что

Имеем n = 7, S 2 = 49,2 , число степеней свободы равно n-1 = 7 – 1 =6;

Cтроим доверительный интервал:

= = (27,73 ; 133,94) и получаем (27,73; 133,94).

3) Доверительный интервал для среднего квадратического отклонения генеральной совокупности получаем, извлекая квадратные корни из концов доверительного интервала для дисперсии:

Если доверительный интервал для дисперсии имеет вид: (27,73 2 2 = 49,2, 2 = 4, значение t 2 n-1 находим из таблицы распределения Стьюдента с n-1=7-1=6 степенями свободы для двусторонней критической области с α = 1-γ = 1-0,9 =0,1, получим t 2 n-1 =1,94. Откуда

Задание 4 . С помощью табличного процессора Excel найти по выборке Х несмещенные оценки генеральной средней а, дисперсии 2 и среднего квадратического отклонения и найти доверительный интервал для среднего значения генеральной совокупности с надежностью g = 0,8.

Пусть имеем выборку Х:

Для вычисления точечных оценок , S 2 , S и построения доверительного интервала в программе Excel надо использовать инструмент Пакета анализа средство Описательная статистика, котороеслужит для создания статистического отчета, содержащего информацию о выборочной средней, выборочной дисперсии S 2 , стандартном отклонении, моде, медиане (рис 2.1.).


Вводим в лист таблицы Excel исходные данные, ставим флажок в поле Итоговая статистика и указываем в поле Уровень надежности заданную надежность g = 0,8. (рис.2.2.)


Получаем результаты расчета, которые изображены на рис.2.3.


Проанализируем полученные результаты. На рис.2.3. видно, что выборочная средняя (среднее) = 29,58333333; исправленная дисперсия (дисперсия выборки) S 2 = 2,166666667; стандартное отклонение S =1,471960144; размах выборки (интервал) равен 6, объем выборки (счет) равен 24. В строке Уровень надежности находится предельная ошибка выборки d = 0,396448633 , с помощью которой формируется доверительный интервал . Потому доверительный интервал имеет вид (29,58333333 –0,396448633; 29,58333333 +0,396448633). Округляя значения, получим доверительный интервал (29,187; 29,979) для среднего значения генеральной совокупности с надежностью g = 0,8.

Отчёт о полученных результатах должен содержать:

ü Тему и цель лабораторной работы;

ü формулировку задания с указанием варианта;

ü решения заданий;

ü результаты вычислений, произведенные в табличном процессоре Excel;

ü сравнительный анализ и выводы.

  1. Что называется точечной оценкой неизвестного параметра распределения?
  2. Что называется интервальной оценкой неизвестного параметра распределения?
  3. Как строится доверительный интервал для генеральной средней нормальной совокупности?
  4. Как строятся доверительные интервалы для генеральной дисперсии и среднего квадратического отклонения нормальной совокупности?
  5. С помощью какого средства табличного процессора Excel можно найти точечные оценки параметров распределения и построить доверительный интервал для генеральной средней?

Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода "лучшей" оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение параметра Т, получила название методов интервального оценивания. К их числу принадлежит метод Неймана.

Постановка задачи интервальной оценки параметров заключается в следующем [3, 11].

Имеется: выборка наблюдений (x1, x2, …, xn) за случайной величиной Х. Объем выборки n фиксирован .

Необходимо с доверительной вероятностью g=1–a определить интервал

выполняются с вероятностью , близкой к единице. Перепишем неравенства (1) в другом виде:

Обозначим , и запишем (2) в следующем виде:

Интервал называется доверительным интервалом для параметра , а вероятность - доверительной вероятностью.

Определение. Интервальнойназывают оценку, которая определяется двумя числами – началом и концом интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Пусть - это оценка неизвестного оцениваемого параметра . Пусть - это некоторое положительное число. Если выполняется неравенство:

, то говорят, что интервал покрывает неизвестный параметр .

Определение.Надежностью оценки параметра для заданного называют вероятность того, что интервал покрывает параметр , и обозначают в виде


.

Иными словами, есть мера доверия вычисленной оценке .

Доверительным интервалом называется интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью α.

В педагогике наиболее распространенным является оценка математического ожидания a случайной величины X, распределенной по нормальному закону, при известном среднем квадратическом отклонении σ. В этом случае для оценки математического ожидания a служит интервал:


где – точность оценки, n – объём выборки, – выборочное среднее, t – аргумент функции Лапласа, при котором .

Определение 18.1. Надежностью (доверительной вероятностью)оценки Θ* параметра Θ называется вероятность γ того, что выполняется неравенство | Θ* - Θ | .

В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.

Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.

Понятие интервальной оценки

Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра . Чем меньше разность , тем точнее оценка. Таким образом, положительное число , для которого , характеризует точность оценки и называется Ошибкой оценки (или предельной ошибкой).


Доверительной вероятностью (или надежностью) называется вероятность β, с которой осуществляется неравенство , т. е.


. (3.20)

Заменив неравенство равносильным ему двойным неравенством , или , получим


. (3.21)

Интервал , накрывающий с вероятностью β, , неизвестный параметр , называется Доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β.

Случайной величиной является не только оценка , но и ошибка : ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал накроет параметр с вероятностью β ”, а не так: “Параметр попадет в интервал с вероятностью β ”.


Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β, доверительный интервал, соответствующий доверительной вероятности β, накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует Надежность доверительного оценивания: чем больше β, тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.

Следует, однако, иметь в виду, что с ростом доверительной вероятности β в среднем растет длина доверительного интервала, то есть уменьшается точность доверительного оценивания. Выбор доверительной вероятности определяется конкретными условиями; обычно используются значения β, равные 0,90; 0,95; 0,99.


Вероятность (3.22)

называется Уровнем значимости и характеризует относительное число ошибочных заключений в общем числе заключений.

В формуле (3.21) границы доверительного интервала симметричны относительно точечной оценки. Однако не всегда удается построить интервал, обладающий таким свойством. Более общим является следующее определение.

Интервальной называют оценку, которая определяется двумя числами—концами интервала. Интервальные оценки позволяют установить точность и надежность оценок .


,


где - частость появления событияА в n испытаниях;

m - число появления события А в n испытаниях.

Серия независимых испытаний, в каждом из которых событие А происходит с вероятностью q=1-p, является последовательностью испытаний Бернулли.


Теорема. Пусть m - число наступлений события А в n независимых испытаниях, р - вероятность наступления события А в каждом из испытаний. Тогда - состоятельная, несмещенная и эффективная оценка вероятности р.

28. Статистическая проверка гипотез, система приёмов в математической статистике, предназначенных для проверки соответствия опытных данных некоторой статистической гипотезе. Процедуры С. п. г. позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции Т от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей Т может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики Т находится значение Т0, такое, что если гипотеза верна, то вероятность неравенства T >T0 равна a, где a — заранее заданный значимости уровень. Если в конкретном случае обнаружится, что Т > T0, то гипотеза отвергается, тогда как появление значения Т £ T0 не противоречит гипотезе. Пусть, например, требуется проверить гипотезу о том, что независимые результаты наблюдений x1. xn подчиняются нормальному распределению со средним значением а = a0 и известной дисперсией s 2 . При этом предположении среднее арифметическое результатов наблюдений распределено нормально со среднима = a0 и дисперсией s 2 /n, а величина распределена нормально с параметрами (0, 1). Полагаяможно найти связь междуT0 и a по таблицам нормального распределения. Например, при гипотезе а = a0 событие Т > 1, 96 имеет вероятность а = 0,05. Правило, рекомендующее считать, что гипотеза а = a0 неверна, если Т > 1,96, будет приводить к ложному отбрасыванию этой гипотезы в среднем в 5 случаях из 100, в которых она верна. Если же Т £ 1,96, то это ещё не означает, что гипотеза подтверждается, т.к. указанное неравенство с большой вероятностью может выполняться при а, близких к a0. Следовательно, при использовании предложенного критерия можно лишь утверждать, что результаты наблюдений не противоречат гипотезе а = a0. При выборе статистики Т всегда явно или неявно учитывают гипотезы, конкурирующие с гипотезой а = a0. Например, если заранее известно, что а ³ a0, т. е. отклонение гипотезы а = a0 влечёт принятие гипотезы а > a0, то вместо Т следует взять . Если дисперсия s 2 неизвестна, то вместо данного критерия для проверки гипотезы а = a0 можно воспользоваться т. н. критерием Стьюдента, основанным на статистике которая включает несмещенную оценку дисперсии


и подчинена Стьюдента распределению с n — 1 степенями свободы (подобную задачу см. в ст. Математическая статистика, табл. 1a). Такого рода критерии называются критериями согласия и используются как для проверки гипотез о параметрах распределения, так и гипотез о самих распределениях (см. Непараметрические методы). При решении вопроса о принятии или отклонении какой-либо гипотезы H0 с помощью любого критерия, основанного на результатах наблюдения, могут быть допущены ошибки двух типов. Ошибка "первого рода" совершается тогда, когда отвергается верная гипотеза H0. Ошибка "второго рода" совершается в том случае, когда гипотеза H0 принимается, а на самом деле верна не она, а какая-либо альтернативная гипотеза Н. Естественно требовать, чтобы критерий для проверки данной гипотезы приводил возможно реже к ошибочным решениям. Обычная процедура построения наилучшего критерия для простой гипотезы заключается в выборе среди всех критериев с заданным уровнем значимости и (вероятность ошибки первого рода) такого, который приводил бы к наименьшей вероятности ошибки второго рода (или, что то же самое, к наибольшей вероятности отклонения гипотезы, когда она неверна). Последняя вероятность (дополняющая до единицы вероятность ошибки второго рода) называется мощностью критерия. В случае, когда альтернативная гипотеза Н простая, наилучшим будет критерий, который имеет наибольшую мощность среди всех других критериев с заданным уровнем значимости а (наиболее мощный критерий). Если альтернативная гипотеза Н сложная, например зависит от параметра, то мощность критерия будет функцией, определенной на классе простых альтернатив, составляющих Н, т. е. будет функциейпараметра. Критерий, имеющий наибольшую мощность при каждой альтернативной гипотезе из класса Н, называется равномерно наиболее мощным, однако следует отметить, что такой критерий существует лишь в немногих специальных ситуациях. В задаче проверки гипотезы о среднем значении нормальной совокупности а = а0 против альтернативной гипотезы а > a0равномерно наиболее мощный критерийсуществует, тогда как при проверке той жегипотезы против альтернативы а ¹ a0 его нет. Поэтому часто ограничиваются поиском равномерно наиболее мощных критериев в тех или иных специальных классах (Инвариантных, несмещенных критериев и т.п.).

Теория С. п. г. позволяет с единой точки зрения трактовать выдвигаемые практикой различные задачи математической статистики (оценка различия между средними значениями, проверка гипотезы постоянства дисперсии, проверка гипотезы независимости, проверка гипотез о распределениях и т.п. Идеи последовательного анализа, примененные к С. п. г., указывают на возможность связать решение о принятии или отклонении гипотезы с результатами последовательнопроводимых наблюдений (в этом случае число наблюдений, на основе которых по определённому правилу принимается решение, не фиксируется заранее, а определяется в ходе эксперимента)

Вспомним первый урок по теме (там же внизу оглавление) и основной метод математической статистики. Он состоит в том, что для изучения генеральной совокупности объёма из неё производится выборка, состоящая из элементов, которая хорошо характеризует всю совокупность (свойство представительности). И на основании исследования этой выборочной совокупности мы с высокой достоверностью можем оценить генеральные характеристики. Чаще всего требуется выявить закон распределения генеральной совокупности (о чём пойдёт речь позже) и оценить его важнейшие числовые параметры, такие как генеральная средняя , генеральная дисперсия и среднее квадратическое отклонение .

Очевидно, что для оценки этих параметров нужно вычислить соответствующие выборочные значения. Так, выборочная средняя позволяет нам оценить генеральную среднюю , причём, оценить её точечно. Почему точечно? Потому что – это отдельно взятое, конкретное значение. Если из той же генеральной совокупности мы будем проводить многократные выборки, то в общем случае у нас будут получаться различные выборочные средние, и каждая из них представляет собой точечную оценку генерального значения .

Аналогично, несмещённой точечной оценкой генеральной дисперсии является исправленная выборочная дисперсия , и соответственно, стандартного отклонения – исправленное стандартное отклонение .

…что-то не понятно / недопонятно в терминах? Срочно изучать предыдущие уроки!

Недостаток точечных оценок состоит в том, что при небольшом объёме выборки (как оно часто бывает), мы можем получать выборочные значения, которые далеки от истины.
И в этих случаях логично потребовать, чтобы выборочная характеристика (средняя, дисперсия или какая-то другая) отличалась от генерального значения не более чем на некоторое положительное значение . А точнее, менее.

Значение называется точностью оценки, и озвученное выше требование можно записать с помощью модуля:

А теперь я раскрою модуль:

и сформулирую суть:

На данном уроке будут рассмотрены:

  • доверительный интервал для… – заголовок параграфа в поле зрения; – быстрая ссылка для опытных читателей.

Доверительный интервал для оценки генеральной средней
нормально распределённой генеральной совокупности

…да-да, пример уже 21-й!

Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением . Найти доверительный интервал для оценки математического ожидания с надежностью 0,95, если выборочная средняя , а объем выборки .

Внимание! Важное замечание: если в задаче указан тип выборки (повторная / бесповторная), то решение будет иметь свои особенности – читайте 10-ю статью об оценках по повторной и бесповторной выборке.

А теперь принципиальный момент непосредственно по задаче:

здесь известно стандартное отклонение генеральной совокупности.

Дело в том, что в похожих задачах оно бывает не известно, и тогда решение будет отличаться!

Но сейчас решение таково, разбираемся в ситуации:

– из генеральной совокупности попугаев проведена выборка в особей и по её результатам найдена выборочная средняя: (средняя масса попугая, например).

Выборочная средняя – это точечная оценка неизвестной нам генеральной средней . Как отмечалось выше, недостаток точечной оценки состоит в том, что она может оказаться далёкой от истины. И по условию, требуется найти интервал , которой с вероятностью накроет истинное значение .

Именно так! Здесь будет неверным сказать, что попадёт в этот интервал.

Решаем. Точность оценки рассчитывается по формуле , где – коэффициент доверия. Этот коэффициент отыскивается из соотношения , где – функция Лапласа.

В данном случае , следовательно:

И по таблице значений функции Лапласа либо пользуясь расчётным макетом (пункт 5*), выясняем, что значению соответствует аргумент .

Таким образом, точность оценки:

и искомый доверительный интервал:

Этот интервал с вероятностью (надёжностью) накрывает истинное генеральное значение среднего веса попугая. Но всё же остаётся 5%-ная вероятность, что генеральная средняя окажется вне найденного интервала.

Ответ: .

И тут возникает светлая мысль уменьшить этот интервал – чтобы получить более точную оценку. Что для этого можно сделать? Давайте посмотрим на формулу .

Очевидно, что чем меньше стандартное отклонение (мера разброса значений), тем короче доверительный интервал. Но это в отдельно взятой задаче ни на что не влияет – ведь нам известно конкретное значение , и изменить его нельзя.

, то есть о том, что этот более узкий интервал накроет генеральную среднюю, мы теперь можем утверждать лишь с вероятностью 68,26%. Что, конечно, неудовлетворительно, для серьёзного статистического исследования.

Поэтому для уменьшения доверительного интервала (при том же значении ) остаётся увеличивать объём выборки . Что совершенно понятно и без формулы , ведь чем больше объём выборки, тем точнее она характеризует генеральную совокупность (при прочих равных условиях). Об объёме мы поговорим на уроке об оценках по повторной и бесповторной выборке, ну а пока продолжаем.

Творческая задача для самостоятельного решения:

По результатам выборочного исследования объектов найдена выборочная средняя .

1) С какой вероятностью можно утверждать, что генеральная средняя отличается от найденного значения менее чем на 3, если известно, что генеральная совокупность распределения нормально с дисперсией 400?

2) Определить доверительный интервал, который с надежностью накроет истинное значение генеральной средней.

Расчётный макет (пункты 5 и 5*) – в помощь. Краткое решение в конце урока.

И тут, наверное, у вас назрели вопросы – а откуда известно, что генеральная совокупность распределена нормально, и тем более, откуда известно её стандартное отклонение?

Обычно эта информация известна из предыдущих исследований. Классический пример – измерительный прибор. Очевидно, что его случайные погрешности удовлетворяют условию теоремы Ляпунова, а значит, распределены нормально. Кроме того, производитель, как правило, тестирует прибор, и указывает в его паспорте стандартное отклонение случайных погрешностей измерений, которое можно принять за .

Но если установить нормальность распределения достаточно просто (в том числе статистическими методами), то с генеральным значением всё сложнее – зачастую вычислить его трудно или невозможно.

В такой ситуации остаётся ориентироваться на исправленное стандартное отклонение , и решение несколько изменится. Ещё одна классическая задача, которая уже встретилась ранее:


В результате 10 независимых измерений некоторой величины , выполненных с одинаковой точностью, полученные опытные данные, которые представлены в таблице:

Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

Не путать со случайными ошибками измерительного прибора! Здесь речь идёт об измерениях и помимо технических, велико влияние других, в частности, человеческого фактора, особенно, если вы используете махрово-аналоговый прибор – что-нибудь вроде механического секундомера или линейки.

Теперь построим доверительный интервал для оценки истинного (генерального) значения величины .

Если генеральное стандартное отклонение не известно

(наш случай), то этот интервал строится по похожей формуле:

, с той поправкой, что коэффициент доверия рассчитывается с помощью распределения Стьюдента. В рамках курса теорвера я не рассказывал об этом распределении, и поэтому ограничусь технической стороной вопроса.

Значение можно найти с помощью таблицы значений распределения Стьюдента, в частности, популярна таблица, специально адаптированная для данной задачи*. И, согласно этой таблице, доверительной вероятности и объёму выборки соответствует коэффициент доверия:

* В стандартной же таблице приводятся значения для так называемого уровня значимости и числа степеней свободы .

Вычислим точность оценки:

Таким образом, искомый доверительный интервал:

– данный интервал с вероятностью накрывает истинное значение измеряемой величины .

Ответ:

Для самостоятельного решения:

На основании испытаний установлено, что в среднем для изготовления шавермы полупроводникового диода требуется секунд, а исправленное среднее квадратическое отклонение составляет секунд. Предположив, что время изготовления диода есть нормальная случайная величина, определить с надежностью доверительный интервал для оценки среднего времени изготовления диода

Краткое решение и ответ в конце урока – расчётный макет (Пункт 10б) – в помощь.

Итак, что главное в разобранных задачах? Главное, обратить внимание, генеральное ли нам дано отклонение или исправленное выборочное . От этого зависит, какую формулу нужно использовать, эту:
, где ,
или эту:
, где отыскивается с помощью распределения Стьюдента.

И быстренько более редкая задача:

Доверительный интервал для оценки
генеральной дисперсии и стандартного отклонения

Этот интервал можно построить несколькими способами, которые я постараюсь уместить буквально в пару экранов. И сейчас последует продолжение той же задачи об измерениях:

По равноточным измерениям найдено исправленное среднее квадратическое отклонение . Предполагая, что результаты измерений распределены нормально, построить доверительный интервал для оценки истинного значения (генерального стандартного отклонения) с надёжностью .

Обратите внимание, что для решения этой задачи нам не обязательно знать выборочную среднюю (хотя в Примере 23 мы её нашли).

Данный интервал с вероятностью (надёжностью) накрывает истинное значение . И если из всех частей неравенства извлечь корни, то получим соответствующий интервал для оценки генерального стандартного отклонения:

Значения известны, и осталось разобраться с нижним этажом. Во-первых, вычислим:

и теперь, по таблице критических значений распределения или с помощью расчётного макета (Пункт 11б) находим:

Способ второй. Другой, более простой подход состоит в построении симметричного интервала по формуле:
, где значение отыскивается по соответствующей таблице.

Согласно таблице, доверительной вероятности и объёму соответствует значение , таким образом:

В результате мы получили примерно такой же по размаху интервал. Для малых выборок может даже получиться , в таких случаях принимают ещё более грубую интервальную оценку:

Ответ: 1) , 2) .

Как и для распределения Стьюдента, при увеличении распределение хи-квадрат стремится к нормальному, и уже при можно использовать приближенную формулу:
, где коэффициент доверия определяется из знакомого лапласовского соотношения .

Точнее завершаю, и ради исследовательского интереса предлагаю продолжить вам – экзаменационный Пример 20:

В результате обработки экспериментальных данных объёма мы получили следующие выборочные характеристики: .

В предположении о нормальном распределении генеральной совокупности, с надёжностью определить доверительные интервалы:

1) для оценки неизвестной генеральной средней ;

2) для оценки генерального среднего квадратического отклонения двумя способами – с помощью распределения хи-квадрат: и приближённо, по формуле , где .

Краткое решение и примерный образец оформления в конце урока, который подошёл к концу. В следующей небольшой статье я разберу частную, но весьма популярную задачку по этой же теме – Оценка вероятности биномиального распределения, ну а если вам не терпится, то сразу к послеследующей статье.

До скорых встреч!

Решения и ответы:

Пример 22. Решение:

1) По условию, точность оценки равна и дисперсия .
Из формулы найдём коэффициент доверия:

Вычислим соответствующую доверительную вероятность:
– таким образом, с вероятностью 86,64% можно утверждать, что генеральная средняя отличается от менее чем на (т.е. находится в доверительном интервале от 90 до 96)

2) Для доверительной вероятности :
– этому значению функции Лапласа соответствует аргумент: .
Вычислим точность оценки:

Определим доверительный интервал:

– данный интервал с вероятностью 99% накрывает истинное значение .

Пример 24. Решение: доверительный интервал для оценки истинного значения измеряемой величины имеет вид:

Для заданного уровня доверительной вероятности и количества степеней свободы по таблице распределения Стьюдента находим: .

Вычислим точность оценки:
сек.

Таким образом, искомый доверительный интервал:

– данный интервал с вероятностью 99,9% накрывает истинное значение среднего времени изготовления одного диода.

Пример 26. Решение: вычислим исправленное среднеквадратическое отклонение:

1) Определим доверительный интервал , где .
Для уровня доверительной вероятности и объёма выборки по соответствующей таблице найдём .
Вычислим точность оценки:

Таким образом:

– с вероятностью данный интервал накроет генеральное среднее значение .

2) Найдём доверительный интервал для генерального стандартного отклонения .

а) С помощью распределения :

Вычислим и с помощью соответствующей функции Экселя (Пункт 11б) найдём:

Таким образом:

– искомый интервал, накрывающий генеральное значение с вероятностью .

б) Дадим интервальную оценку приближенно, с помощью формулы:

Коэффициент доверия найдём из соотношения . В данном случае:
, и с помощью таблицы или расчётного макета (Пункт 5*), выясняем, что .
Таким образом:

– искомый интервал.

Ответ:
1) ,
2) с помощью распределения и приближённо.

Автор: Емелин Александр

(Переход на главную страницу)

cкидкa 15% на первый зaкaз, при оформлении введите прoмoкoд: 5530-hihi5

Читайте также: