Распределения стьюдента и его основные свойства реферат

Обновлено: 05.07.2024

В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о при­надлежности двух выборок одной совокупности. Эти методы основыва­ются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.

Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:

1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;

2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.

3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;

4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:

а) — к интервалу должно относиться около 25% частоты совокупности,

б) — к интервалу должно относиться около 50% частоты совокупности,

в) — к интервалу должно относиться около 75% частоты совокупности,

г) — к интервалу должно относиться около 100% частоты совокупности.

При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух неза­висимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой матери­ал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.

Статистика критерия для случая несвязанных, независимых выборок равна:

где , — средние арифметические в эксперименталь­ной и контрольной группах,

- стан­дартная ошибка разности средних арифметических. Находится из формулы:

где n 1 и n 2 соответственно величины первой и второй выборки.

Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:

где n величина выборки.

Подсчет числа степеней свободы осуществля­ется по формуле:

При численном равенстве выборок k = 2 n - 2.

Далее необходимо срав­нить полученное значение t эмп с теоретическим значением t—рас­пределения Стьюдента (см. приложение к учеб­никам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок.

Пример 1 . В двух группах учащихся — экспериментальной и контрольной — получены следующие результаты по учеб­ному предмету (тестовые баллы; см. табл. 1). [1]

Таблица 1. Результаты эксперимента

Первая группа (экспериментальная) N 1=11 человек

Вторая группа (контрольная)

12 14 13 16 11 9 13 15 15 18 14

13 9 11 10 7 6 8 10 11

Общее количество членов выборки: n 1=11, n 2=9.

Расчет средних арифметических: Хср=13,636; Y ср=9,444

Стандартное отклонение: s x=2,460; s y =2,186

По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:

Считаем статистику критерия:

Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).

Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное сужде­ние в пяти случаях из ста (уровень значимости=5 % или 0,05).

Если полученное в эксперименте эмпирическое значение t превы­шает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе эксперимен­тального обучения.

Здесь могут возникнуть такие вопросы:

1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.

2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.

3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической эксперимен­тальной группы, a — контрольной:

Отсюда следует вывод, что новый метод пока не про­явил себя с хорошей стороны по разным, возможно, при­чинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о пре­имуществе традиционного метода.

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения t осуществляется по формуле:

где — разности между соответствующими значениями переменной X и переменной У, а d - среднее этих разностей;

Sd вычисляется по следующей формуле:

Число степеней свободы k определяется по формуле k= n -1. Рассмотрим пример использования t -критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 2. Изучался уровень ориентации учащихся на художественно-эстети­ческие ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились бе­седы, выставки детских рисунков, были организованы по­сещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических со­ображений в таблице 2 приводятся результаты небольшо­го числа испытуемых. [2]

Таблица 2. Результаты эксперимента

Вспомогательные расчеты

до начала экспери­мента (Х)

экспери­мента (У)

Вначале произведем расчет по формуле:

Затем применим формулу (6), получим:

И, наконец, следует применить формулу (5). Получим:

Число степеней свободы: k =10-1=9 и по таблице При­ложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтерна­тивной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.

В терминах статистических гипотез полученный результат будет звучать так: на 5% уров­не гипотеза Н0 отклоняется и принимается гипотеза Н1 .

Критерий Фишера позволяет сравнивать величины выбороч­ных дисперсий двух независимых выборок. Для вычисления Fэмп нуж­но найти отношение дисперсий двух выборок, причем так, что­бы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фи­шера такова:

где - дисперсии первой и второй выборки соответственно.

Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значе­ние Fэмп всегда будет больше или равно единице.

Чис­ло степеней свободы определяется также просто:

k 1=nl - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k 2= n 2 - 1 для второй выборки.

В Приложе­нии 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).

Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. [3] Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дис­персии тестовых оценок в обоих классах. Резуль­таты тестирования представлены в таблице:

Рассчитав дисперсии для переменных X и Y, получаем:

Тогда по формуле (8) для расчета по F критерию Фишера находим:

По таблице из Приложения 1 для F критерия при степенях свободы в обоих случаях равных k =10 - 1 = 9 находим F крит=3,18 ( c следователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.

Критерий предназначен для срав­нения состояния некоторого свойства у членов двух зави­симых выборок на основе измерений, сделанных по шка­ле не ниже ранговой.

Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (х i , у i ), где х i , у i — результаты двукратного измерения одного и того же свойства у одного и того же объекта.

В педагогических исследованиях объектами изуче­ния могут служить учащиеся, учителя, администрация школ. При этом х i , у i могут быть, например, балловы­ми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства.

Нулевая гипотеза формулируются следующим обра­зом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно раз­личны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.

Ста­тистика критерия (Т) определяется следую­щим образом:

Нулевая гипотеза принимается на уровне значимости 0,05, если наблю­даемое значение T n - ta , где значение n - ta определя­ется из статистических таблиц для критерия знаков Приложения 2.

Пример 4. Учащиеся выполняли контрольную ра­боту, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью фор­мирования данного понятия у учащихся с низким уров­нем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.

Результаты двукратного выполнения ра­боты представляют измерения по шкале по­рядка (пятибалльная шкала). В этих условиях возмож­но применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допуще­ния этого критерия.

Результаты двукратного выполнения работы (в бал­лах) 15 учащимися запишем в форме таблицы (см. табл. 1). [4]

1. Распределение Стьюдента симметрично. В частности, если ~ , то ~ .

2. Случайная величина ~ имеет только моменты порядков . Моменты порядков не определены. В частности,

3. Распределение Стьюдента сходится к стандартному нормальному при . Пусть дана последовательность случайных величин , где ~ , . Тогда по распределению при .

Распределение Стьюдента используется в статистике для точечного оценивания, построения доверительных интервалов и тестирования гипотез, касающихся неизвестного среднего статистической выборки из нормального распределения.

Техника работы с различными распределениями использует понятие производящей функции. При этом вид производящей функции однозначно определяет данное распределение.

Примеры с решениями

Пример 1.Найти производящую функцию нормально распределенной случайной величины , заданной плотностью распределения

Таким образом, производящая функция имеет вид

С помощью производящей функции найдем математическое ожидание

Задачи

Задача 1.С помощью производящей функции найти дисперсию нормально распределенной случайной величины , заданной плотностью распределения

§ 7. Критерий согласия

Рассмотрим задачу проверки правдоподобия гипотез. Предположим, что мы хотим установить, противоречат ли опытные данные гипотезе о том, что случайная величина распределена по данному закону. Для ответа на такой вопрос пользуются так называемыми критериями согласия. Одним из наиболее часто применяемых является критерий Пирсона.

Изложим идею этого критерия сначала для случая дискретной с.в. с возможными значениями Предположим, что произведено независимых опытов, в каждом из которых с.в. приняла определенное значение. На основе этих опытов был составлен статистический ряд распределения с.в. :

где - частота события - число опытов, в которых появилось это событие . Выдвигаем гипотезу , состоящую в том, что с.в. имеет ряд распределения:

а отклонения частот от вероятностей объясняются случайными причинами. Чтобы проверить правдоподобность этой гипотезы, надо выбрать какую-то меру расхождения статистического распределения с гипотетическим.

Таким образом, при большом числе опытов закон распределения величины обладает весьма простыми свойствами: он практически не зависит от закона распределения с.в. и мало зависит от числа опытов , а зависит только от числа значений с.в. и при увеличении приближается к распределению . При таком выборе коэффициентов мера расхождения обычно обозначается :

или, вводя величину под знаком суммы и учитывая, что , где - число значений в м разряде ; получим

если требуется только то, чтобы сумма частот была равна единице (это требование накладывается во всех случаях); или же

если требуется, чтобы совпадало статистическое среднее с гипотетическим, или же

если требуется, кроме того, еще и совпадение дисперсий и т.д.

Для распределения составлены таблицы. Пользуясь ими, можно для каждого значения и числа степеней свободы найти вероятность того, что величина, распределенная по закону , превзойдет это значение.

Критерий согласия можно применять и для непрерывных случайных величин, если, группируя статистический ряд, приближенно заменить непрерывную с.в. дискретной с возможными значениями где - середина -го разряда:

а - частота попадания с.в. в -й разряд ( );

Пусть мы хотим выровнять (сгладить) статистическое распределение с помощью гипотетической плотности . Будем поступать точно так же, как для дискретной с.в. , заменяя частоты их гипотетическими значениями: - т.е. вероятность попадания с.в. в - й разряд, вычисляемая по формуле ; вместо числа значений с.в. берется число разрядов .

Во всем остальном поступаем и рассуждаем также, как для дискретной с.в.

Примеры с решениями

Пример 1.Произведено наблюдений над случайной величиной , возможные значения которой: Результаты 800 опытов представлены в виде таблицы ( - число появлений):

Требуется оценить правдоподобие гипотезы , состоящей в том, что распределена по закону Пуассона с параметром , равным статистическому среднему наблюденных значений с.в. . В качестве уровня значимости принять .

Решение.Разделив на , получим группированный статистический ряд:

0.031 0.101 0.155 0.183 0.219
0.132 0.100 0.044 0.020 0.008 0.008

Найдем статистическое среднее

Вычислим вероятности , соответствующие закону Пуассона, по формуле

По найденному значению рассчитываем вероятности :

0.0243 0.0904 0.1680 0.2081 0.1933
0.1437 0.0890 0.0472 0.0219 0.0091 0.0033

Число степеней свободы в данном случае равно числу значений случайной величины минус единица (первое условие: ) и минус еще единица – совпадение гипотетического математического ожидания со статистическим: По таблице значения распределения находим для и Таким образом, в данном примере гипотеза о пуассоновском распределении с.в. противоречит опытным данным и ее надо отбросить, так как достаточно мала.

Пример 2.Пользуясь критерием согласия Пирсона, определить не противоречат ли опытным данным гипотеза о том, что с.в. , имеющая статистическое распределение

Разряды (-4) – (-3) (-3) – (-2) (-2) – (-1) (-1) - 0
Частоты 0.012 0.050 0.144 0.266
Число попаданий в -й разряд
Разряды 0 ­- 1 1 - 2 2 - 3 3 - 4
Частоты 0.240 0.176 0.092 0.020
Число попаданий в -й разряд

распределена по нормальному закону с теми же математическим ожиданием и дисперсией, уровень значимости

Решение.Определяем число степеней свободы распределения , оно равно числу разрядов минус число наложенных связей: 1) ; 2) ; 3)

Составим таблицу вероятностей попаданий с.в. , подчиненной нормальному закону с параметрами и в разряды:

Разряды (-4) – (-3) (-3) – (-2) (-2) – (-1) (-1) - 0
Вероятности 0.0126 0.0522 0.1422 0.2433
Разряды 0 - 1 1 - 2 2 - 3 3 - 4
Вероятности 0.2668 0.1789 0.0770 0.0212

Пользуясь данными таблиц, вычислим значения

По таблице значений распределения при и находим значение это свидетельствует о том, что выдвинутая нами гипотеза о нормальности распределения с.в. не противоречит опытным данным.

Задачи

Задача 1.Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с эмпирическим распределением выборки объема

Задача 2.Используя критерий Пирсона, при уровне значимости 0.01 установить, случайно или значимо расхождение между эмпирическими частотами , которые вычислены, исходя из гипотезы о нормальном распределении генеральной совокупности :

Распределение Стьюдента (t-распределение) ( реферат , курсовая , диплом , контрольная )

Пусть случайные величины ^ …, независимы и каждая имеет стандартное нормальное распределение /V (0,1) [1] . Говорят, что случайная величина /я, определенная как.


имеет распределение Стьюдента с п степенями свободы (рис. 3.5). М tn= 0; D tn = п / (п — 2) (п > 2); Мо = 0.

Функции плотности распределения Стьюдента с различным числом степеней свободы (для сравнения на том же графике приведена функция плотности нормального распределения).

Рис. 3.5. Функции плотности распределения Стьюдента с различным числом степеней свободы (для сравнения на том же графике приведена функция плотности нормального распределения).

Источник: Гласс Дж. Стэнли Дж. С. 213.

И еще один вопрос должен был бы возникнуть у читателя (правда, за 10 лет чтения автором лекций по рассматриваемому предмету студентам-социологам нашелся лишьодин слушатель, задавший этот вопрос): что делать, если л= 1 или п=2. Дисперсия будет отрицательной? Нам представляется полезным дать ответ на этот вопрос, поскольку ответ позволит читателю-социологу вспомнить коечто из интегрального исчисления и лишний раз убедиться в том, что полученные им на первом курсе знания по высшей математике не бесполезны.

Ответ таков: прил=1 или п-2 дисперсия соответствующего распределения Стьюдента не существует.

Позволим себе привести здесь доказательство этого факта для п= 1 (что, на наш взгляд, должно иметь определенное «воспитательное* значение) ["https://referat.bookap.info", 29].

Плотность распределения Стьюдента имеет вид:

Распределение Стьюдента (t-распределение).

(—oo z ~'e~ x dx). При п— 1 /(х) принимает вид: о.

Распределение Стьюдента (t-распределение).

где const —некоторая величина, не зависящая от нашей переменной х.

Напомним, что, во-первых, дисперсия случайной величиныхравна D (x) — = М [х — М (х)] 2 во-вторых, математическое ожидание случайной величины х с плотностью распределения f (x) вычисляется по формуле: М (х) = Jxf (x)dx;

в-третьих, математическое ожидание величины, распределенной по закону Стьюдента, равно нулю. Поэтому для рассматриваемого случая имеет место цепочка равенств: ?" — ?

Другими словами, интеграл расходится, т. е. интересующая нас дисперсия не существует.

t-распределение Стьюдента - это непрерывное одномерное распределение с одним параметром - количеством степеней свободы. Форма распределения Стьюдента похожа на форму нормального распределения (чем больше число степеней свободы, тем ближе распределение к нормальному). Отличием является то, что хвосты распределения Стьюдента медленнее стремятся к нулю, чем хвосты нормального распределения.

Обычно распределение Стьюдента появляется в задачах, связанных с оценкой математического ожидания нормально распределенных случайных величин. Пусть X1, Xn - независимые случайные величины, нормально распределенные с математическим ожиданием μ и дисперсией σ 2 . Тогда мы можем получить следующие оценки для параметров μ и σ 2 :

При этом оценка математического ожидания не равна в точности μ, а лишь колеблется вокруг этой величины. Разность истинного математического ожидания и рассчитанного на основе выборки, поделенная на масштабирующий коэффициент

имеет распределение, которое называется распределением Стьюдента с N степенями свободы. Есть и другие разделы статистики, в которых появляются случайные величины, распределенные по Стьюденту. Например, распределение Стьюдента используется при оценке значимости коэффициента корреляции Пирсона.

Чаще всего критерий Стьюдента применяется для проверки равенства средних значений в двух выборках.

Пример 2. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Объёмы обеих выборок обязаны совпадать; более того, порядок элементов (в данном случае пациентов) в выборках также обязан совпадать. Такие выборки называются связными. Требуется выяснить, имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Основные распределения, используемые в математической статистике:

F-распределение Фишера. Примеры использования распределения.

Если у нас есть две случайные величины, Y1 и Y2 , имеющие распределение хи-квадрат со степенями свободы a и b соответственно, то их отношение

имеет распределение, которое называется F-распределением со степенями свободы a и b. Также это распределение известно, как распределение Фишера.

Функция плотности вероятности F-распределения для некоторых a и b приведена на графике справа. Её аналитическая форма имеет вид:

Интегральная функция вероятности F-распределения имеет вид:

С помощью нормального распределения определяются три распределения, которые в настоящее время часто используются при статистической обработке данных. В дальнейших разделах книги много раз встречаются эти распределения.

Распределение Пирсона (хи - квадрат) – распределение случайной величины

Распределение хи-квадрат используют при оценивании дисперсии (с помощью доверительного интервала), при проверке гипотез согласия, однородности, независимости, прежде всего для качественных (категоризованных) переменных, принимающих конечное число значений, и во многих других задачах статистического анализа данных.

Распределение t Стьюдента – это распределение случайной величины

В настоящее время распределение Стьюдента – одно из наиболее известных распределений среди используемых при анализе реальных данных. Его применяют при оценивании математического ожидания, прогнозного значения и других характеристик с помощью доверительных интервалов, по проверке гипотез о значениях математических ожиданий, коэффициентов регрессионной зависимости, гипотез однородности выборок и т.д.

Распределение Фишера – это распределение случайной величины

Распределение Фишера используют при проверке гипотез об адекватности модели в регрессионном анализе, о равенстве дисперсий и в других задачах прикладной статистики.

Выражения для функций распределения хи - квадрат, Стьюдента и Фишера, их плотностей и характеристик, а также таблицы, необходимые для их практического использования, можно найти в специальной литературе.

Геометрическое распределение, параметры распределения

Со схемой испытаний Бернулли можно связать еще одну случайную величину x - число испытаний до первого успеха. Эта величина принимает бесконечное множество значений от 0 до + и ее распределение определяется формулой


pk = P(x= k) = q k- 1 p, 0

Я никогда не присоединюсь к движению против войны. Позовите меня, когда появится движение за мир. © Мать Тереза ==> читать все изречения.

Читайте также: