Реферат методы математической статистики t критерий стьюдента

Обновлено: 02.07.2024

Критерий t Стьюдента направлен на оценку различий величин средних и двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.

Прикрепленные файлы: 1 файл

testy_po_kombinatorike.doc

Т - Критерий Стьюдента

Критерий t Стьюдента направлен на оценку различий величин средних и двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.

Случай несвязных выборок

В общем случае формула для расчета по t - критерию Стьюдента такова:

Рассмотрим сначала равночисленные выборки. В этом случае n1 = n2 = n, тогда выражение (9.2) будет вычисляться следующим образом:

В случае неравночисленных выборок , выражение будет вычисляться следующим образом:

В обоих случаях подсчет числа степеней свободы осуществляется по формуле:

где n1 и n2 соответственно величины первой и второй выборки.

Понятно, что при численном равенстве выборок k = 2 n - 2.

Рассмотрим пример использования t - критерия Стьюдента для несвязных и неравных по численности выборок.

Пример: Психолог измерял время сложной сенсомоторной реакции выбора

(в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающихся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.

Результаты эксперимента представим в виде табл. 9, в которой произведем ряд необходимых расчетов:

Отклонение от среднего

Средние арифметические составляют в экспериментальной группе , в контрольной группе

Разница по абсолютной величине между средними

Подсчет выражения дает:

Тогда значение , вычисляемое по формуле (9.1), таково:

Строим ``ось значимости'':

Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,]% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.

В терминах статистических гипотез это утверждение звучит так: гипотеза о сходстве отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза - о различии между экспериментальной и контрольными группами.

Случай связных выборок

В случае связных выборок с равным числом измерений в каждой можно использовать более простую формулу t - критерия Стьюдента.

Вычисления значений осуществляется по формуле:

где - разности между соответствующими значениями переменной X и переменной Y, а среднее этих разностей.

В свою очередь вычисляется по следующей формуле:

Число степеней свободы k определяется по формуле k = n - 1

Рассмотрим пример использования t - критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Пример: Психолог предположил, что в результате научения время решения эквивалентных задач ``игры в 5'' (т. е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач. Решение задачи представим в виде табл. 10.

Вначале произведем расчет по формуле:

Затем применим формулу:

И, наконец, следует применить формулу. Получим:

Число степеней свободы: k = 8 - 1 = 7 и по табл. 17 приложения 6 находим :

Строим ``ось значимости'':

Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза отклоняется и принимается гипотеза -- о различиях.

Для применения t - критерия Стьюдента необходимо соблюдать следующие условия:

Измерение может быть проведено в шкале интервалов и отношений.

Сравниваемые выборки должны быть распределены по нормальному закону.

Критерий Фишера в оценке альтернативных


вариантов эконометрических моделей.

Одним из способов сравнения альтернативных вариантом эконометрических моделей является метод наименьших квадратов. Допустим мы имеем два альтернативных варианта эконометрических моделей для одного и того же процесса.

которые могут различаться как по составу независимых переменных ( ) и по значением параметров ( ), так и по виду функциональных зависимостей , .

Набор статистических данных для исследуемого процесса представлен таблицей:

Заметим, что не все независимые переменные из статистических данных могут входить в эконометрические модели, а наборы переменных в моделях также могут различаться. Затем подсчитываются суммарные квадратические отклонения для каждой модели.

где и - вычисляемые значения зависимой переменной для первой и второй моделей соответственно.

где через - обозначено число независимых переменных в модели (1), а через - число независимых переменных во второй модели (2). Этот критерий является двухсторонним, т.е. его значение позволяет оценить более подходящую модель или утверждать, что они практически равноценны.

Предварительно вычисляется табличное значение критерия Фишера , (7)

где и число степеней свободы, а - заданный уровень доверительного интервала.

Если выполняются неравенства

то рассматриваемые альтернативные варианты эконометрических моделей считаются равносильными по степени их соответствия реальному процессу.

Если же выполнено неравенство

то выбирается первый вариант модели (1).

Ели выполняется неравенство

то выбирается вторая модель (2) как лучше отражающая реальный процесс.


^ Частные корреляции взаимосвязи между факторами.

Обычно кроме исследования таблиц парных корреляционных коэффициентов связи переменных используют коэффициент частной корреляции. При этом исследуется связь между факторами при условии, что некоторые из них или даже все остальные факторы остаются неизменными.

Коэффициент частной корреляции между зависимой переменной и независимой переменной при условии, что фактор закреплен на постоянном уровне (считается постоянным) вычисляется по формуле:

где - коэффициент корреляции влияния независимой переменной - на зависимую переменную , - коэффициент парной корреляции двух независимых факторов и .

Если считается неизменным только один фактор, то такой коэффициент называется коэффициентом частной корреляции первого порядка. Если же постоянными считаются два фактора, то он называется коэффициентом частной корреляции второго порядка, и т.д. По числу переменных, считающимися постоянными, определяется порядок частной корреляции. Обычный коэффициент парной корреляции в этом смысле является частным коэффициентом корреляции нулевого порядка.

В выражении (10) коэффициент частной корреляции первого порядка выражается через корреляционные коэффициенты нулевого порядка. Далее коэффициенты частной корреляции более высоких порядков определяются по индукции через коэффициенты частной корреляции более низких порядков. Приведем общую формулу определения частной корреляции - го порядка через частные корреляции - го порядка.

Легко понять, что значения частных корреляций произвольных порядков меняются от –1 до 1, т.е. их абсолютная величина не превосходит 1. Следует отметить, что малость коэффициентов частной корреляции низких порядков не гарантирует малости коэффициентов частной корреляции более высоких порядков. Например, коэффициенты могут быть оба малы, а вот коэффициент может иметь достаточно большое значение. Например, при значение может быть значительно больше, чем значение . Коэффициент частной корреляции более высокого порядка может увеличиваться и за счет отрицательного значения произведения .

линейной множественной регрессии.

Если коэффициенты парной корреляции независимых переменных близки к нулю, т.е. между независимыми факторами , нет корреляционной зависимости, то в качестве коэффициентов влияния независимых факторов на зависимую переменную в линейной регрессионной модели могут быть взяты коэффициенты парных корреляций . Однако, если факторы-аргументы не являются случайными величинами, то коэффициенты корреляции не могут быть использованы при построении уравнения линейной регрессии, так как они не могут быть интерпретированы как показатели тесноты связи между факторами и зависимой переменной.

Существенность вводимых факторов в случае линейной множественной регрессии может быть проверена одновременно с существенностью коэффициентов регрессии.

Для проверки существенности влияния вычисляется отношение

где , - коэффициент множественной регрессии; - среднее квадратическое отклонение этого коэффициента.

Если взятого по таблицам t-распределения Стьюдента, то с заданной вероятностью не отвергается гипотеза, что соответствующий коэффициент регрессии в генеральной совокупности (который не известен, и который нужно оценить по данным выборки) равняется нулю. При этом - ый фактор в таком случае признается несущественным для построенного уравнения регрессии.

При проведении исследования может оказаться, что вычисленные значения для нескольких факторов не превышают . В этом случае несущественные факторы из уравнения регрессии исключаются поочередно, начиная с наименьшего по абсолютной величине . Фактор, соответствующий минимальному значению , из уравнения регрессии исключается, и после этого заново решается система линейных относительно параметров уравнений. Затем вновь вычисляются значения для всех оставшихся в уравнении коэффициентов, определяется минимальное значение , которое сопоставляется с . Если окажется, что это минимальное значение , то фактор , соответствующий этому минимальному исключается из функционала.

Процесс исключения коэффициентов и факторов из уравнения повторяется до тех пор, пока не будет выполняться соотношение для всех . В этом случае все остающиеся в уравнении переменные будут являться существенными.

После указанных действий и в предположении взаимной независимости между собой существенных переменных мы придем к уравнению линейной регрессии

в котором коэффициенты между собой уже не связаны. Их численные значения зависят от выбранных единиц измерения каждого из факторов. Чтобы коэффициенты регрессии стали сравнимы по величинам, приведем коэффициенты уравнения к стандартизированному масштабу. Для этого все переменные приводят к безразмерным, так называемым стандартизированным, единицам измерения. Достигается это следующими преобразованиями:

где и - значения исходных переменных в исходном, т.е. натуральном масштабе, , - средние значения этих переменных, и - соответствующие значения факторов в стандартизованном масштабе. Свободный член в стандартизированном уравнении линейной множественной регрессии отсутствует, т.е. и уравнение имеет вид:

В этом уравнении уже все переменные выражены в сравнимых единицах измерений. Коэффициенты этого уравнения называются коэффициентами регрессии в стандартизированном масштабе. Для их определения необязательно снова решать систему линейных уравнений. Переход от коэффициентов к коэффициентам может осуществляться по формулам

где - соответствующие средне квадратические отклонения.

На практике часто уравнение регрессии в стандартизированном виде содержит еще один фактор – время (t). В этом случае оно имеет вид:

– общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

Уильям Госсет

Уильям Госсет

1. История разработки t-критерия

2. Для чего используется t-критерий Стьюдента?

t-критерий Стьюдента используется для определения статистической значимости различий средних величин. Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата). В последнем случае рассчитывается парный t-критерий Стьюдента

3. В каких случаях можно использовать t-критерий Стьюдента?

Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. Также имеет значение равенство дисперсий (распределения) сравниваемых групп (гомоскедастичность). При неравных дисперсиях применяется t-критерий в модификации Уэлча (Welch's t).

При отсутствии нормального распределения сравниваемых выборок вместо t-критерия Стьюдента используются аналогичные методы непараметрической статистики, среди которых наиболее известными является U-критерий Манна — Уитни.

4. Как рассчитать t-критерий Стьюдента?

Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:


где М1 - средняя арифметическая первой сравниваемой совокупности (группы), М2 - средняя арифметическая второй сравниваемой совокупности (группы), m1 - средняя ошибка первой средней арифметической, m2 - средняя ошибка второй средней арифметической.

5. Как интерпретировать значение t-критерия Стьюдента?

Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n1 и n2). Находим число степеней свободы f по следующей формуле:

После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже).

Сравниваем критическое и рассчитанное значения критерия:

  • Если рассчитанное значение t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
  • Если значение рассчитанного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.

6. Пример расчета t-критерия Стьюдента

Для изучения эффективности нового препарата железа были выбраны две группы пациентов с анемией. В первой группе пациенты в течение двух недель получали новый препарат, а во второй группе - получали плацебо. После этого было проведено измерение уровня гемоглобина в периферической крови. В первой группе средний уровень гемоглобина составил 115,4±1,2 г/л, а во второй - 103,7±2,3 г/л (данные представлены в формате M±m), сравниваемые совокупности имеют нормальное распределение. При этом численность первой группы составила 34, а второй - 40 пациентов. Необходимо сделать вывод о статистической значимости полученных различий и эффективности нового препарата железа.

Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:

В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о при­надлежности двух выборок одной совокупности. Эти методы основыва­ются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.

Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:

1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;

2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.

3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;

4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:

а) — к интервалу должно относиться около 25% частоты совокупности,

б) — к интервалу должно относиться около 50% частоты совокупности,

в) — к интервалу должно относиться около 75% частоты совокупности,

г) — к интервалу должно относиться около 100% частоты совокупности.

При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух неза­висимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой матери­ал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.

Статистика критерия для случая несвязанных, независимых выборок равна:

где , — средние арифметические в эксперименталь­ной и контрольной группах,

- стан­дартная ошибка разности средних арифметических. Находится из формулы:

где n 1 и n 2 соответственно величины первой и второй выборки.

Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:

где n величина выборки.

Подсчет числа степеней свободы осуществля­ется по формуле:

При численном равенстве выборок k = 2 n - 2.

Далее необходимо срав­нить полученное значение t эмп с теоретическим значением t—рас­пределения Стьюдента (см. приложение к учеб­никам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок.

Пример 1 . В двух группах учащихся — экспериментальной и контрольной — получены следующие результаты по учеб­ному предмету (тестовые баллы; см. табл. 1). [1]

Таблица 1. Результаты эксперимента

Первая группа (экспериментальная) N 1=11 человек

Вторая группа (контрольная)

12 14 13 16 11 9 13 15 15 18 14

13 9 11 10 7 6 8 10 11

Общее количество членов выборки: n 1=11, n 2=9.

Расчет средних арифметических: Хср=13,636; Y ср=9,444

Стандартное отклонение: s x=2,460; s y =2,186

По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:

Считаем статистику критерия:

Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).

Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное сужде­ние в пяти случаях из ста (уровень значимости=5 % или 0,05).

Если полученное в эксперименте эмпирическое значение t превы­шает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе эксперимен­тального обучения.

Здесь могут возникнуть такие вопросы:

1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.

2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.

3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической эксперимен­тальной группы, a — контрольной:

Отсюда следует вывод, что новый метод пока не про­явил себя с хорошей стороны по разным, возможно, при­чинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о пре­имуществе традиционного метода.

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения t осуществляется по формуле:

где — разности между соответствующими значениями переменной X и переменной У, а d - среднее этих разностей;

Sd вычисляется по следующей формуле:

Число степеней свободы k определяется по формуле k= n -1. Рассмотрим пример использования t -критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 2. Изучался уровень ориентации учащихся на художественно-эстети­ческие ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились бе­седы, выставки детских рисунков, были организованы по­сещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических со­ображений в таблице 2 приводятся результаты небольшо­го числа испытуемых. [2]

Таблица 2. Результаты эксперимента

Вспомогательные расчеты

до начала экспери­мента (Х)

экспери­мента (У)

Вначале произведем расчет по формуле:

Затем применим формулу (6), получим:

И, наконец, следует применить формулу (5). Получим:

Число степеней свободы: k =10-1=9 и по таблице При­ложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтерна­тивной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.

В терминах статистических гипотез полученный результат будет звучать так: на 5% уров­не гипотеза Н0 отклоняется и принимается гипотеза Н1 .

Критерий Фишера позволяет сравнивать величины выбороч­ных дисперсий двух независимых выборок. Для вычисления Fэмп нуж­но найти отношение дисперсий двух выборок, причем так, что­бы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фи­шера такова:

где - дисперсии первой и второй выборки соответственно.

Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значе­ние Fэмп всегда будет больше или равно единице.

Чис­ло степеней свободы определяется также просто:

k 1=nl - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k 2= n 2 - 1 для второй выборки.

В Приложе­нии 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).

Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. [3] Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дис­персии тестовых оценок в обоих классах. Резуль­таты тестирования представлены в таблице:

Рассчитав дисперсии для переменных X и Y, получаем:

Тогда по формуле (8) для расчета по F критерию Фишера находим:

По таблице из Приложения 1 для F критерия при степенях свободы в обоих случаях равных k =10 - 1 = 9 находим F крит=3,18 ( c следователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.

Критерий предназначен для срав­нения состояния некоторого свойства у членов двух зави­симых выборок на основе измерений, сделанных по шка­ле не ниже ранговой.

Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (х i , у i ), где х i , у i — результаты двукратного измерения одного и того же свойства у одного и того же объекта.

В педагогических исследованиях объектами изуче­ния могут служить учащиеся, учителя, администрация школ. При этом х i , у i могут быть, например, балловы­ми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства.

Нулевая гипотеза формулируются следующим обра­зом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно раз­личны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.

Ста­тистика критерия (Т) определяется следую­щим образом:

Нулевая гипотеза принимается на уровне значимости 0,05, если наблю­даемое значение T n - ta , где значение n - ta определя­ется из статистических таблиц для критерия знаков Приложения 2.

Пример 4. Учащиеся выполняли контрольную ра­боту, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью фор­мирования данного понятия у учащихся с низким уров­нем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.

Результаты двукратного выполнения ра­боты представляют измерения по шкале по­рядка (пятибалльная шкала). В этих условиях возмож­но применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допуще­ния этого критерия.

Результаты двукратного выполнения работы (в бал­лах) 15 учащимися запишем в форме таблицы (см. табл. 1). [4]


Конечно, многие ответили бы что-то вроде этого после прочтения названия. Собственно, вы правы, но кто был этот Стьюдент? В действительности Стьюдент — это не имя и не фамилия человека, изучавшего распределение вероятностей, это псевдоним. Настоящее имя создателя критерия Стьюдента Уильям Сили Госсет, и все, связанное с возникновением и использованием этого псевдонима, является довольно любопытной историей.

-распределение — это распределение вероятностей, связанное с нормальным распределением. Возникает оно, когда требуется оценить среднее статистической выборки, когда размер выборки, используемой для оценки, мал и дисперсии неизвестны. Определяется это распределение случайной величины следующим образом:

где , то есть нормальное распределение с математическим ожиданием и стандартным отклонением , — распределение хи-квадрат (еще одно распределение вероятностей, связанное с нормальным), — число степеней свободы распределения хи-квадрат.

История развития этого распределения вероятностей, как мы уже говорили в начале, весьма любопытна. Уильям Сили Госсет — английский математик и химик, который после окончания университета начал работать на заводе Guinness (да-да, знаменитого пива “Гиннесс’’), занимаясь контролем качества в процессе создания пива. Малый размер выборки, с которой обычно приходилось иметь дело, был виновником его занятий, которые в конечном счете привели к разработке -распределения. В 1908 году, когда ему было 32 года, Госсет опубликовал статью The probable error of a mean (“Вероятная ошибка среднего’’) в журнале Biometrika, но не под своим именем, а под псевдонимом Стьюдент.

Почему был избран псевдоним? Как это часто бывает в таких случаях, существует несколько теорий, пытающихся объяснить это. Первая и, видимо, наиболее распространенная, говорит, что основная причина в том, что Guinness ранее нес ущерб от утечки информации из-за публикаций сотрудников, что компания запретила своим сотрудникам публиковать статьи, независимо от их темы. Эта история имеет не одно продолжение, которое отличается в различных источниках. Некоторые говорят, что публикация Госсета под псевдонимом Стьюдент позволила скрыть от компании Guinness, что ее сотрудник опубликовал статью. Другие говорят, что Госсет договорился с пивоварней о ее публикации (однако содержание статьи не было бы полезно для конкуренции), но компания попросила использовать псевдоним, чтобы другие сотрудники не были осведомлены об этой публикации.

Вторая теория гласит, что псевдоним Стьюдент был использован для Гиннесса, потому что сама компания хотела сохранить в тайне статистика, работающего на нее. Это было сделано, чтобы не было никаких доказательств промышленного преимущества, достигнутого благодаря ему.

В любом случае, история использования псевдонима Стьюдент Уильямом Сили Госсетом, по меньшей мере, необычная, и в этом нет никаких сомнений.

 t-тест простыми словами

Наступила осень, а значит, настало время для запуска нового тематического проекта "Статистический анализ с R". В нем мы рассмотрим статистические методы с точки зрения их применения на практике: узнаем какие методы существуют, в каких случаях и каким образом их проводить в среде R. На мой взгляд, Критерий Стьюдента или t-тест (от англ. t-test) идеально подходит в качестве введения в мир статистического анализа. Тест Стьюдента достаточно прост и показателен, а также требует минимум базовых знаний в статистике, с которыми читатель может ознакомиться в ходе прочтения этой статьи.

Примечание_1: здесь и в других статьях Вы не увидите формул и математических объяснений, т.к. информация рассчитана на студентов естественных и гуманитарных специальностей, которые делают лишь первые шаги в стат. анализе.

Примечание_2: перед прочтением, я рекомендую ознакомиться с этой статьей, чтобы вспомнить базовые понятия описательной статистики, такие как медиана, стандартное отклонение, квантили и прочее.

Что такое t-тест и в каких случаях его стоит применять

В начале следует сказать, что в статистике зачастую действует принцип бритвы Оккамы, который гласит, что нет смысла проводить сложный статистический анализ, если можно применить более простой (не стоит резать хлеб бензопилой, если есть нож). Именно поэтому, несмотря на свою простоту, t-тест является серьезным инструментом, если знать что он из себя представляет и в каких случаях его стоит применять.

автор Стьюдент

Любопытно, что создал этот метод Уильямом Госсет - химик, приглашенный работать на фабрику Guinness. Разработанный им тест служил изначально для оценки качества пива. Однако, химикам фабрики запрещалось независимо публиковать научные работы под своим именем. Поэтому в 1908 году Уильям опубликовал свою статью в журнале "Biometrika" под псевдонимом "Стьюдент". Позже, выдающийся математик и статистик Рональд Фишер доработал метод, который затем получил массовое распространение под названием Student's t-test.

Критерий Стьюдента (t-тест) - это статистический метод, который позволяет сравнивать средние значения двух выборок и на основе результатов теста делать заключение о том, различаются ли они друг от друга статистически или нет. Если Вы хотите узнать, отличается ли средний уровень продолжительности жизни в Вашем регионе от среднего уровня по стране; сравнить урожайность картофеля в разных районах; или изменяется ли кровяное давление до и после употребления нового лекарства, то t-тест может быть Вам полезен. Почему может быть? Потому что для его проведения, необходимо, чтобы данные выборок имели распределение близкое к нормальному. Для этого существуют методы оценки, которые позволяют сказать, допустимо ли в данном случае полагать, что данные распределены нормально или нет. Поговорим об этом подробнее.

Нормальное распределение данных и методы его оценки qqplot и shapiro.test

Нормальное распределение данных характерно для количественных данных, на распределение которых влияет множество факторов, либо оно случайно. Нормальное распределение характеризуется несколькими особенностями:

  • Оно всегда симметрично и имеет форму колокола.
  • Значения среднего и медианы совпадают.
  • В пределах одного стандартного отклонения в обе стороны лежат 68.2% всех данных, в пределах двух - 95,5%, в пределах трех - 99,7%

 rnorm нормальное распределение

Давайте создадим случайную выборку с нормальным распределением на языке программирования R, где общее количество измерений = 100, среднее арифметическое = 5, а стандартное отклонение = 1. Затем отобразим его на графике в виде гистограммы:

Ваш график может слегка отличаться от моего, так как числа сгенерированы случайным образом. Как Вы видите, данные не идеально симметричны, но кажется сохраняют форму нормального распределения. Однако, мы воспользуемся более объективными методами определения нормальности данных.

график qqplot

Одним из наиболее простых тестов нормальности является график квантилей (qqplot). Суть теста проста: если данные имеют нормальное распределение, то они не должны сильно отклоняться от линии теоретических квантилей и выходить за пределы доверительных интервалов. Давайте проделаем этот тест в R.

Тест Шапиро shapiro-test

Как видно из графика, наши данные не имеют серьезных отклонений от теоретического нормального распределения. Но порой при помощи qqplot невозможно дать однозначный ответ. В этом случае следует использовать тест Шапиро-Уилка, который основан на нулевой гипотезе, что наши данные распределены нормально. Если же P-значение менее 0.05 (p-value

Провести тест Шапиро-Уилка в R не составит труда. Для этого нужно всего лишь вызвать функцию shapiro.test, и в скобках вставить имя ваших данных. В нашем случае p-value должен быть значительно больше 0.05, что не позволяет отвергнуть нулевую гипотезу о том, что наши данные распределены нормально.

Запускаем t-тест Стьюдента в среде R

Итак, если данные из выборок имеют нормальное распределение, можно смело приступать к сравнению средних этих выборок. Существует три основных типа t-теста, которые применяются в различных ситуациях. Рассмотрим каждый из них с использованием наглядных примеров.

Одновыборочный критерий Стьюдента (one-sample t-test)

Одновыборочный t-тест следует выбирать, если Вы сравниваете выборку с общеизвестным средним. Например, отличается ли средний возраст жителей Северо-Кавказского Федерального округа от общего по России. Существует мнение, что климат Кавказа и культурные особенности населяющих его народов способствуют продлению жизни. Для того, чтобы проверить эту гипотезу, мы возьмем данные РосСтата (таблицы среднего ожидаемого продолжительности жизни по регионам России) и применим одновыборочный критерий Стьюдента. Так как критерий Стьюдента основан на проверке статистических гипотез, то за нулевую гипотезу будем принимать то, что различий между средним ожидаемым уровнем продолжительности по России и республикам Северного Кавказа нет. Если различия существуют, то для того, чтобы считать их статистически значимыми p-value должно быть менее 0.05 (логика та же, что и в вышеописанном тесте Шапиро-Уилка).

Загрузим данные в R. Для этого, создадим вектор со средними значениями по республикам Кавказа (включая Адыгею). Затем, запустим одновыборочный t-тест, указав в параметре mu среднее значение ожидаемого возраста жизни по России равное 70.93.

Несмотря на то, что у нас всего 7 точек в выборке, в целом они проходят тесты нормальности и мы можем на них полагаться, так как эти данные уже были усреднены по региону.

Результаты t-тест

Результаты t-теста говорят о том, что средняя ожидаемая продолжительность жизни у жителей Северного Кавказа (74.6 лет) действительно выше, чем в среднем по России (70.93 лет), а результаты теста являются статистически значимыми (p когда Вы сравниваете две независимые выборки . Допустим, мы хотим узнать, отличается ли урожайность картофеля на севере и на юге какого-либо региона. Для этого, мы собрали данные с 40 фермерских хозяйств: 20 из которых располагались на севере и сформировали выборку "North", а остальные 20 - на юге, сформировав выборку "South".

Загрузим данные в среду R. Кроме проверки нормальности данных, будет полезно построить "график с усами", на котором можно видеть медианы и разброс данных для обеих выборок.

Как видно из графика, медианы выборок не сильно отличаются друг от друга, однако разброс данных гораздо сильнее на севере. Проверим отличаются ли статистически средние значения при помощи функции t.test. Однако в этот раз на место параметра mu мы ставим имя второй выборки. Результаты теста, которые Вы видите на рисунке снизу, говорят о том, что средняя урожайность картофеля на севере статистически не отличается от урожайности на юге (p = 0.6339).

Критерий Стьюдента в R

Двувыборочный для зависимых выборок ( dependent two-sample t-test )

Третий вид t-теста используется в том случае, если элементы выборок зависят друг от друга . Он идеально подходит для проверки повторяемости результатов эксперимента: если данные повтора статистически не отличаются от оригинала, то повторяемость данных высокая. Также двувыборочный критерий Стьюдента для зависимых выборок широко применяется в медицинских исследованиях при изучении эффекта лекарства на организм до и после приема.

Для того, чтобы запустить его в R, следует ввести все ту же функцию t.test . Однако, в скобках, после таблиц данных, следует ввести дополнительный аргумент paired = TRUE . Этот аргумент говорит о том, что Ваши данные зависят друг от друга. Например:

Также в функции t.test существует два дополнительных аргумента, которые могут улучшить качество результатов теста: var.equal и alternative . Если вы знаете, что вариация между выборками равна, вставьте аргумент var.equal = TRUE . Если же вы хотите проверить гипотезу о том, что разница между средними в выборках значительно меньше или больше 0, то введите аргумент alternative="less" или alternative="greater" (по умолчанию альтернативная гипотеза говорит о том, что выборки просто отличаются друг от друга: alternative="two.sided" ).

Заключение

Статья получилась довольно длинной, зато теперь Вы знаете: что такое критерий Стьюдента и нормальное распределение; как при помощи функций qqplot и shapiro.test проверять нормальность данных в R; а также разобрали три типа t-тестов и провели их в среде R.

Тема для тех, кто только начинает знакомиться со статистическим анализом - непростая. Поэтому не стесняйтесь, задавайте вопросы, я с удовольствием на них отвечу. Гуру статистики, пожалуйста поправьте меня, если где-нибудь допустил ошибку. В общем, пишите Ваши комментарии, друзья!

t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез ( статистических критериев ), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках .

Здравствуйте! Благодарю за подробное пояснение по теме t-критерия. Пытаюсь провести сравнительный анализ в своей магистерской диссертации по двум независимым выборкам. Шкал у меня несколько. В результате анализа с помощью программы SPSS какие-то значения по критерию равенства дисперсий Ливиня оказались меньше 0,05. Насколько я понимаю, использование t-критерия в этом случае будет неправомерным. Что посоветуете в этом случае?

Здравствуйте! Спасибо за Ваш комментарий. К сожалению, ни с SPSS, ни с критерием Ливиня мне не доводилось работать, поэтому помочь не в силах.

Добрый день, извините, что не по теме. Пишу дипломную работу и мне нужно оценить 2 уравнения методом максимального правдоподобия в R. Нигде не могу найти про это в интернете.Вы не знаете как это можно сделать?

Читайте также: