Критерии в статистике кратко

Обновлено: 03.07.2024

Определение задачи, которая будет решаться с использованием статистических методов.

До того, как выбирать тот или иной статистический критерий исследователь прежде всего должен определиться, какие именно задачи будут решаться, и какие методы (статистические тесты) для этого будут подбираться.

Как таковые задачи можно разделить на несколько групп:

Предварительные задачи: Описание данных

  1. Оценка динамики явления — решается прежде всего через инструменты оценки динамических рядов
  2. Анализ различий между группами (статистическими совокупностями) в зависимости от типа данных и распределения количественных данных, количества и связанности групп может применяться большое количество инструментов. Этот пункт будет изложен в этой статье подробным образом
  3. Выявление и оценка взаимовлияний в динамике — в зависимости от типа данных и их распределения используются различные методы корелляционного анализа.
  4. Прогноя явлений — используются линейные и логистические регрессии (возможно, в связке с ROC-analysis), деревья решений, нейронные сети, различные вариантры дискриминативного анализа
  5. Группировка явлений и выявление общих свойств группы — варианты кластерного анализа.

Выбор статистического критерия для тестирования гипотез о различии групп

Алгоритм выбора (Рисунок 1).

В случае выбора статистического критерия для сравнения количественных данных нужно учитывать распределение признака: является ли оно нормальным или отличным от нормального. В первом случае, как и при описании вариационного ряда, мы будет использовать параметры распределения, отсюда и название этой группы методов: параметрические методы, в случае отличного от нормального распределения следует использовать непараметрические методы.


Рисунок 1. Выбор статистического критерия для сравнения статистических совокупностей (По Мильчаков К.С.)

Пример выбора статистического критерия для сравнения статистических совокупностей

Пример 1: Для оценки успешности реабилитации после эндопротезирования коленного сустава было проведено исследование у двух выборок (n1=10; n2=10) на предмет скорости восстановления к сгибанию в колене. В первой выборке оказались люди прошедшие полный курс реабилитации, во второй пациенты, отказавшиеся от услуг реабилитолога. Сделайте статистический вывод о пользе реабилитологического сопровождения на основании представленных данных, прдположим, что данные распределены отличным от нормального образом.

Ответ: Тип данных: количественный, непрерывный, распределение: отличное от нормального, количество групп: 2, связанность групп: не связаны. необходимо использовать критерий Манна-Уитни

При заболеваниях сетчатки повышается проницаемость ее сосудов. Дж. Фишмен и соавт. (G. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch. Ophthalmol., 104:545—548, 1986) измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением. Полученные результаты приведены в таблице. Сделайте вывод о проницаемости сетчатки у больных с дистрофией и относительно здорового контроля.

Проницаемость сосудов сетчатки, мм:

Здоровые Больные
0,5 1,2
0,7 1,4
0,7 1,6
1 1,7
1 1,7
1,2 1,8
1,4 2,2
1,4 2,3
1,6 2,4
1,6 6,4
1,7 19
2,2 23,6

Ответ: Тип данных: количественный, непрерывный, распределение: неизвестно. Количество групп: 2, связанность групп: не связаны.

Необходимо использовать критерий Манна-Уитни или после проверки распределения (в случае нормального распределения величины) использовать т-критерий Стьюдента для несвяазанных совокупностей.

Бишоп (Т. Bishop. High frequency neural modulation in dentistry. J. Am. Dent. Assoc., 112:176—177, 1986) изучил эффективность высокочастотной стимуляции нерва в качестве обезболивающего средства при удалении зуба. Все больные подключались к прибору, но в одних случаях он работал, в других был выключен. Ни стоматолог, ни больной не знали, включен ли прибор. Позволяют ли следующие данные считать высокочастотную стимуляцию нерва действенным анальгезируюшим средством?

Прибор включен Прибор выключен
Боли нет 24 3
Боли есть 6 17

Ответ: Тип данных: качественный, абсолютные частоты, количество групп: 2, связанность групп: не связаны.

Необходимо использовать хи-квадрат Пирсона (или точный критерий Фишера).

NB! о выборе статистического критерия

Каждый статистический критерий работает с определенным набором данных и в условиях определенный групп. Аккуратно выбирайте статистические критерии, не упускайте логику выбора и результат Ваших расчетов будет корректным и не вызывающим сомнения о профессиональных статистических рецензентов, как при презентации материала на конференции, сдаче отчета о клиническом исследовании или публикации статьи. Удачи на научном поприще!

Если Вам понравилась статья и оказалась полезной, Вы можете поделиться ею с коллегами и друзьями в социальных сетях:

Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.

Содержание

Определение

Пусть даны выборка = (X_1,\ldots,X_n)" width="" height="" />
из неизвестного совместного распределения ^<\mathbf>" width="" height="" />
, и семейство статистических гипотез . Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:

f: \mathbb<R></p>
<p>^n \to \<H_0,H_1,\ldots\>
.

\mathbf<x></p>
<p>Таким образом каждой реализации выборки = (x_1,\ldots,x_n)
статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.

Виды критериев

Статистические критерии подразделяются на следующие категории:

  • Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: — нулевая гипотеза. или — конкурирующая гипотеза.
  • Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:
  • Критерии проверки на однородность. При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (т.е. проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном (дисперсионном) анализе для определения наличия зависимостей.

Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.

Непараметрические критерии

Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.

Параметрические критерии

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

Основные понятия

Простой пример

Пусть дана независимая выборка = (X_1,\ldots,X_n)^" width="" height="" />
, где (\mu,1),\quad i=1,\ldots,n" width="" height="" />
. Пусть есть две простые гипотезы:

\begin</p>
<p> H_0: & \mu = 0, \\ H_1: & \mu = 1. \end

Тогда можно определить следующий статистический критерий:


\bar<x></p>
<p>где = \frac\sum\limits_^n x_i
- выборочное среднее.

См. также

Литература

  1. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. Часть II: Непараметрические критерии. — М.: Госстандарт РФ, 2002. Электронная версия.
  • Математическая статистика
  • Статистические критерии

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Статистический критерий" в других словарях:

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ — определяющие правила, согласно к рымпо результатам наблюдений принимается решение в задаче статистическойпроверки гипотез. С. к. строится следующим образом. Выбирается проверочнаястатистика ф ция данных наблюдений х и проверяемой гипотезы… … Физическая энциклопедия

статистический критерий — состоит из следующих компонент: пара гипотез – нулевая и альтернативная, статистика критерия и уровень значимости; по ним мы находим еще критическую область. Проверка гипотезы начинается с вычисления статистики критерия. Если значение попадает в… … Словарь социологической статистики

статистический критерий — 3.9 статистический критерий (estimator): Статистическая величина, используемая для оценки параметра генеральной совокупности. [ИСО 3534 1, статья 2.50] Источник … Словарь-справочник терминов нормативно-технической документации

(статистический) критерий — 3.29 (статистический) критерий [(statistical) test]: Статистическая процедура, предназначенная для решения о принятии или отклонении гипотезы о распределении одной или нескольких совокупностей. Источник: ГОСТ Р ИСО 12491 2011: Материалы и изделия … Словарь-справочник терминов нормативно-технической документации

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ — решающее правило, по к рому на основе результатов наблюдений принимается решение в задаче статистических гипотез проверки. Пусть по реализации х= (х 1, . . ., х п )случайного вектора Х = (Х 1.. . ., Х n), принимающего значения в выборочном… … Математическая энциклопедия

Последовательный статистический критерий — Последовательный статистический критерий последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе. Пусть наблюдению в статистическом эксперименте доступна случайная величина с… … Википедия

Критерий согласия Колмогорова — или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

Критерий Фишера — (F критерий, φ* критерий, критерий наименьшей значимой разности) апостериорный статистический критерий, используемый для сравнения дисперсий двух вариационных рядов, то есть для определения значимых различий между групповыми средними в… … Википедия

Критерий согласия Пирсона — Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия

Критерий Лиллиефорса — статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия

Очень часто перед исследователем в психологии стоит задача выявления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических особенностей хронически больных детей по сравнению со здоровыми, между работниками государственных предприятий и частных организаций, между людьми разного возраста и пола. Кроме того, одной из наиболее часто встречающихся статистических задач, с которыми сталкивается психолог, является задача сравнения результатов обследования какого-либо психологического признака в разных условиях измерения (например, до и после тренинга). Помимо этого нередко возникает необходимость оценить характер изменения того или иного психологического показателя в одной или нескольких группах в разные периоды времени или выявить динамику изменения этого показателя под влиянием экспериментальных воздействий. Для решения подобных задач используется достаточно большой набор статистических способов, называемых в наиболее общем виде критериями различий. Эти критерии позволяют оценить степень статистической достоверности различий между разнообразными показателями, измеренными согласно плану проведения психологического исследования.

Существует достаточно большое количество критериев различий. Каждый из них имеет свою специфику, различаясь между собой по следующим основаниям:

Первое основание - тип измерительной шкалы, для которой пред­назначен тот или иной критерий. Например, с помощью некоторых критериев можно обрабатывать данные, полученные только в номинальных шкалах. Ряд критериев дает возможность обрабатывать данные, полученные в порядковой, интервальной и шкале равных отношений.

Второе основание - максимальный объем выборки, который они могут охватить, а также количество выборок, которые можно сравнивать между собой с их помощью. Существуют критерии, позволяющие оценить различия сразу в трех и большем числе выборок. Некоторые критерии позволяют сопоставить неравные по численности выборки.

Третье основание - качество выборки: она может быть связной (зависимой) и несвязной (независимой).

Все критерии различий условно подразделены на две группы: параметрические и непараметрические критерии.

Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.). Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности.

При нормальном распределении генеральной совокупности параметрические критерии обладают большей мощностью по сравнению с непараметрическими. Иными словами, они способны с большей достоверностью отвергать нулевую гипотезу, если последняя неверна. Поэтому в тех случаях, когда выборки взяты из нормального распределения генеральных совокупностей, следует отдавать предпочтение параметрическим критериям.

Однако практика показывает, что подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально, поэтому применение параметрических критериев в анализе результатов психологических исследований может привести к ошибкам в статистических выводах. В таких случаях непараметрические критерии оказываются более мощными, то есть способными с большей достоверностью отвергать нулевую гипотезу.

Решение о выборе того или иного критерия принимается на осно­вании того, является ли выборка зависимой или независимой, сколько выборок сопоставляется, каков их объем и является ли распределение нормальным.

Однозначно определенный способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики U(x1, x2, …, xn) – функции от результатов наблюдений x1, x2, …, xn. В пространстве значений статистики U выделяют критическую область Ψ, т.е. область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют (иногда говорят - отвергают) нулевую гипотезу, в противном случае – не отвергают (т.е. принимают).




Статистику U, используемую при построении определенного статистического критерия, называют статистикой этого критерия. Например, в задаче проверки статистической гипотезы, приведенной в примере 14, применяют критерий Колмогорова, основанный на статистике

При этом Dn называют статистикой критерия Колмогорова.

Частным случаем статистики U является векторзначная функция результатов наблюдений U0(x1, x2, …, xn) = (x1, x2, …, xn), значения которой – набор результатов наблюдений. Если xi – числа, то U0 – набор n чисел, т.е. точка n–мерного пространства. Ясно, что статистика критерия U является функцией от U0, т.е. U = f(U0). Поэтому можно считать, что Ψ – область в том же n–мерном пространстве, нулевая гипотеза отвергается, если (x1, x2, …, xn) Ψ, и принимается в противном случае.

В вероятностно-статистических методах обработки данных и принятия решений статистические критерии, как правило, основаны на статистиках U, принимающих числовые значения, и критические области имеют вид

где С – некоторые числа.

Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические – в непараметрических задачах.

Очень часто перед исследователем в психологии стоит задача выявления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических особенностей хронически больных детей по сравнению со здоровыми, между работниками государственных предприятий и частных организаций, между людьми разного возраста и пола. Кроме того, одной из наиболее часто встречающихся статистических задач, с которыми сталкивается психолог, является задача сравнения результатов обследования какого-либо психологического признака в разных условиях измерения (например, до и после тренинга). Помимо этого нередко возникает необходимость оценить характер изменения того или иного психологического показателя в одной или нескольких группах в разные периоды времени или выявить динамику изменения этого показателя под влиянием экспериментальных воздействий. Для решения подобных задач используется достаточно большой набор статистических способов, называемых в наиболее общем виде критериями различий. Эти критерии позволяют оценить степень статистической достоверности различий между разнообразными показателями, измеренными согласно плану проведения психологического исследования.

Существует достаточно большое количество критериев различий. Каждый из них имеет свою специфику, различаясь между собой по следующим основаниям:

Первое основание - тип измерительной шкалы, для которой пред­назначен тот или иной критерий. Например, с помощью некоторых критериев можно обрабатывать данные, полученные только в номинальных шкалах. Ряд критериев дает возможность обрабатывать данные, полученные в порядковой, интервальной и шкале равных отношений.

Второе основание - максимальный объем выборки, который они могут охватить, а также количество выборок, которые можно сравнивать между собой с их помощью. Существуют критерии, позволяющие оценить различия сразу в трех и большем числе выборок. Некоторые критерии позволяют сопоставить неравные по численности выборки.

Третье основание - качество выборки: она может быть связной (зависимой) и несвязной (независимой).

Все критерии различий условно подразделены на две группы: параметрические и непараметрические критерии.

Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.). Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности.

При нормальном распределении генеральной совокупности параметрические критерии обладают большей мощностью по сравнению с непараметрическими. Иными словами, они способны с большей достоверностью отвергать нулевую гипотезу, если последняя неверна. Поэтому в тех случаях, когда выборки взяты из нормального распределения генеральных совокупностей, следует отдавать предпочтение параметрическим критериям.

Однако практика показывает, что подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально, поэтому применение параметрических критериев в анализе результатов психологических исследований может привести к ошибкам в статистических выводах. В таких случаях непараметрические критерии оказываются более мощными, то есть способными с большей достоверностью отвергать нулевую гипотезу.

Решение о выборе того или иного критерия принимается на осно­вании того, является ли выборка зависимой или независимой, сколько выборок сопоставляется, каков их объем и является ли распределение нормальным.

Однозначно определенный способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики U(x1, x2, …, xn) – функции от результатов наблюдений x1, x2, …, xn. В пространстве значений статистики U выделяют критическую область Ψ, т.е. область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют (иногда говорят - отвергают) нулевую гипотезу, в противном случае – не отвергают (т.е. принимают).

Статистику U, используемую при построении определенного статистического критерия, называют статистикой этого критерия. Например, в задаче проверки статистической гипотезы, приведенной в примере 14, применяют критерий Колмогорова, основанный на статистике

При этом Dn называют статистикой критерия Колмогорова.

Частным случаем статистики U является векторзначная функция результатов наблюдений U0(x1, x2, …, xn) = (x1, x2, …, xn), значения которой – набор результатов наблюдений. Если xi – числа, то U0 – набор n чисел, т.е. точка n–мерного пространства. Ясно, что статистика критерия U является функцией от U0, т.е. U = f(U0). Поэтому можно считать, что Ψ – область в том же n–мерном пространстве, нулевая гипотеза отвергается, если (x1, x2, …, xn) Ψ, и принимается в противном случае.

В вероятностно-статистических методах обработки данных и принятия решений статистические критерии, как правило, основаны на статистиках U, принимающих числовые значения, и критические области имеют вид

где С – некоторые числа.

Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические – в непараметрических задачах.

Для того, чтобы выбрать статистический критерий, нужно понимать структуру самого исследования и то, какие параметры анализируются, т.е с какими данными нам предстоит работать.
То, какого типа у нас переменная накладывает существенные ограничения на то, что мы можем с ней делать.

В самом общем виде данные можно разделить на 2 типа: количественные и качественные.

Количественные переменные отображают, как можно догадаться из названия, количество чего-то и, в свою очередь, подразделяются на дискретные и непрерывные.
Качественные переменные — это переменные, которые отражают свойство или качество объектов. Их тоже можно поделить на 2 подтипа: номинальные и порядковые.


Уточнение:
На самом деле, подтип количественной переменной (дискретная она или непрерывная) не имеет значения при выборе статистического критерия.
А имеет значение то, как эта переменная распределена. Принципиально важной характеристикой переменной является нормальность ее распределения (построив гистограмму, можно примерно оценить форму распределения, а применив критерий Шапиро-Уилка — точно удостовериться в том, является ли распределение нормальным).
Например, параметрическая статистика работает только для нормально распределенных величин.
Для исследования количественных переменных с распределением, отличным от нормального, используются непараметрические методы.

С основными типами данных разобрались.
Теперь выделим три принципиально важных группы переменных, которые влияют на выбор статистического критерия:
— количественные переменные с нормальным распределением;
— количественные переменные с другим распределением и порядковые переменные;
— номинальные переменные.

Чтобы перейти, наконец к выбору статистического критерия, нам еще нужно знать, какие у нас условия исследования, т.е с какими выборками мы работаем — независимыми или связанными.
Например, когда мы берем две разные группы данных и сравниваем в них какой-то параметр (например, среднее), то такие выборки — независимые.
Связанные выборки получаются, когда мы наблюдаем за одной группой, но в разных состояниях (например, группа пациентов до и после лечения).

Вид переменной Независимые выборки Зависимые выборки
две группы \ больше групп две группы \ больше групп
Количественный (нормальное распределение) Критерий Стьюдента* \ Дисперсионный анализ* Критерий Стьюдента (для зависимых выборок) * \ Дисперсионный анализ (для повторных измерений) *
Порядковый и количественный (распределение, отличное от нормального) Критерий Манна-Уитни \ Критерий Крускала-Уоллиса Критерий Вилкоксона \ Критерий Фридмана
Качественные, номинальные Критерий Хи-квадрат \ Критерий Хи-квадрат Критерий Мак-Немара \ Критерий Кокрена

Вам также может понравиться

Проверка гипотез, p-value

Проверка гипотез, p-value

В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о при­надлежности двух выборок одной совокупности. Эти методы основыва­ются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.

Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:

1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;

2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.

3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;

4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:

а) — к интервалу должно относиться около 25% частоты совокупности,

б) — к интервалу должно относиться около 50% частоты совокупности,

в) — к интервалу должно относиться около 75% частоты совокупности,

г) — к интервалу должно относиться около 100% частоты совокупности.

При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух неза­висимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой матери­ал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.

Статистика критерия для случая несвязанных, независимых выборок равна:

где , — средние арифметические в эксперименталь­ной и контрольной группах,

- стан­дартная ошибка разности средних арифметических. Находится из формулы:

где n 1 и n 2 соответственно величины первой и второй выборки.

Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:

где n величина выборки.

Подсчет числа степеней свободы осуществля­ется по формуле:

При численном равенстве выборок k = 2 n - 2.

Далее необходимо срав­нить полученное значение t эмп с теоретическим значением t—рас­пределения Стьюдента (см. приложение к учеб­никам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок.

Пример 1 . В двух группах учащихся — экспериментальной и контрольной — получены следующие результаты по учеб­ному предмету (тестовые баллы; см. табл. 1). [1]

Таблица 1. Результаты эксперимента

Первая группа (экспериментальная) N 1=11 человек

Вторая группа (контрольная)

12 14 13 16 11 9 13 15 15 18 14

13 9 11 10 7 6 8 10 11

Общее количество членов выборки: n 1=11, n 2=9.

Расчет средних арифметических: Хср=13,636; Y ср=9,444

Стандартное отклонение: s x=2,460; s y =2,186

По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:

Считаем статистику критерия:

Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).

Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное сужде­ние в пяти случаях из ста (уровень значимости=5 % или 0,05).

Если полученное в эксперименте эмпирическое значение t превы­шает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе эксперимен­тального обучения.

Здесь могут возникнуть такие вопросы:

1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.

2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.

3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической эксперимен­тальной группы, a — контрольной:

Отсюда следует вывод, что новый метод пока не про­явил себя с хорошей стороны по разным, возможно, при­чинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о пре­имуществе традиционного метода.

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения t осуществляется по формуле:

где — разности между соответствующими значениями переменной X и переменной У, а d - среднее этих разностей;

Sd вычисляется по следующей формуле:

Число степеней свободы k определяется по формуле k= n -1. Рассмотрим пример использования t -критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 2. Изучался уровень ориентации учащихся на художественно-эстети­ческие ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились бе­седы, выставки детских рисунков, были организованы по­сещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических со­ображений в таблице 2 приводятся результаты небольшо­го числа испытуемых. [2]

Таблица 2. Результаты эксперимента

Вспомогательные расчеты

до начала экспери­мента (Х)

экспери­мента (У)

Вначале произведем расчет по формуле:

Затем применим формулу (6), получим:

И, наконец, следует применить формулу (5). Получим:

Число степеней свободы: k =10-1=9 и по таблице При­ложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтерна­тивной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.

В терминах статистических гипотез полученный результат будет звучать так: на 5% уров­не гипотеза Н0 отклоняется и принимается гипотеза Н1 .

Критерий Фишера позволяет сравнивать величины выбороч­ных дисперсий двух независимых выборок. Для вычисления Fэмп нуж­но найти отношение дисперсий двух выборок, причем так, что­бы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фи­шера такова:

где - дисперсии первой и второй выборки соответственно.

Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значе­ние Fэмп всегда будет больше или равно единице.

Чис­ло степеней свободы определяется также просто:

k 1=nl - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k 2= n 2 - 1 для второй выборки.

В Приложе­нии 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).

Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. [3] Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дис­персии тестовых оценок в обоих классах. Резуль­таты тестирования представлены в таблице:

Рассчитав дисперсии для переменных X и Y, получаем:

Тогда по формуле (8) для расчета по F критерию Фишера находим:

По таблице из Приложения 1 для F критерия при степенях свободы в обоих случаях равных k =10 - 1 = 9 находим F крит=3,18 ( c следователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.

Критерий предназначен для срав­нения состояния некоторого свойства у членов двух зави­симых выборок на основе измерений, сделанных по шка­ле не ниже ранговой.

Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (х i , у i ), где х i , у i — результаты двукратного измерения одного и того же свойства у одного и того же объекта.

В педагогических исследованиях объектами изуче­ния могут служить учащиеся, учителя, администрация школ. При этом х i , у i могут быть, например, балловы­ми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства.

Нулевая гипотеза формулируются следующим обра­зом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно раз­личны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.

Ста­тистика критерия (Т) определяется следую­щим образом:

Нулевая гипотеза принимается на уровне значимости 0,05, если наблю­даемое значение T n - ta , где значение n - ta определя­ется из статистических таблиц для критерия знаков Приложения 2.

Пример 4. Учащиеся выполняли контрольную ра­боту, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью фор­мирования данного понятия у учащихся с низким уров­нем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.

Результаты двукратного выполнения ра­боты представляют измерения по шкале по­рядка (пятибалльная шкала). В этих условиях возмож­но применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допуще­ния этого критерия.

Результаты двукратного выполнения работы (в бал­лах) 15 учащимися запишем в форме таблицы (см. табл. 1). [4]

Читайте также: