Непараметрические критерии для связных выборок кратко

Обновлено: 05.07.2024

Для решения подобных статистических задач психолог может использовать целый ряд критериев различия. Один из наиболее простых критериев различия — критерий знаков G, Этот крите-

рий относится к непараметрическим и применяется только для связанных (зависимых) выборок. Он дает возможность устано­вить, насколько однонаправленно изменяются значения призна­ка при повторном измерении связанной, однородной выборки. Критерий знаков применяется к данным, полученным в ранго­вой, интервальной и шкале отношений.

Решим с использованием критерия знаков следующую задачу.

Задача 6.1. Психолог проводит групповой тренинг. Его зада­ча -- выяснить будет ли эффективен данный конкретный вариант тренинга для снижения уровня тревожности участников?

Решение. Для решения этой задачи психолог с помощью теста Тейлора дважды выявляет уровень тревож­ности у 14 участников до и после проведения тренинга. Результаты измерения приведем в таб­лице 6.1, включив в нее столбец, необходимый для расчета по критерию знаков G.

Проведем необходимый подсчет для нашей задачи:

общее число (сумма) нулевых сдвигов = 1; общее число (сумма) положительных сдвигов = 8; общее число (сумма) отрицательных сдвигов = 5.

Таким образом, отбросив нулевые сдвиги, получаем 13 нену­левых сдвигов. При этом подсчет показал, что сдвиги имели мес­то и что большая часть из них положительна.

Напомним, что критерий знаков G предназначен для уста­новления того, как изменяются значения признака при повтор­ном измерении связной выборки: в сторону увеличения или уменьшения. Поэтому, анализируя соотношение положительных и отрицательных сдвигов в нашей задаче, решаем вопрос: мож­но ли утверждать, что после проведения тренинга наблюдается достоверный сдвиг в сторону уменьшения уровня тревожности участников?

нетипичный сдвиги рассматриваются как дополнительные друг

Подчеркнем, что в том случае, когда величины типичного и нетипичного сдвигов оказываются равными, критерий знаков

Оценка статистической достоверности различий по критерию знаков производится по таблице 1 Приложения. В ней в столбце, обозначенным буквой п приведены величины типичных сдвигов, а в столбцах, имеющих обозначение, соответствующее уровнями значимости Р = 0,05 и Р = 0,01, — так называемые критические величины. Условно их также можно считать нетипичными сдви­гами. Они обозначаются как G и с ними сравнивается получен­ное значение нетипичного сдвига Gэмп.

Итак, оцениваем уровень достоверности различий нашей за­дачи. Для этого необходимо воспользоваться таблицей 1 Прило­жения. Поскольку в нашем примере п — 8, (это число типичных сдвигов), поэтому нужный нам участок таблицы 1 Приложения выглядит так:

1. Критерий знаков G. Предназначен для установления того, как изменяются значения признака при повторном измерении связной выборки: в сторону увеличения или уменьшения.

2. Парный критерий Т – Вилкоксона. Этот критерий является более мощным, чем критерий знаков G. Применяется для оценки различий экспериментальных данных, полученных в двух разных условиях на одной и той же выборке испытуемых. Позволяет выявить не только направленность изменений, но и их выраженность (насколько сдвиг показателей в каком-то одном направлении является более интенсивным, чем в другом).

3. Критерий Фридмана. Этот критерий можно рассматривать как распространение критерия на три и большее количество измерений связной выборки испытуемых. Позволяет установить уровень статистической достоверности различий сразу в нескольких измерениях (от 3 до 100), но не даёт возможности выявить направление изменений.

4. Критерий Пейджа (L критерий тенденций Пейджа). Можно рассматривать как эквивалент критерия Фридмана для сопоставления показателей, измеренных в 3 и более условиях на одной и той же выборке испытуемых. Однако этот критерий не только позволяет выявить различия, но и указывает на направление в изменении величин признака. Применение этого достаточно мощного критерия ограничено объёмом выборки – число испытуемых не может быть больше 12 и числом измерений признака – оно не может быть больше 6.

5. Критерий Макнамары. Предназначен для работы с данными, полученными в самой простой из номинальных – дихотомической шкале.

Критерий знаков G.

Назначение и описание критерия

Критерий знаков G предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ослабления.

Смысл критерия состоит в анализе соотношения положительных и отрицательных сдвигов. При этом вводятся два обозначения:

- сумма сдвигов, получившаяся наибольшей (типичный сдвиг) - n, Gкр. Находится по Таблице 1;

- сумма сдвигов, получившаяся наименьшей (нетипичный сдвиг) - Gэмп.

Гипотезы при использовании критерия знаков G формулируются следующим образом:

H0: Преобладание типичного направления сдвига является случайным.

H1: Преобладание типичного направления сдвига не является случайным.

Условия применения критерия знаков G

1) Измерение может быть проведено в шкале порядка, интервалов и отношений.

2) Выборка должна быть однородной и связной.

3) Число элементов в сравниваемых выборках должно быть равным.

4) G критерий знаков может применяться при величине типичного сдвига от 5 до 300.

5) При равенстве типичных и нетипичных сдвигов критерий знаков неприменим, следует использовать другие критерии.

1. Критерий знаков G. Предназначен для установления того, как изменяются значения признака при повторном измерении связной выборки: в сторону увеличения или уменьшения.

2. Парный критерий Т – Вилкоксона. Этот критерий является более мощным, чем критерий знаков G. Применяется для оценки различий экспериментальных данных, полученных в двух разных условиях на одной и той же выборке испытуемых. Позволяет выявить не только направленность изменений, но и их выраженность (насколько сдвиг показателей в каком-то одном направлении является более интенсивным, чем в другом).

3. Критерий Фридмана. Этот критерий можно рассматривать как распространение критерия на три и большее количество измерений связной выборки испытуемых. Позволяет установить уровень статистической достоверности различий сразу в нескольких измерениях (от 3 до 100), но не даёт возможности выявить направление изменений.




4. Критерий Пейджа (L критерий тенденций Пейджа). Можно рассматривать как эквивалент критерия Фридмана для сопоставления показателей, измеренных в 3 и более условиях на одной и той же выборке испытуемых. Однако этот критерий не только позволяет выявить различия, но и указывает на направление в изменении величин признака. Применение этого достаточно мощного критерия ограничено объёмом выборки – число испытуемых не может быть больше 12 и числом измерений признака – оно не может быть больше 6.

5. Критерий Макнамары. Предназначен для работы с данными, полученными в самой простой из номинальных – дихотомической шкале.

Критерий знаков G.

Назначение и описание критерия

Критерий знаков G предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ослабления.

Смысл критерия состоит в анализе соотношения положительных и отрицательных сдвигов. При этом вводятся два обозначения:

- сумма сдвигов, получившаяся наибольшей (типичный сдвиг) - n, Gкр. Находится по Таблице 1;

- сумма сдвигов, получившаяся наименьшей (нетипичный сдвиг) - Gэмп.

Гипотезы при использовании критерия знаков G формулируются следующим образом:

H0: Преобладание типичного направления сдвига является случайным.

H1: Преобладание типичного направления сдвига не является случайным.

Условия применения критерия знаков G

1) Измерение может быть проведено в шкале порядка, интервалов и отношений.

2) Выборка должна быть однородной и связной.

3) Число элементов в сравниваемых выборках должно быть равным.

4) G критерий знаков может применяться при величине типичного сдвига от 5 до 300.

5) При равенстве типичных и нетипичных сдвигов критерий знаков неприменим, следует использовать другие критерии.

Непараметрические методы разработаны для тех ситуаций, когда исследователь ничего не знает о параметрах исследуемой популяции (отсюда и название методов - непараметрические). Говоря более специальным языком, непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения интересующей величины.

Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными.

Непараметрические методы позволяют обрабатывать данные "низкого качества" из выборок малого объема с переменными, про распределение которых мало что или вообще ничего не известно.

критерии различия между независимыми выборками

критерии различия между зависимыми выборками

критерии зависимости между переменными

Различия между независимыми выборками

Две независимые выборки: U-критерий Манна-Уитни и др.

Обычно, когда имеются две выборки (например, мужчины и женщины), которые вы хотите сравнить относительно среднего значения некоторой изучаемой переменной, вы используете t-критерий для независимых выборок.

Непараметрическими альтернативами параметрического критерия для двух независимых групп являются:

  • U критерий Манна-Уитни
  • Критерий серий Вальда-Вольфовица
  • Двухвыборочный критерий Колмогорова-Смирнова

Рассмотрим U критерий Манна-Уитни подробнее:

Критерий Манна-Уитни проверяет гипотезу о статистической однородности двух выборок.

Обозначим закон распределения первой выборки X через F:

а второй выборки Y через G:

Законы F и G должны быть непрерывны.

Таким образом нулевая гипотеза записывается в виде


Действуя по стандартному алгоритму проверки гипотез , отклоняется на уровне значимости α, если |U| > Uкр

Если по крайней мере одна из групп имеет размер выборки более 15, то можно показать, что:


,

где ,

Несколько независимых групп: критерий Краскела-Уоллиса и др.

Если вы имеете несколько групп, то можете использовать Дисперсионный анализ (ANOVA).

Его непараметрическими аналогами являются:

  • Ранговый дисперсионный анализ Краскела-Уоллиса
  • Медианный тест

Рассмотрим критерий Краскела-Уоллиса подробнее:

Критерий Краскела-Уоллиса является расширением критерия Манна-Уитни и предназначен для сравнения распределений в k выборках.

H1: Распределения каждой из k выборок различны


Критерий Краскела-Уоллиса используется, когда невозможно сказать что-либо определенное об альтернативах , т.к. он свободен от распределения.

Число элементов в каждой i-й выборке ( i=1. k ) равно ni

Как было показано выше, Заменим наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания.

Затем для каждой выборки необходимо вычислить суммарный и средний ранги:


Если между выборками нет систематических различий, то средние ранги не должны значительно отличаться от среднего, рассчитанного по всей совокупности


Значение последнего .


Здесь - общее число наблюдений.

Вычислим величины дисперсий для каждой выборки


Эти значения при в совокупности должны быть небольшими. Составляя общую характеристику, разумно учесть различия в числе наблюдений для разных выборок и взять в качестве меры отступления от чистой случайности величину


Эта величина называется статистикой Краскела-Уоллеса.

Множитель присутствует в качестве нормировочного для обеспечения сходимости распределения H и с числом степеней свободы .

Согласно стандартному алгоритму проверки гипотез, отвергается на уровне значимости α, если |H| > кр

Различия между зависимыми выборками

Две зависимые выборки: критерий Вилкоксона и др.

Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке (например, математические успехи студентов в начале и в конце семестра), то обычно используется t-критерий для зависимых выборок.

Альтернативными непараметрическими тестами являются:

  • Критерий Вилкоксона парных сравнений
  • Критерий знаков

Рассмотрим подробнее Критерий Вилкоксона.

Итак, мы располагаем двумя зависимыми выборками. Сформулируем гипотезы:

H0: медиана разницы в популяции равна нулю

H1: медиана разницы в популяции не равна нулю.

Вычислим разности для каждой пары результатов.

Обозначим за n' число ненулевых разностей.

Проранжируем положительные и отрицательные разности (кроме нулевых), чтобы наименьшая абсолютная величина (без учета знака) получила первый ранг.

Отдельно вычислим сумму рангов положительных и отрицательных разностей, меньшую из двух сумм без учета знака считают тестовой статистикой W данного критерия.


Согласно стандартному алгоритму проверки гипотез, отвергается на уровне значимости α, если |W|>Wкр

Если число ненулевых разностей n'>20, статистика W приближается к стандартному нормальному распределению z:


,



Несколько зависимых выборок

Если рассматривается более двух переменных, относящихся к одной и той же выборке, то обычно используется Дисперсионный анализ (ANOVA) с повторными измерениями.

Альтернативным непараметрическим методом является

  • ранговый дисперсионный анализ Фридмана
  • Q критерий Кохрена (последний применяется, например, если переменная измерена в номинальной шкале). Q критерий Кохрена используется также для оценки изменений частот (долей).

В каком случае использовать параметрический, а в каком - непараметрический метод?

Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики.

Дело в том, что когда выборки становятся очень большими, то выборочные средние подчиняются нормальному закону, даже если исходная переменная не является нормальной или измерена с погрешностью.

Непараметрические тесты имеют меньшую статистическую мощность (менее чувствительны), чем их параметрические конкуренты, и если важно обнаружить даже слабые отклонения, следует особенно внимательно выбирать статистику критерия.

В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о при­надлежности двух выборок одной совокупности. Эти методы основыва­ются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.

Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:

1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;

2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.

3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;

4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:

а) — к интервалу должно относиться около 25% частоты совокупности,

б) — к интервалу должно относиться около 50% частоты совокупности,

в) — к интервалу должно относиться около 75% частоты совокупности,

г) — к интервалу должно относиться около 100% частоты совокупности.

При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух неза­висимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой матери­ал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.

Статистика критерия для случая несвязанных, независимых выборок равна:

где , — средние арифметические в эксперименталь­ной и контрольной группах,

- стан­дартная ошибка разности средних арифметических. Находится из формулы:

где n 1 и n 2 соответственно величины первой и второй выборки.

Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:

где n величина выборки.

Подсчет числа степеней свободы осуществля­ется по формуле:

При численном равенстве выборок k = 2 n - 2.

Далее необходимо срав­нить полученное значение t эмп с теоретическим значением t—рас­пределения Стьюдента (см. приложение к учеб­никам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок.

Пример 1 . В двух группах учащихся — экспериментальной и контрольной — получены следующие результаты по учеб­ному предмету (тестовые баллы; см. табл. 1). [1]

Таблица 1. Результаты эксперимента

Первая группа (экспериментальная) N 1=11 человек

Вторая группа (контрольная)

12 14 13 16 11 9 13 15 15 18 14

13 9 11 10 7 6 8 10 11

Общее количество членов выборки: n 1=11, n 2=9.

Расчет средних арифметических: Хср=13,636; Y ср=9,444

Стандартное отклонение: s x=2,460; s y =2,186

По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:

Считаем статистику критерия:

Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).

Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное сужде­ние в пяти случаях из ста (уровень значимости=5 % или 0,05).

Если полученное в эксперименте эмпирическое значение t превы­шает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе эксперимен­тального обучения.

Здесь могут возникнуть такие вопросы:

1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.

2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.

3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической эксперимен­тальной группы, a — контрольной:

Отсюда следует вывод, что новый метод пока не про­явил себя с хорошей стороны по разным, возможно, при­чинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о пре­имуществе традиционного метода.

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения t осуществляется по формуле:

где — разности между соответствующими значениями переменной X и переменной У, а d - среднее этих разностей;

Sd вычисляется по следующей формуле:

Число степеней свободы k определяется по формуле k= n -1. Рассмотрим пример использования t -критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 2. Изучался уровень ориентации учащихся на художественно-эстети­ческие ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились бе­седы, выставки детских рисунков, были организованы по­сещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических со­ображений в таблице 2 приводятся результаты небольшо­го числа испытуемых. [2]

Таблица 2. Результаты эксперимента

Вспомогательные расчеты

до начала экспери­мента (Х)

экспери­мента (У)

Вначале произведем расчет по формуле:

Затем применим формулу (6), получим:

И, наконец, следует применить формулу (5). Получим:

Число степеней свободы: k =10-1=9 и по таблице При­ложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтерна­тивной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.

В терминах статистических гипотез полученный результат будет звучать так: на 5% уров­не гипотеза Н0 отклоняется и принимается гипотеза Н1 .

Критерий Фишера позволяет сравнивать величины выбороч­ных дисперсий двух независимых выборок. Для вычисления Fэмп нуж­но найти отношение дисперсий двух выборок, причем так, что­бы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фи­шера такова:

где - дисперсии первой и второй выборки соответственно.

Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значе­ние Fэмп всегда будет больше или равно единице.

Чис­ло степеней свободы определяется также просто:

k 1=nl - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k 2= n 2 - 1 для второй выборки.

В Приложе­нии 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).

Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. [3] Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дис­персии тестовых оценок в обоих классах. Резуль­таты тестирования представлены в таблице:

Рассчитав дисперсии для переменных X и Y, получаем:

Тогда по формуле (8) для расчета по F критерию Фишера находим:

По таблице из Приложения 1 для F критерия при степенях свободы в обоих случаях равных k =10 - 1 = 9 находим F крит=3,18 ( c следователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.

Критерий предназначен для срав­нения состояния некоторого свойства у членов двух зави­симых выборок на основе измерений, сделанных по шка­ле не ниже ранговой.

Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (х i , у i ), где х i , у i — результаты двукратного измерения одного и того же свойства у одного и того же объекта.

В педагогических исследованиях объектами изуче­ния могут служить учащиеся, учителя, администрация школ. При этом х i , у i могут быть, например, балловы­ми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства.

Нулевая гипотеза формулируются следующим обра­зом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно раз­личны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.

Ста­тистика критерия (Т) определяется следую­щим образом:

Нулевая гипотеза принимается на уровне значимости 0,05, если наблю­даемое значение T n - ta , где значение n - ta определя­ется из статистических таблиц для критерия знаков Приложения 2.

Пример 4. Учащиеся выполняли контрольную ра­боту, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью фор­мирования данного понятия у учащихся с низким уров­нем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.

Результаты двукратного выполнения ра­боты представляют измерения по шкале по­рядка (пятибалльная шкала). В этих условиях возмож­но применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допуще­ния этого критерия.

Результаты двукратного выполнения работы (в бал­лах) 15 учащимися запишем в форме таблицы (см. табл. 1). [4]

1. Статистические критерии различий. Непараметрические критерии для связных выборок

2. План

ПЛАН
1.Статистические критерии различий.
1.1 Понятие статистического критерия различий и
классификация критериев.
1.2 Рекомендации к выбору критерия различий.
2.Непараметрические критерии для связанных
выборок.
2.1 Критерий знаков G.
2.2 Парный критерий Т – Вилкоксона.
2.3 Критерий Фридмана.
2.4 Критерий Пейджа (на семинаре).
2.5 Критерий Макнамары (на семинаре).

Статистические способы, позволяющие оценить степень
статистической достоверности изменения того или иного
показателя (в частности психологического) в одной или нескольких
группах или выявить динамику изменения показателя под
влиянием экспериментальных воздействий называются
статистическими критериями различий.
Критерии различаются по следующим основаниям:
- по типу измерительной шкалы;
- по объему выборки (максимальный и минимальный);
- по количеству выборок;
- по качеству выборки (связные, несвязные);
- по мощности;
- по использованию типа распределения и его параметров
(параметрические и непараметрические).

Мощность критерия — это его способность выявлять
различия или отклонять нулевую гипотезу, если она
неверна(мощность критерия характеризует его
способность избегать ошибок второго рода).
Чем мощнее критерий, тем более трудоемкой
является процедура вычислений с его помощью.
Более того, если значимые различия установлены с
помощью менее мощного критерия, то более
мощный, заведомо подтвердит факт существования
этих различий. Следовательно использование менее
мощных критериев нередко бывает оправданным
(прежде всего в целях экономии времени
вычислений).

Критерии различия называют параметрическим
если он основан на конкретном типе
распределения генеральной совокупности (как
правило нормальном) или использует параметры
этой
совокупности
(среднее
значение,
дисперсию и т.д.)
Критерий
различия
непараметрическим (критерий
распределения) если он не
предположении
о
типе
генеральной совокупности и
параметры этой совокупности.
называют
свободный от
базируется на
распределения
не использует

При
нормальном
распределении
генеральной
совокупности параметрические критерии обладают
большей
мощностью
по
сравнению
с
непараметрическими. По этой причине, в тех случаях
когда выборки взяты из нормально распределенных
генеральных
совокупностей,
следует
отдавать
предпочтение параметрическим критериям.
Однако, как показывает практика, подавляющее
большинство данных получаемых в психологических
экспериментах не распределены нормально, поэтому
применение параметрических критериев при анализе
результатов
психологических
исследовании
может
привести к ошибкам в статистических выводах. В таких
случаях непараметрические критерии оказываются более
мощными, т. е. способными с большей достоверностью
отвергать нулевую гипотезу.

7. Рекомендации к выбору критерия различий:

РЕКОМЕНДАЦИИ К ВЫБОРУ КРИТЕРИЯ РАЗЛИЧИЙ:
прежде всего, определить, является ли выборка связной (зависимой) или
несвязной (независимой);
определить однородность, неоднородность выборки;
оценить объем выборки и, зная ограничения каждого критерия по
объему, выбрать соответствующий критерий;
целесообразнее всего начинать работу с выбора наименее трудоемкого
критерия;
если используемый критерий не выявил различия — следует применить
более мощный, но одновременно и более трудоемкий критерий;
если в распоряжении психолога имеется несколько критериев, то следует
выбирать те из них, которые наиболее полно используют информацию,
содержащуюся в экспериментальных данных.
при малом объеме выборки следует увеличивать величину уровня
значимости (не менее 1%) так как небольшая выборка и низкий уровень
значимости приводят к увеличению вероятности принятия ошибочных
решений.

8. Критерии знаков G

КРИТЕРИИ ЗНАКОВ G
Задача. Психолог проводит групповой тренинг.
Его задача — выяснить будет ли эффективен
данный конкретный вариант тренинга для
снижения уровня тревожности участников?
Решение. Для решения этой задачи психолог с
помощью теста Тейлора дважды выявляет
уровень тревожности у 14 участников до и после
проведения тренинга. Результаты измерения
приведены в таблице.

Сдвиг — это величина разности между показателями
признака одного и того же участника после и до
тренинга. Но не наоборот. Величины сдвигов
обязательно должны быть даны в соответствующем
столбце таблицы с учетом знаков.
Количество положительных сдвигов - 8
Количество отрицательных сдвигов – 5
Типичный сдвиг (наиб. знач. найденных чисел) – 8
Нетипичный сдвиг (наим. знач. найденных чисел) –
5 = Gэмп

Читайте также: