Статистические критерии различий доклад

Обновлено: 02.07.2024

Найди готовую курсовую работу выполненное домашнее задание решённую задачу готовую лабораторную работу написанный реферат подготовленный доклад готовую ВКР готовую диссертацию готовую НИР готовый отчёт по практике готовые ответы полные лекции полные семинары заполненную рабочую тетрадь подготовленную презентацию переведённый текст написанное изложение написанное сочинение готовую статью

Италия: исторический опыт организации системы здравоохранения, соц.обеспечения, пенсионного обеспечения

Вопрос 5. Статистические критерии

Статистический критерий - это решающее правило, обеспечиваю­щее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью (Суходольский Г.В., 1972, с. 291).

Статистические критерии обозначают также метод расчета опре­деленного числа и само это число.

Когда мы говорим, что достоверность различий определялась по критерию X 2 , то имеем в виду, что использовали метод X 2 для расчета определенного числа.

Когда мы говорим, далее, что X 2 = 12,676, то имеем в виду опре­деленное число, рассчитанное по методу X 2 . Это число обозначается как эмпирическое значение критерия.

По соотношению эмпирического и критического значений крите­рия мы можем судить о том, подтверждается ли или опровергается ну­левая гипотеза. Например, если X 2 эмп > X 2 кр., то Н0 отвергается.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия пре­вышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.

Эти правила оговариваются в описании каждого из представлен­ных в руководстве критериев.

В некоторых случаях расчетная формула критерия включает в се­бя количество наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого крите­рия является критерий φ*, вычисляемый на основе углового преобразо­вания Фишера.

Рекомендуемые материалы

Психомоторные и эмоциональные критерии визуальной диагностики в различных типах темперамента и акцентуаций характера

В большинстве случаев, однако, одно и то же эмпирическое зна­чение критерия может оказаться значимым или незначимым в зависи­мости от количества наблюдений в исследуемой выборке (n) или от так называемого количества степеней свободы, которое обозначается как ν или как df.

Число степеней свободы V равно числу классов вариационного ряда минус число условий, при которых он был сформирован (Ивантер Э.В., Коросов А.В., 1992, с. 56). К числу таких условий относятся объем выборки (n), средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и подсчитали количество наблюдений в каж­дой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет работать на компьютере - умеет выполнять лишь определенные опера­ции - не умеет работать на компьютере". Выборка состоит из 50 чело­век. Если в первый класс отнесены 20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные 10 испытуе­мых. Мы ограничены одним условием - объемом выборки. Поэтому даже если мы потеряли данные о том, сколько человек не умеют рабо­тать на компьютере, мы можем определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем- разряде, "свобода" простирается только на первые две ячейки классификации:

V = c-l = 3- 1 = 2

Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т. д.

Способы более сложного подсчета числа степеней свободы при двухмерных классификациях приведены в разделах, посвященных кри­терию χ 2 и дисперсионному анализу.

Зная п и/или число степеней свободы, мы по специальным таб­лицам можем определить критические значения критерия и сопоставить с ними полученное эмпирическое значение. Обычно это записывается так: "при n=22 критические значения критерия составляют . " или "при v=2 критические значения критерия составляют . " и т.п.

Критерии делятся на параметрические и непараметрические.

Параметрические критерии

Критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (/-критерий Стьюдента, критерий F и др.)

Непараметрические критерия

Критерии, не включающие в формулу расчета параметров распределе­ния и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.)

И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позво­ляющую оценить возможности и ограничения тех и других (Рунион Р., 1982; McCall R., 1970; J.Greene, M.D'Olivera, 1989).

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют прямо оценить различия в средних, полученных в двух вы­борках (t - критерий Стьюдента).

2.Позволяют прямо оценить различия в дисперсиях (критерий Фишера).

3.Позволяют выявить тенденции изме­нения признака при переходе от ус­ловия к условию (дисперсионный
однофакторный анализ), но лишь при условии нормального распреде­ления признака.

4.Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).

5.Экспериментальные данные должны отвечать двум, а иногда трем, усло­виям:

а) значения признака измерены по интервальной шкале;

б) распределение признака является нормальным;

в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

6.Математические расчеты довольно сложны.

7.Если условия, перечисленные в п.5, выполняются, параметрические кри­терии оказываются несколько более
мощными, чем непараметрические.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют оценить лишь средние тенден­ции, например, ответить на вопрос, чаще ли в выборке А встречаются более высо­кие, а в выборке Б - более низкие значе­ния признака (критерии Q, U, φ* и др.).

2.Позволяют оценить лишь различия в диа­пазонах вариативности признака (критерий φ*).

3.Позволяют выявить тенденции изменения признака при переходе от условия к усло­вию при любом распределении признака (критерии тенденций L и S).

4.Эта возможность отсутствует.

5.Экспериментальные данные могут не от­вечать ни одному из этих условий:

а) значения признака могут быть пред­ставлены в любой шкале, начиная от шка­лы наименований;

б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения
необязательно и не нуждается в проверке;

в) требование равенства дисперсий отсут­ствует.

6.Математические расчеты по большей час­ти просты и занимают мало времени (за исключением критериев χ 2 и λ).
7.Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем пара­метрические, так как они менее чувствительны к "засорениям".

Из Табл. 1.1 мы видим, что параметрические критерии могут оказаться несколько более мощными 4 , чем непараметрические, но толь­ко в том случае, если признак измерен по интервальной шкале и нор­мально распределен. С интервальной шкалой есть определенные про­блемы (см. раздел "Шкалы измерения"). Лишь с некоторой натяжкой мы можем считать данные, представленные не в стандартизованных оценках, как интервальные. Кроме того, проверка распределения "на нормальность" требует достаточно сложных расчетов, результат кото­рых заранее неизвестен (см. параграф 7.2). Может оказаться, что рас­пределение признака отличается от нормального, и нам так или иначе все равно придется обратиться к непараметрическим критериям.

4 О понятии мощности критерия см. ниже.

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с пара­метрическими критериями они ограничены лишь в одном - с их помо­щью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.

Учитывая это, в настоящее руководство включены в основном непараметрические статистические критерии. В сумме они охватывают большую часть возможных задач сопоставления данных.

Единственный параметрический метод, включенный в руково­дство - метод дисперсионного анализа, двухфакторный вариант которого ничем невозможно заменить.

Проведение географических исследований предполагает не только изучение строения, развития, закономерностей распространения исследуемых объектов, явлений, но и установление сходства или различия между одноименными генеральными совокупностями изучаемых систем. Это зависит от условий, в которых протекает один и тот же процесс. Сопряженный анализ одноименных признаков в выборках используется для классификации и районирования по одному или нескольким параметрам. При этом возникает необходимость применения объективного метода выделения классификационных групп или районов на основе методов математической статистики с использованием критериев достоверности. Если достоверность различия между выборочными совокупностями доказана, то генеральные совокупности, сравниваемые по какому-либо признаку, выделяют как самостоятельные. В случае отсутствия достоверных различий их объединяют в одну группу.

Различие между двумя выборками устанавливается с помощью ряда критериев: t – распределение Стьюдента, наименьшего существенного различия (НСР), F – распределения Фишера, критерия соответствия (χ 2 ).

Каждый из критериев применяется при определенных условиях, которые задаются целью исследования. Несоблюдение указанных условий может привести к ошибочным выводам.

Прежде, чем приступать к статистической обработке и расчету критериев различия, следует убедиться в отсутствии артефакта в сравниваемых выборках. Если в малых совокупностях распределение нормально, то для установления артефакта достаточно использовать правило трех сигм. Согласно этому правилу, в пределах М±3σ находится 99,7 % всех вариант выборки. Если крайние варианты попадают в этот интервал, то они включаются в статистическую выборку, так как не являются артефактом. Наличие артефакта можно проверить по формулам (1.1, 1.2).

Критерий Стьюдента. Используется для оценки сходства или различия между выборочными совокупностями по разности величин их средних арифметических ( d = M большая – Мменьшая) и ее отношения к ошибке этой разности ( md ) при условии распределения вариант в группах по закону нормального распределения и подтверждается равенство разброса вариант в выборке (близкие дисперсии сравниваемых выборок). Не допускается применения критерия в случае балльного характера сравниваемых числовых признаков.

Выбор конкретной методики оценки различий по критерию Стьюдента зависит от учета следующих особенностей выборочных совокупностей: сравниваются средние арифметические в независимых (несвязанных) выборках; различия устанавливаются в сопряженных (парных) выборках; устанавливается различие между выборочными и генеральными средними (теоретическими стандартами).

Независимые статистические совокупности могут быть получены на одном или нескольких объектах, но при одинаковых условиях проведения эксперимента: например, измерение температуры воздуха в январе в г. Бресте на протяжении нескольких лет и установление достоверных различий между этими показателями по годам исследований; сравнение экономического показателя в хозяйстве или на предприятии по пятилеткам между собой; сравнение чистого дохода в хозяйствах с одинаковым экономическим развитием, но расположенных на значительном расстоянии. При сравнении независимых выборочных совокупностей объемы выборок могут быть одинаковы ( N 1 = N 2) или разные ( N 1 ≠ N 2). В двух сравниваемых независимых выборках с одинаковым или разным объемом наблюденийстепень свободы определяется по формуле: ν = ( N 1–1) + ( N 2 – 1) = N 1 + N 2 – 2.

При малых объемах независимых совокупностей, если дисперсии сравниваемых выборок нельзя считать одинаковыми.

Сопряженные статистические совокупности получают на одном илина разных объектах, но в разных условиях. Например, сравнение температуры воздуха в июле и январе г. Могилева; сравнение прибыли фермерских и подсобных хозяйств в любом районе или фермерских хозяйств Витебской и Гомельской области. Объем сравниваемых выборок должен быть одинаков ( N 1 = N 2). Определение степени свободы для сопряженных выборок определяется как: ν = N пар – 1.

Ошибка разности между средними выборок ( md ) в зависимости от вида наблюдений (независимые, сопряженные) и объема наблюдений рассчитывается по разным формулам. Рассмотрим их ниже.

Сопоставляя критерий Стьюдента вычисленный с табличным устанавливают или отвергают с некоторой долей уверенности различия между средними арифметическими выборок.

Пример. При исследовании глубины расчленения рельефа в Северной (х1) и Центральной (х2) провинци Беларуси необходимо установить, объединять их в один геоморфологический район по степени расчленения рельефа или различать их как самостоятельные. Исходные данные и их обработка приводятся в табл. 1.5. Из полученной информации по средним арифметическим различие по глубине расчленения рельефа можно признать как существенным, так и несущественным. Для объективных выводов используем критерий Стьюдента.


Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.

Статистические критерии подразделяются на следующие категории:

*Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: H_0: quad a=a_0 — нулевая гипотеза. H_1: quad a>a_0 quad (a или a eq a_0 — конкурирующая гипотеза.

*Критерии согласия. Проверка на согласие подразумевает проверку факта о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости.

*Критерии на однородность. При проверке на однородность случайные величины исследуются на факт взаимного соответствия их законов распределения (подчиняются ли эти величины одному и тому же закону). Используются в факторном (дисперсионном) анализе для определения наличия зависимостей.

Непараметрические критерии

Группа статистических критериев, которые не включают в расчёт парметры вероятностного распределения и основаны на оперировании частотами или рангами.

Параметрические критерии

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

* Критерий отношения правдоподобия



1. Критерий Фишера (F-критерий, φ*-критерий, критерий наименьшей значимой разности) — апостериорный статистический критерий, используемый для сравнения дисперсий двух вариационных рядов, то есть для определения значимых различий между групповыми средними в установке дисперсионного анализа.


2. t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

Алгоритм применения -критерия Стьюдента для сравнения оценки средних величин двух выборок

Записать вариационный ряд результатов X экспериментальной группы.

Записать вариационный ряд результатов Y контрольной группы.

Найти выборочные средние двух выборок x и y.

Найти выборочные дисперсии и .


Вычислить эмпирическое значение критической статистики

Определить по таблице критическое значение для соответствующего уровня значимости и данного числа степеней свободы .


Если , то различия между средними значениями экспериментальной и контрольной групп существенны на данном уровне значимости.

Особенности использования t-критерия Стьюдента. Наиболее часто t -критерий используется в двух случаях. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных пациентов, количество которых в группах может быть различно.

Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп.

Критерий для независимых выборок.

Цель, предположения. t-критерий является наиболее часто используемым методом обнаружения различия между средними двух выборок. Например, t-критерий можно использовать для сравнения средних показателей группы пациентов, принимавших определенное лекарство, с контрольной группой, где принималось безвредное лекарство. Теоретически, t-критерий может применяться, даже если размеры выборок очень небольшие (например, 10; некоторые исследователи утверждают, что можно исследовать выборки меньшего размера), и если переменные нормально распределены (внутри групп), а дисперсии наблюдений в группах не слишком различны. Предположение о нормальности можно проверить, исследуя распределение или применяя какой-либо критерий нормальности. Если условия применимости t-критерия не выполнены, следует использовать непараметрические альтернативы t-критерия.

Расположение данных. Чтобы применить t-критерий для независимых выборок, требуется, по крайней мере, одна независимая (группирующая) переменная (например, Пол: мужчина/женщина) и одна зависимая переменная (например, тестовое значение некоторого показателя, кровяное давление, число лейкоцитов и т.д.). С помощью специальных значений независимой переменной (эти значения называются кодами, например, мужчина и женщина) данные разбиваются на две группы. Можно произвести анализ следующих данных с помощью t-критерия, сравнивающего среднее WCC для мужчин и женщин.

наблюдение 1 наблюдение 2 наблюдение 3 наблюдение 4 наблюдение 5

мужчина мужчина мужчина женщина женщина

111 110 109 102 104

среднее WCC для мужчин = 110 среднее WCC для женщин = 103

Критерий для зависимых выборок.

Внутригрупповая вариация. Cтепень различия между средними в двух группах зависит от внутригрупповой вариации (дисперсии) переменных. В зависимости от того, насколько различны эти значения для каждой группы, "грубая разность" между групповыми средними показывает более сильную или более слабую степень зависимости между независимой (группирующей) и зависимой переменными. Например, если среднее WCC (число лейкоцитов - White Cell Count) равнялось 102 для мужчин и 104 для женщин, то разность внутригрупповых средних только на величину 2 будет чрезвычайно важной, когда все значения WCC мужчин лежат в интервале от 101 до 103, а все значения WCC женщин - в интервале 103 - 105. В этом случае можно довольно хорошо предсказать WCC (значение зависимой переменной) исходя из пола субъекта (независимой переменной). Однако если та же разность 2 получена из сильно разбросанных данных (например, изменяющихся в пределах от 0 до 200), то этой разностью вполне можно пренебречь. Таким образом, можно сказать, что уменьшение внутригрупповой вариации увеличивает чувствительность критерия.

Цель. t-критерий для зависимых выборок очень полезен в тех довольно часто возникающих на практике ситуациях, когда важный источник внутригрупповой вариации (или ошибки) может быть легко определен и исключен из анализа. Например, это относится к экспериментам, в которых две сравниваемые группы основываются на одной и той же совокупности наблюдений (субъектов), которые тестировались дважды (например, до и после лечения, до и после приема лекарства). В подобных экспериментах значительная часть внутригрупповой изменчивости (вариации) в обеих группах может быть объяснена индивидуальными различиями субъектов. Заметим, что на самом деле, такая ситуация не слишком отличается от той, когда сравниваемые группы совершенно независимы, где индивидуальные отличия также вносят вклад в дисперсию ошибки. Однако в случае независимых выборок, вы ничего не сможете поделать с этим, т.к. не сможете определить (или "удалить") часть вариации, связанную с индивидуальными различиями субъектов. Если та же самая выборка тестируется дважды, то можно легко исключить эту часть вариации. Вместо исследования каждой группы отдельно и анализа исходных значений, можно рассматривать просто разности между двумя измерениями (например, "до приема лекарства" и "после приема лекарства") для каждого субъекта. Вычитая первые значения из вторых (для каждого субъекта) и анализируя затем только эти "чистые (парные) разности", вы исключите ту часть вариации, которая является результатом различия в исходных уровнях индивидуумов. Именно так и проводятся вычисления в t-критерии для зависимых выборок. В сравнении с t-критерием для независимых выборок, такой подход дает всегда "лучший" результат (критерий становится более чувствительным).

Предположения. Теоретические предположения t-критерия для независимых выборок относятся также к критерию для зависимых выборок. Это означает, что попарные разности должны быть нормально распределены. Если это не выполняется, то можно воспользоваться одним из альтернативных непараметрических критериев.

Расположение данных. Вы можете применять t-критерий для зависимых выборок к любой паре переменных в наборе данных. Заметим, применение этого критерия мало оправдано, если значения двух переменных несопоставимы. Например, если вы сравниваете среднее WCC в выборке пациентов до и после лечения, но используете различные методы вычисления количественного показателя или другие единицы во втором измерении, то высоко значимые значения t-критерия могут быть получены искусственно, именно за счет изменения единиц измерения. Следующий набор данных может быть проанализирован с помощью t-критерия для зависимых выборок.

наблюдение 1 наблюдение 2 наблюдение 3 наблюдение 4 наблюдение 5 .

111.9 109 143 101 80 .

113 110 144 102 80.9 .

средняя разность между WCC "до" и "после" = 1

Средняя разность между показателями в двух столбцах относительно мала (d=1) по сравнению с разбросом данных (от 80 до 143, в первой выборке). Тем не менее t-критерий для зависимых выборок использует только парные разности, "игнорируя" исходные численные значения и их вариацию. Таким образом, величина этой разности 1 будет сравниваться не с разбросом исходных значений, а с разбросом индивидуальных разностей, который относительно мал: 0.2 (от 0.9 в наблюдении 5 до 1.1 в наблюдении 1). В этой ситуации разность 1 очень большая и может привести к значимому t-значению.

1. Q-критерий Розенбаума — простой непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого-либо признака, измеренного количественно.

Мощность критерия не очень велика. В том случае, когда если он не выявляет различий, можно обратиться к другим статистическим критериям, например, к U-критерию Манна-Уитни или критерию φ* Фишера.

Данные для применения Q-критерия Розенбаума должны быть представлены хотя бы в порядковой шкале. Признак должен измеряться в значительном диапазоне значений (чем более значительном – тем лучше).

Ограничения применимости критерия

В каждой из выборок должно быть не менее 11 значений признака.

Объемы выборок должны примерно совпадать.

Если объемы выборок меньше 50, то абсолютная величина разности n1 (количество единиц в первой выборке) и n2 (количество единиц во второй выборке) не должна быть больше 10.

Если объемы выборок между 50 и 100, то абсолютная величина разности n1 и n2 не должна быть больше 20;

Если объемы выборок больше 100, то допускается, чтобы одна из выброк превышала другую не более чем в 1,5 – 2 раза.

Диапазоны значений признака в двух выборках не должны совпадать между собой.

Использование критерия

Для применения Q-критерия Розенбаума нужно произвести следующие операции.

Упорядочить значения отдельно в каждой выборке по степени возрастания признака; принять за первую выборку ту, значения признака в которой предположительно выше, а за вторую – ту, где значения признака предположительно ниже.

Определить максимальное значение признака во второй выборке и подсчитать количество значений признака в первой выборке, которые больше его (S1).

Определить минимальное значение признака в первой выборке и подсчитать количество значений признака во второй выборке, которые меньше его (S2).

Рассчитать значение критерия Q = S1 + S2.

По таблице определить критические значения критерия для данных n1 и n2. Если полученное значение Q превышает табличное или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение Q меньше табличного, принимается нулевая гипотеза.

Различия между двумя выборками достоверны с вероятностью 95% при p=0,05 и с вероятностью 99% при p=0,01. Для выборок, в которых больше чем 26 элементов, критические значения Q принимаются равными 8 (при p=0,05) и 10 (при p=0,01).

2. U-критерий Манна-Уитни (англ. Mann-Whitney U test) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками. Другие названия: критерий Манна-Уитни-Уилкоксона (англ. Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (англ. Wilcoxon-Mann-Whitney test).

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.

В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.

Использование критерия

Для применения U-критерия Манна-Уитни нужно произвести следующие операции.

Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N = n1 + n2, где n1 — количество единиц в первой выборке, а n2 — количество единиц во второй выборке.

Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно — на долю элементов второй выборки. Определить большую из двух ранговых сумм (Tx), соответствующую выборке с nx единиц.


Определить значение U-критерия Манна-Уитни по формуле: .

По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n1 и n2. Если полученное значение U меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U.

При справедливости нулевой гипотезы критерий имеет матожидание и дисперсию и при достаточно большом объёме выборочных данных (n1 > 19,n2 > 19) распределён практически нормально.

3. Критерий Т Вилкоксона для сопоставления двух показателей испытуемых.

Алгоритм применения

Составить список испытуемых.

Вычислить разность между индивидуальными значениями во 2-м и 1-м замерах ("после" - "до"). Определить, что будет считаться "типичным" сдвигом, и сформулировать гипотезу.

Найти абсолютные величины разностей.

Проранжировать абсолютные величины разностей, начиная с меньшего значения.


Отметить ранги, соответствующие сдвигам в "нетипичном" направлении, подсчитать сумму этих рангов .

Определить критические значения для данного (по таблице прил. 10). Если , то сдвиг в "типичную" сторону по интенсивности достоверно преобладает.

Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых.

12 участников тренинга партнерского общения дважды ("до" и "после") оценивали у себя уровень владения аргументацией. Получены данные по 10-балльной шкале.


8.


9.




попадает в зону неопределенности, следовательно, отвергается.

4. G – КРИТЕРИЙ ЗНАКОВ

G-критерий знаков применяется при выяснении направ­ления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых.

Ограничения

Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n1 ≤ 300 и 5 ≤ n2 ≤ 300.

Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.

Содержание

Определение

Пусть даны выборка = (X_1,\ldots,X_n)" width="" height="" />
из неизвестного совместного распределения ^<\mathbf>" width="" height="" />
, и семейство статистических гипотез . Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:

f: \mathbb<R></p>
<p>^n \to \<H_0,H_1,\ldots\>
.

\mathbf<x></p>
<p>Таким образом каждой реализации выборки = (x_1,\ldots,x_n)
статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.

Виды критериев

Статистические критерии подразделяются на следующие категории:

  • Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: — нулевая гипотеза. или — конкурирующая гипотеза.
  • Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:
  • Критерии проверки на однородность. При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (т.е. проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном (дисперсионном) анализе для определения наличия зависимостей.

Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.

Непараметрические критерии

Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.

Параметрические критерии

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

Основные понятия

Простой пример

Пусть дана независимая выборка = (X_1,\ldots,X_n)^" width="" height="" />
, где (\mu,1),\quad i=1,\ldots,n" width="" height="" />
. Пусть есть две простые гипотезы:

\begin</p>
<p> H_0: & \mu = 0, \\ H_1: & \mu = 1. \end

Тогда можно определить следующий статистический критерий:


\bar<x></p>
<p>где = \frac\sum\limits_^n x_i
- выборочное среднее.

См. также

Литература

  1. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. Часть II: Непараметрические критерии. — М.: Госстандарт РФ, 2002. Электронная версия.
  • Математическая статистика
  • Статистические критерии

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Статистический критерий" в других словарях:

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ — определяющие правила, согласно к рымпо результатам наблюдений принимается решение в задаче статистическойпроверки гипотез. С. к. строится следующим образом. Выбирается проверочнаястатистика ф ция данных наблюдений х и проверяемой гипотезы… … Физическая энциклопедия

статистический критерий — состоит из следующих компонент: пара гипотез – нулевая и альтернативная, статистика критерия и уровень значимости; по ним мы находим еще критическую область. Проверка гипотезы начинается с вычисления статистики критерия. Если значение попадает в… … Словарь социологической статистики

статистический критерий — 3.9 статистический критерий (estimator): Статистическая величина, используемая для оценки параметра генеральной совокупности. [ИСО 3534 1, статья 2.50] Источник … Словарь-справочник терминов нормативно-технической документации

(статистический) критерий — 3.29 (статистический) критерий [(statistical) test]: Статистическая процедура, предназначенная для решения о принятии или отклонении гипотезы о распределении одной или нескольких совокупностей. Источник: ГОСТ Р ИСО 12491 2011: Материалы и изделия … Словарь-справочник терминов нормативно-технической документации

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ — решающее правило, по к рому на основе результатов наблюдений принимается решение в задаче статистических гипотез проверки. Пусть по реализации х= (х 1, . . ., х п )случайного вектора Х = (Х 1.. . ., Х n), принимающего значения в выборочном… … Математическая энциклопедия

Последовательный статистический критерий — Последовательный статистический критерий последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе. Пусть наблюдению в статистическом эксперименте доступна случайная величина с… … Википедия

Критерий согласия Колмогорова — или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

Критерий Фишера — (F критерий, φ* критерий, критерий наименьшей значимой разности) апостериорный статистический критерий, используемый для сравнения дисперсий двух вариационных рядов, то есть для определения значимых различий между групповыми средними в… … Википедия

Критерий согласия Пирсона — Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия

Критерий Лиллиефорса — статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия

Читайте также: