Статистическая проверка гипотез кратко

Обновлено: 04.07.2024

На основе собранных в статистических исследованиях данных после их обработки делаются выводы об изучаемых явлениях. Эти выводы делаются путём выдвижения и проверки статистических гипотез.

Статистической гипотезой называется любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Статистические гипотезы проверяются статистическими методами.

Проверяемая гипотеза называется основной (нулевой) и обозначается Н0. Кроме нулевой выдвигается ещё и альтернативная (конкурирующая) гипотеза Н1,отрицающая основную. Таким образом, в результате проверки будет принята одна и только одна из гипотез, а вторая будет отвергнута.

  • подмножество значений статистики, при которых гипотеза Н0принимается (не отклоняется), называется областью принятия гипотезы (допустимой областью);
  • подмножество значений статистики, при которых гипотеза Н0 отвергается (отклоняется) и принимается гипотеза Н1,называется критической областью.
  1. Критерием называется случайная величина K , которая позволяет принять или отклонить нулевую гипотезу H0 .
  2. При проверке гипотез можно допустить ошибки 2 родов.
    Ошибка первого рода состоит в том, что будет отклонена гипотеза H0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости. Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.
    Ошибка второго рода заключается в том, что гипотеза H0 принимается, если она неверна ("ложное срабатывание"). Вероятность ошибки этого рода обозначается β.

Классификация гипотез

Основная гипотеза Н0 о значении неизвестного параметра q распределения обычно выглядит так:
Н0 : q = q0 .
Конкурирующая гипотеза Н1 может при этом иметь следующий вид:
Н1: q q > q0 или Н1: qq0.
Соответственно получается левосторонняя, правосторонняя или двусторонняя критические области. Граничные точки критических областей (критические точки) определяют по таблицам распределения соответствующей статистики.

При проверке гипотезы разумно уменьшить вероятность принятия неправильных решений. Допустимая вероятность ошибки первого рода обозначается обычно a и называется уровнем значимости. Его значение, как правило, мало (0,1, 0,05, 0,01, 0,001…). Но уменьшение вероятности ошибки первого рода приводит к увеличению вероятности ошибки второго рода (b), т.е. стремление принимать только верные гипотезы вызывает возрастание числа отброшенных правильных гипотез. Поэтому выбор уровня значимости определяется важностью поставленной проблемы и тяжестью последствий неверно принятого решения.
Проверка статистической гипотезы состоит из следующих этапов:
1) определение гипотез Н0 и Н1;
2) выбор статистики и задание уровня значимости;
3) определение критических точек Ккр и критической области;
4) вычисление по выборке значения статистики Кэкс;
5) сравнение значения статистики с критической областью (Ккр и Кэкс);
6) принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н0 и отвергается гипотеза H1, а если входит в критическую область, то отвергается гипотеза Н0 и принимается гипотеза Н1. При этом, результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н1, то можно считать её доказанной, а если принялигипотезу Н0, то признали, что она не противоречит результатам наблюдений.Однако этим свойством наряду с Н0 могут обладать и другие гипотезы.

Классификация проверок гипотез

Рассмотрим далее несколько различных статистических гипотез и механизмов их проверки.
I) Гипотеза о генеральном среднем значении нормального распределения при не известной дисперсии. Предполагаем, что генеральная совокупность имеет нормальное распределение, её среднее и дисперсия неизвестны, но есть основания полагать, что генеральное среднее равно a . При уровне значимости α нужно проверить гипотезу Н0: x =a. В качестве альтернативной можно использовать одну из трёх рассмотренных выше гипотез. В данном случае статистикой служит случайная величина , имеющая распределение Стьюдента с n – 1 степенями свободы. Определяется соответствующее экспериментальное (наблюдаемое) значение tэкс. Из таблицы критических точек распределения Стьюдента находится критическое значение tкр. При альтернативной гипотезе Н1: x >a оно находится по уровню значимости α и числу степеней свободы n – 1. Если tэкс x ≠a критическое значение находится по уровню значимости α /2 и том же числе степеней свободы. Нулевая гипотеза принимается, если | tэкс| .

Инструкция . Для расчета необходимо указать размерность исходных данных.
Количество данных в 1-й выборке
Количество данных во 2-й выборке
Известны выборочные дисперсии
Далее

IV) Гипотеза о равенстве двух дисперсий нормально распределённых генеральных совокупностей. В данном случае при уровне значимостиaнужно проверить гипотезу Н0: D(Х) = D(Y). Статистикой служит случайная величина , имеющая распределение Фишера – Снедекора с f1 = nб – 1 и f2 = nм – 1 степенями свободы (S 2 б – большая дисперсия, объём её выборки nб). Определяется соответствующее экспериментальное (наблюдаемое) значение Fэкс. Критическое значение Fкр при альтернативной гипотезе Н1: D(Х) > D(Y) находится из таблицы критических точек распределения Фишера – Снедекора по уровню значимости a и числу степеней свободы f1 и f2. Нулевая гипотеза принимается, если Fэкс Инструкция . Для расчета необходимо указать размерность исходных данных.

V) Гипотеза о равенстве нескольких дисперсий нормально распределённых генеральных совокупностей по выборкам одинакового объёма. В данном случае при уровне значимостиaнужно проверить гипотезу Н0: D(Х1) = D(Х2) = …= D(Хl). Статистикой служит случайная величина , имеющая распределение Кочрена со степенями свободыf = n – 1 и l (n – объём каждой выборки, l – количество выборок). Проверка этой гипотезы проводится так же, как и предыдущей. Используется таблица критических точек распределения Кочрена.

VI) Гипотеза о существенности корреляционной связи. В данном случае при уровне значимостиaнужно проверить гипотезу Н0: r = 0. (Если коэффициент корреляции равен нулю, то соответствующие величины не связаны друг с другом). Статистикой в данном случае служит случайная величина
,
имеющая распределение Стьюдента с f = n – 2 числом степеней свободы. Проверка этой гипотезы проводится аналогично проверке гипотезы (I).

VIII) Гипотеза о виде распределения генеральной совокупности. Критерий согласия Пирсона. На основании выборки из генеральной совокупности или из каких-то иных соображений выдвигается нулевая гипотеза о конкретном распределении генеральной совокупности, выраженной через функцию распределения F(x). Это распределение назовём теоретическим.
По выборке находится эмпирическая функция распределения F*(x). Гипотеза Н0 о распределении генеральной совокупности принимается, если эмпирическое распределение хорошо согласуется с теоретическим. Для проверки таких гипотез разработаны несколько критериев согласия. Здесь рассматривается c 2 -критерий согласия Пирсона.
При его использовании вся область изменения генеральной совокупности делится на несколько интервалов, которые могут иметь различную длину. По выборке составляют вариационный ряд с использованием этих же интервалов. Если в некотором интервале частота, слишком мала (меньше 4), то этот интервал объединяют с соседним.
По выборке вычисляют оценки параметров теоретического распределения. Тем самым теоретическое распределение будет полностью определено. Далее по теоретическому распределению находятся вероятности того, что случайная величина принимает значение из каждого интервала. После чего вычисляются теоретические частоты (произведения найденной вероятности на объём выборки).
Нулевая гипотеза принимается, если теоретические и эмпирические частоты мало отличаются друг от друга. При этом в качестве статистики рассматривается случайная величина
,
где mi – эмпирические, а mi – теоретические частоты, l – количество интервалов. Эта величина имеет распределение c 2 с lp – 1 степенями свободы (где р – число подбираемых параметров распределения). Основная гипотеза о виде распределения принимается, если χнабл x – общее среднее, x i – среднее на i -том уровне. Легко видеть, что при отсутствии влияния фактора обе эти дисперсии являются несмещёнными оценками генеральной дисперсии. При проверке критерия Фишера число степеней свободы f1 = l – 1, f2 = n – l.
Кроме рассмотренного сейчас однофакторного дисперсионного анализа часто применяется и многофакторный анализ. При этом исследуется влияние на изучаемый признак сразу нескольких внешних причин. В отличие от однофакторного анализа в многофакторном применяются только равномерные выборки. Причём, обычно используются полные планы (должны быть задействованы все комбинации уровней факторов).

1. Статистические гипотезы. Основные понятия.

2. Гипотезы о законе распределения.

3. Гипотезы о числовом значении генерального среднего и дисперсии.

1. Статистические гипотезы. Основные понятия.

Статистическая гипотеза - это утверждение о виде неизвестного распределения или параметрах известного распределения. Статистические гипотезы проверяются по результатам выборки статистическими методами в ходе эксперимента (эмпирическим путем) с помощью статистических критериев.

В тех случаях, когда известен закон, но неизвестны значения его параметров (дисперсия или математическое ожидание) в конкретной ситуации, статистическую гипотезу называют параметрической.

Например, предположение об ожидаемом среднем доходе по акциям или разбросе дохода являются параметрическими гипотезами.

Когда закон распределения генеральной совокупности не известен, но есть основания предположить, каков его конкретный вид, выдвигаемые гипотезы о виде его распределения называются непараметрическими.

Например, можно выдвинуть гипотезу, что число дневных продаж в магазине или доход населения подчинены нормальному закону распределения.

По содержанию статистические гипотезы можно классифицировать:

1. Гипотезы о типе вероятностного закона распределения случайной величины, характеризующего явление или процесс.

2. Гипотезы об однородности двух или более обрабатываемых выборок. Изучаемое свойство исследуется с помощью двух или более генеральных совокупностей. Гипотеза в этом случае может заключаться в следующем: исследуемые выборочные характеристики различаются между собой статистически значимо или нет.

3. Гипотезы о свойствах числовых значений параметров исследуемой генеральной совокупности. Больше ли значения параметров некоторого заданного номинала или меньше и т.д.

4. Гипотезы о вероятностной зависимости двух или более признаков, характеризующих различные свойства рассматриваемого явления или процесса. При этом определяется характер этой зависимости.

Гипотезы бывают простые (содержащие одно предположение) и сложные (содержащие несколько предположений).

Выдвинутую гипотезу называют основной или нулевой и обозначают H0 . Противоречащую ей гипотезу называют альтернативной или конкурирующей и обозначают H1.

Под статистическим критерием понимают однозначно определенное правило, устанавливающее условие, при котором проверяемая гипотеза отвергается либо не отвергается.

Увеличение числа заболевших некоторым заболеванием дает возможность выдвинуть гипотезу о наличии эпидемии. Для сравнения доли заболевших в обычных и экстремальных условиях используются статистические данные, на основании которых делается вывод о том, является ли данное массовое заболевание эпидемией. Предполагается, что существует некоторый критерий- уровень доли заболевших, критический для этого заболевания, который устанавливается по ранее имевшимся случаям.

Различают три вида критериев:

1. Параметрические критерии - критерии значимости, которые служат для проверки гипотез о параметрах распределения генеральной совокупности при известном виде распределения.

2. Критерии согласия - позволяют проверить гипотезы о соответствии распределений генеральной совокупности известной теоретической модели.

3. Непараметрические критерии - используются в гипотезах, когда не требуется знаний о конкретном виде распределения.

Проверка параметрических гипотез проводится на основе критериев значимости., а непараметрических- критериев согласия.

Задача проверки статистических гипотез сводится к исследованию генеральной совокупности по выборке. Множество возможных значений элементов выборки может быть разделено на два непересекающихся подмножества- критическую область и область принятия гипотезы.

Областью принятия гипотезы или областью допустимых значений Iдоп называют совокупность значений критерия, при которых эту гипотезу принимают.

Критической областью Iкр называют множество значений критерия, при котором гипотезу отвергают.

Наблюдаемые значения критерия (статистика) Kнабл называют такое значение критерия, которое находится по данным выборки.

Границы критической области , отделяющие ее от области принятия гипотезы, называют критическими точками и обозначают Kкр.

Для определения критической области задается уровень значимости - некая малая вероятность попадания критерия в критическую область.

Уровень значимости - вероятность принятия конкурирующей гипотезы, тогда как справедлива основная.

С помощью уровня значимости определяются границы критической области.

В зависимости от содержания альтернативной гипотезы осуществляется выбор критической области: левосторонней, правосторонней, двусторонней. Если смысл исследования заключается в доказательстве конкретного изменения наблюдаемого параметра (его уменьшения или увеличения), то говорят об односторонней критической области. Если смысл исследования- выявить различия в изучаемых параметрах, но характер их отклонения от контрольных (или теоретических) не известен, то говорят о двусторонней критической области.

Однако, принятие той или иной гипотезы не дает оснований утверждать, что она верна. Результат проверки статистической гипотезы лишь устанавливают на определенном уровне значимости ее соответствие (несоответствие) результатам эксперимента.

При проверке статистических гипотез возможны следующие ошибки:

1. Отвергнута правильная H0, а принята неправильная гипотеза H1 - ошибка первого рода.

2. Отвергнута правильная альтернативная гипотеза H1 и принята неправильная нулевая гипотеза H0 - ошибка второго рода.

Заметим, что уровень значимости - есть вероятность ошибки первого рода. Ошибка первого рода называется -риском . Обычно они задаются некоторыми конкретными значениями: 0,05; 0,01; 0,005; 0,001. Ошибки второго рода называются -риском , а вероятность ее допустить обозначается (вероятность того, что принята гипотеза H0 , когда на самом деле справедлива альтернативная гипотеза H1 .

Можно доказать, что с уменьшением ошибок первого рода одновременно увеличиваются ошибки второго рода и наоборот. Поэтому, на практике пытаются подбирать значения параметров и опытным путем в целях минимизации суммарного эффекта от возможных ошибок. При принятии управленческих решений для одновременного уменьшения ошибок первого и второго рода самым действенным средством является увеличение объема выборки, что согласуется с законом больших чисел.

На бытовом уровне ошибки второго рода могут иметь более трагические последствия, чем ошибки первого рода.

2. Гипотеза о законе распределения. Критерий согласия Пирсона ( X 2 -критерий).

Критериями согласия называют критерии, в которых гипотеза определяет закон распределения либо полностью, либо с точностью до небольшого числа параметров.

Причины расхождения результатов эксперимента и теоретических характеристик могут быть вызваны малым объемом выборки, неудачным способом группировки наблюдений, ошибками в выборе гипотезы о виде распределения генеральной совокупности и др.

Рассмотрим универсальный критерий согласия Пирсона. Проверка гипотезы о том, что эмпирическая частота мало отличается от соответствующей теоретической частоты, осуществляется с помощью величины X 2 - меры расхождения между ними.

Для произвольной выборки, когда распределение непрерывно или число различных вариант велико, все пространство наблюдаемых вариант делят на конечное число непересекающихся областей, в каждой из которых подсчитывают наблюдаемую частоту и теоретическую вероятность.

Для применения критерия согласия Пирсона необходимо:

1. Вычислить значение статистики по формуле: , где pi –вероятность принятия значения xi, ni. - эмпирическая частота для соответствующего xi. n - объем выборки. s - число вариант выборки.

2. По соответствующей таблице распределения Пирсона найти критическое значение , где k = s – r – 1 – число степеней свободы, s - число различных вариант или интервалов группировки, r - число неизвестных параметров предполагаемого теоретического распределения, - выбранный уровень значимости. Это значит, что строится правосторонний интервал.

3. Если , то основная гипотеза отвергается, в противном случае- принимается, т.е. чем больше отклонение, тем меньше согласованы теоретическое и эмпирическое распределение. Поэтому принято использовать только правостороннюю критическую область.

Статистическая гипотеза – это предположение о виде распределения и свойствах случайной величины в наблюдаемой выборке данных.

В результате проверки гипотезы возможны 4 исхода:

Уровень значимости при проверке гипотезы

Статистический тест (статистический критерий) – это строгое математическое правило, по которому гипотеза принимается или отвергается.
В статистике разработано множество критериев: критерии согласия, критерии нормальности, критерии сдвига, критерии выбросов и т.д.

Например:
Уровень значимости α=0,05 означает, что допускается не более чем 5%-ая вероятность ошибки.

В результате статистического теста на конкретных данных получают эмпирический уровень значимости p . Чем меньше значение p, тем сильнее аргументы против гипотезы \(H_0\).

Обобщив практический опыт, можно сформулировать следующие рекомендации для оценки p и выбора критического значения α:

Уровень
значимости \(p\)
Решение о гипотезе \(H_0\) Вывод для гипотезы \(H_1\)
\(p\gt 0,1\) \(H_0\) не может быть отклонена Статистически достоверные доказательства не обнаружены
\(0,5\lt p\leq 0,1\) Истинность \(H_0\) сомнительна, неопределенность Доказательства обнаружены на уровне статистической тенденции
\(0,01\lt p\leq 0,05\) Отклонение \(H_0\), значимость Обнаружены статистически достоверные (значимые) доказательства
\(p\leq 0,01\) Отклонение \(H_0\), высокая значимость Доказательства обнаружены на высоком уровне значимости

Традиционно уровень значимости α=0,05 выбирается для небольших выборок, в которых велика вероятность ошибки 2-го рода. Для выборок с \(n\geq 100\) критический уровень снижают до α=0,01.

п.3. Критическая область

Критическая область – область выборочного пространства, при попадании в которую нулевая гипотеза отклоняется.
Требуемый уровень значимости α, который задается исследователем, определяет границу попадания в критическую область при верной нулевой гипотезе.

Различают 3 вида критических областей

Критическая область на чертежах заштрихована.
\(K_=\chi_\) определяют границы критической области в зависимости от α.
Если эмпирическое значение критерия попадает в критическую область, гипотезу \(H_0\) отклоняют.
Пусть \(K*\) - эмпирическое значение критерия. Тогда:
\(|K|\gt K_\) – гипотеза \(H_0\) отклоняется
\(|K|\leq K_\) – гипотеза \(H_0\) не отклоняется

п.4. Простая гипотеза и критерии согласия

Пусть \(x=\left\\) – случайная выборка n объектов из множества \(X\), соответствующая неизвестной функции распределения \(F(t)\).
Простая гипотеза состоит в предположении, что неизвестная функция \(F(t)\) является совершенно конкретным вероятностным распределением на множестве \(X\).

Критерий согласия проверяет, согласуется ли заданная выборка с заданным распределением или с другой выборкой.

  • Критерий Колмогорова-Смирнова;
  • Критерий \(X^2\) Пирсона;
  • Критерий \(\omega^2\) Смирнова-Крамера-фон Мизеса

п.5. Критерий согласия \(X^2\) Пирсона

Если мы:
1) выдвигаем простую гипотезу \(H_0\) о том, что полученные данные являются выборкой из некоторого закона распределения \(f(x)\);
2) выбираем в качестве теста проверки гипотезы \(H_0\) критерий Пирсона, -
тогда определение критической области будет основано на распределении \(X^2\).

Например:
В эксперименте 60 раз подбрасывают игральный кубик и получают следующие результаты:

Не является ли кубик фальшивым?

Если кубик не фальшивый, то справедлива гипотеза \(H_0\) - частота выпадений очков подчиняется равномерному распределению: $$ p_i=\frac16,\ \ i=\overline $$ При N=60 экспериментах каждая сторона теоретически должна выпасть: $$ m_i=p_i\cdot N=\frac16\cdot 60=10 $$ по 10 раз.
Строим расчетную таблицу:

\(x_i\) 1 2 3 4 5 6
\(f_i\) 8 12 13 7 12 8 60
\(m_i\) 10 10 10 10 10 10 60
\(f_i-m_i\) -2 2 3 -3 2 -2 -
\(\frac\) 0,4 0,4 0,9 0,9 0,4 0,4 3,4

п.6. Примеры

Пример 1. В эксперименте 72 раза подбрасывают игральный кубик и получают следующие результаты:

Не является ли кубик фальшивым?

Если кубик не фальшивый, то справедлива гипотеза \(H_0\) - частота выпадений очков подчиняется равномерному распределению: $$ p_i=\frac16,\ \ i=\overline $$ При N=72 экспериментах каждая сторона теоретически должна выпасть: $$ m_i=p_i\cdot N=\frac16\cdot 72=12 $$ по 12 раз.
Строим расчетную таблицу:

\(x_i\) 1 2 3 4 5 6
\(f_i\) 8 12 13 7 10 22 72
\(m_i\) 12 12 12 12 12 12 72
\(f_i-m_i\) -4 0 1 -5 -2 10 -
\(\frac\) 1,333 0,000 0,083 2,083 0,333 8,333 12,167

Пример 2. Во время Второй мировой войны Лондон подвергался частым бомбардировкам. Чтобы улучшить организацию обороны, город разделили на 576 прямоугольных участков, 24 ряда по 24 прямоугольника.
В течение некоторого времени были получены следующие данные по количеству попаданий на участки:

Число попаданий, \(x_i\) 0 1 2 3 4 5 6 7
Количество участков, \(f_i\) 229 211 93 35 7 0 0 1

Проверялась гипотеза \(H_0\) - стрельба случайна.

\(x_i\) 0 1 2 3 4 5 6 7
\(f_i\) 229 211 93 35 7 0 0 1 576
\(x_if_i\) 0 211 186 105 28 0 0 7 537

$$ \lambda\approx M(x)=\frac=\frac\approx 0,932 $$ Тогда теоретические частоты будут равны: $$ m_i=N\cdot p(k) $$ Получаем:

\(x_i\) 0 1 2 3 4 5 6 7
\(f_i\) 229 211 93 35 7 0 0 1 576
\(p_i\) 0,39365 0,36700 0,17107 0,05316 0,01239 0,00231 0,00036 0,00005 0,99999
\(m_i\) 226,7 211,4 98,5 30,6 7,1 1,3 0,2 0,0 576,0
\(f_i-m_i\) 2,3 -0,4 -5,5 4,4 -0,1 -1,3 -0,2 1,0 -
\(\frac\) (результат) 0,02 0,00 0,31 0,63 0,00 1,33 0,21 34,34 36,84

Пример 3. В предыдущем примере объединили события x= с редким числом попаданий:

Число попаданий, \(x_i\) 0 1 2 3 4-7
Количество участков, \(f_i\) 229 211 93 35 8

Проверялась гипотеза \(H_0\) - стрельба случайна.

Для последней объединенной варианты находим среднюю взвешенную: $$ x_5=\frac=4,375 $$ Найдем оценку λ.

\(x_i\) 0 1 2 3 4,375
\(f_i\) 229 211 93 35 8 576
\(x_if_i\) 0 211 186 105 35 537

$$ \lambda\approx M(x)=\frac=\frac\approx 0,932 $$ Оценка не изменилась, что указывает на правильное определение средней для \(x_5\).
Строим расчетную таблицу для подсчета статистики:

\(x_i\) 0 1 2 3 4,375
\(f_i\) 229 211 93 35 8 576
\(p_i\) 0,3937 0,3670 0,1711 0,0532 0,0121 0,9970
\(m_i\) 226,7 211,4 98,5 30,6 7,0 574,2
\(f_i-m_i\) 2,3 -0,4 -5,5 4,4 1,0 -
\(\frac\) 0,02 0,00 0,31 0,63 0,16 1,12

И какой же ответ верный? Полученный в Примере 2 или в Примере 3?
Если посмотреть в расчетную таблицу для статистики \(X_e^2\) в Примере 2, основной вклад внесло слагаемое для \(x_i=7\). Оно равно 34,34 и поэтому сумма \(X_e^2=36,84\) в итоге велика. А в расчетной таблице Примера 3 такого выброса нет. Для объединенной варианты \(x_i=4,375\) слагаемое статистики равно 0,16 и сумма \(X_e^2=1,12\) в итоге мала.

Статистическая гипотеза (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.

Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.

Методика проверки статистических гипотез

Пусть задана случайная выборка — последовательность объектов из множества . Предполагается, что на множестве существует некоторая неизвестная вероятностная мера .

Методика состоит в следующем.

Итак, статистический критерий определяется статистикой и критическим множеством , которое зависит от уровня значимости .

Замечание. Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна. Тому есть две причины.

Альтернативная методика на основе достигаемого уровня значимости

Широкое распространение методики фиксированного уровня значимости было вызвано сложностью вычисления многих статистических критериев в докомпьютерную эпоху. Чаще всего использовались таблицы, в которых для некоторых априорных уровней значимости были выписаны критические значения. В настоящее время результаты проверки гипотез чаще представляют с помощью достигаемого уровня значимости.

Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия

где — критическая область критерия.

Другая интерпретация: достигаемый уровень значимости — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем

Если достигаемый уровень значимости достаточно мал (близок к нулю), то нулевая гипотеза отвергается. В частности, его можно сравнивать с фиксированным уровнем значимости; тогда альтернативная методика будет эквивалентна классической.

Типы критической области

Обозначим через значение, которое находится из уравнения , где — функция распределения статистики . Если функция распределения непрерывная строго монотонная, то есть обратная к ней функция:

Значение называется также -квантилем распределения .

  • Левосторонняя критическая область:
  • Правосторонняя критическая область:
  • Двусторонняя критическая область:

Ошибки первого и второго рода

Свойства статистических критериев

Мощность критерия: — вероятность отклонить гипотезу , если на самом деле верна альтернативная гипотеза . Мощность критерия является числовой функцией от альтернативной гипотезы .

Несмещённый критерий: для всех альтернатив или, что то же самое, для всех альтернатив .

Состоятельный критерий: при для всех альтернатив .

Равномерно более мощный критерий. Говорят, что критерий с мощностью является равномерно более мощным, чем критерий с мощностью , если выполняются два условия:

  1. ;
  2. для всех рассматриваемых альтернатив , причём хотя бы для одной альтернативы неравенство строгое.

Типы статистических гипотез

  • Простая гипотеза однозначно определяет функцию распределения на множестве . Простые гипотезы имеют узкую область применения, ограниченную критериями согласия (см. ниже). Для простых гипотез известен общий вид равномерно более мощного критерия (Теорема Неймана-Пирсона).
  • Сложная гипотеза утверждает принадлежность распределения к некоторому множеству распределений на . Для сложных гипотез вывести равномерно более мощный критерий удаётся лишь в некоторых специальных случаях.

Типы статистических критериев

В зависимости от проверяемой нулевой гипотезы статистические критерии делятся на группы, перечисленные ниже по разделам.

Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предпологаются выполненными.

  • Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Если выборка действительно удовлетворяет дополнительным предположениям, то параметрические критерии дают более точные результаты. Однако если выборка им не удовлетворяет, то вероятность ошибок (как I, так и II рода) может резко возрасти. Прежде чем применять такие критерии, необходимо убедиться, что выборка удовлетворяет дополнительным предположениям. Гипотезы о виде распределения проверяются с помощью критериев согласия.
  • Непараметрические критерии не опираются на дополнительные предположения о распределении. В частности, к этому типу критериев относится большинство ранговых критериев.

Критерии согласия

Критерии согласия проверяют, согласуется ли заданная выборка с заданным фиксированным распределением, с заданным параметрическим семейством распределений, или с другой выборкой.

Критерии сдвига

Специальный случай двухвыборочных критериев согласия. Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.

Критерии нормальности

Критерии нормальности — это выделенный частный случай критериев согласия. Нормально распределённые величины часто встречаются в прикладных задачах, что обусловлено действием закона больших чисел. Если про выборки заранее известно, что они подчиняются нормальному распределению, то к ним становится возможно применять более мощные параметрические критерии. Проверка нормальность часто выполняется на первом шаге анализа выборки, чтобы решить, использовать далее параметрические методы или непараметрические. В справочнике А. И. Кобзаря приведена сравнительная таблица мощности для 21 критерия нормальности.

Критерии однородности

Критерии однородности предназначены для проверки нулевой гипотезы о том, что две выборки (или несколько) взяты из одного распределения, либо их распределения имеют одинаковые значения математического ожидания, дисперсии, или других параметров.

Критерии симметричности

Критерии симметричности позволяют проверить симметричность распределения.

  • Одновыборочный критерий Уилкоксона и его модификации: критерий Антилла-Кёрстинга-Цуккини, критерий Бхаттачария-Гаствирса-Райта
  • Критерий знаков
  • Коэффициент асимметрии

Критерии тренда, стационарности и случайности

Критерии тренда и случайности предназначены для проверки нулевой гипотезы об отсутствии зависимости между выборочными данными и номером наблюдения в выборке. Они часто применяются в анализе временных рядов, в частности, при анализе регрессионных остатков.

Читайте также: