Метод колмогорова смирнова кратко

Обновлено: 30.06.2024

Найди готовую курсовую работу выполненное домашнее задание решённую задачу готовую лабораторную работу написанный реферат подготовленный доклад готовую ВКР готовую диссертацию готовую НИР готовый отчёт по практике готовые ответы полные лекции полные семинары заполненную рабочую тетрадь подготовленную презентацию переведённый текст написанное изложение написанное сочинение готовую статью

Сделан в Word, графики в электронном виде с ссылками. Курсовая работа. Вариант 33. Гидравлический расчет гидросистемы стенда для испытания центробежных насосов.

λ - критерий Колмогорова-Смирнова

Назначение критерия

Критерий λ предназначен для сопоставления двух распределений:

а) эмпирического с теоретическим, например, равномерным или нормальным;

б) одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Описание критерия

Рекомендуемые материалы

Если в методе χ 2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала часто­ты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверны­ми. В формулу критерия λ включается эта разность. Чем больше эмпи­рическое значение λ, тем более существенны различия.

Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

Графическое представление критерия

На Рис. 4.9 столбиками представлены относительные частоты 8 попадания желтого цвета сначала на 1-ю позицию (первый левый стол­бик), затем на 1-ю и 2-ю позицию (второй столбик), затем на 1-ю, 2-ю и 3-ю позиции и т. д. Мы видим, что высота столбиков постоянно воз­растает, так как они отражают относительные частоты, накопленные к данной позиции. Например, столбик на 3-й позиции имеет высоту 0,51. Это означает, что на первые три позиции желтый цвет помещают 51% испытуемых.

8 Относительная частота, или частость, - это частота, отнесенная к общему коли­честву наблюдении; в данном случае это частота попадания желтого цвета на дан­ную позицию, отнесенная к количеству испытуемых. Например, частота попадания желтого цвета на 1-ю позицию ƒ=24; количество испытуемых n=102; относительная частота ƒ*=ƒ/n=О,235.


Рис 4.9. Сопоставления в критерии λ: стрелками отмечены расхождения между эмпирическими и теоретическими накоплениями относительными частотами по каждому разряду

Максимальное расхождение на Рис. 4.9 обозначено как dmax Именно эта, третья позиция цвета, и является переломной точкой, опре­деляющей, достоверно ли отличается данное эмпирическое распределе­ние от равномерного. Мы проверим это при рассмотрении Примера 1.

Ограничения критерия λ

1. Критерии требует, чтобы выборка была достаточно большой. При сопоставлении двух эмпирических распределений необходимо, что­бы n1,2 >50. Сопоставление эмпирического распределения с теоре­тическим иногда допускается при n>5 (Ван дер Варден Б.Л., 1960; Гублер Е.В., 1978).

2. Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, мы можем за разряды принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточ­ности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то и накопление частот будет отражать лишь этот элемент случайного соседства разрядов. Например, если шесть стимульных картин в ме­тодике Хекхаузена разным испытуемым предъявляются в разном порядке, мы не вправе говорить о накоплении реакций при переходе от картины №1 стандартного набора к картине №2 и т. д. Мы не можем говорить об однонаправленном изменении признака при со­поставлении категорий "очередность рождения", "национальность", "специфика полученного образования" и т.п. Эти данные представ­ляют собой номинативные шкалы: в них нет никакого однозначного однонаправленного изменения признака.

Итак, мы не можем накапливать частоты по разрядам, которые отличаются лишь качественно и не представляют собой шкалы порядка. Во всех тех случаях, когда разряды представляют собой не упо­рядоченные по возрастанию или убыванию какого-либо признака кате­гории, нам следует применять метод χ 2 .

Пример 1: Сопоставление эмпирического распределения с теоретическим

Таблица 4.16

Эмпирические частоты попадания желтого цвета на каждую из 8 позиций (n=102)

Критерий Колмогорова-Смирнова используется для проверки гипотезы : "случайная величина имеет распределение ".

Содержание

Описание критерия

Классический критерий Колмогорова (иногда говорят Колмогорова-Смирнова) предназначен для проверки простых гипотез о принадлежности анализируемой выборки некоторому полностью известному закону распределения.

Пусть - выборка независимых одинаково распределённых случайных величин, - эмпирическая функция распределения, - некоторая "истинная" функция распределения с известными параметрами. Статистика критерия определяется выражением:

Обозначим через гипотезу о том, что выборка подчиняется распределению . Тогда по теореме Колмогорова при справедливости проверяемой гипотезы:

Гипотеза отвергается, если статистика превышает квантиль распределения заданного уровня значимости , и принимается в противном случае.


Примечание: В критерии Колмогорова целесообразно использовать статистику с поправкой Большева: . Распределение этой статистики при справедливости проверяемой гипотезы быстро сходится к распределению Колмогорова и при зависимостью от объема выборки можно пренебречь.

Использование критерия для проверки нормальности

В данном случае критерий Колмогорова используется для проверки гипотезы о принадлежности наблюдаемой выборки нормальному закону, параметры которого оцениваются по этой самой выборке методом максимального правдоподобия. То есть, проверяется сложная гипотеза и в качестве оценок параметров нормального закона используются выборочные оценки среднего и дисперсии.

В этом случае (Lilliefors) использовались модифицированные статистики вида:

Критические значения для статистики приведены в следующей таблице (Lilliefors):

0,15 0,10 0,05 0,03 0,01
0,775 0,819 0,895 0,955 1,035

Проверка сложных гипотез

При проверке сложных гипотез, когда по выборке оцениваются параметры закона, с которым проверяется согласие, непараметрические критерии согласия теряют свойство свободы от распределения (Kac, Kiefer, Wolfowitz). При проверке сложных гипотез условные распределения статистик непараметрических критериев согласия (и критерия Колмогорова) зависят от ряда факторов: от вида наблюдаемого закона, соответствующего справедливой проверяемой гипотезе; от типа оцениваемого параметра и числа оцениваемых параметров; в некоторых случаях от конкретного значения параметра (например, в случае семейств гамма- и бета-распределений); от метода оценивания параметров.

Различия в предельных распределениях той же самой статистики при проверке простых и сложных гипотез настолько существенны, что пренебрегать этим ни коем случае нельзя.

О применении критерия Колмогорова для проверки различных сложных гипотез см. на сайте Новосибирского государственного технического университета:

Этот критерий, так же как и рассмотренный выше критерий Пирсона, предназначен для сопоставления либо эмпирического распределения с теоретическим, либо двух эмпирических распределений. Критерий lпозволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

В предыдущем критерии сопоставлялись частоты двух распределений по каждому разряду отдельно, здесь же сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов, и т.д., то есть, сопоставляются накопленные к данному разряду частоты. Если различия между распределениями статистически значимы, то в определенный момент разность накопленных частот достигнет критического значения, и тогда следует признать различия статистически достоверными.

Статистические гипотезы формулируем следующим образом:

Н0: Различия между двумя распределениями недостоверны (судя по точке максимально накопленного расхождения между ними).

Н1: Различия между двумя распределениями достоверны (судя по точке максимально накопленного расхождения между ними).

Расчет критерия lприведен в алгоритме 12 в случае сопоставления эмпирического и теоретического распределения и в алгоритме 13 в случае сопоставления двух эмпирических распределений. Оба алгоритма будут рассмотрены ниже.

При использовании критерия Колмогорова – Смирнованужно учитывать следующие ограничения.

1.Выборка должна быть достаточно большой. При сопоставлении двух эмпирических распределений должно быть n1,n2 ³ 50. При сопоставлении эмпирического и теоретического распределений допускается n ³ 5.

2.Разряды должны быть упорядочены по нарастанию (или убыванию) значений признака, то есть, они обязательно должны отражать однонаправленное его изменение.

АЛГОРИТМ 12

Расчет абсолютной величины разности d между эмпирическим и равномерным распределениями.

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2. Подсчитать относительные эмпирические частоты для каждого разряда по формуле: f * эмп= fэмп/n (второй столбец).

3. Подсчитать накопленные относительные частоты S fj * поформуле: S fj * = S f * j-1+ fj * , где S fj * -1относительные частоты, накопленные на предыдущих разрядах (третий столбец).

4. Подсчитать накопленные относительные теоретические частоты для каждого разряда по формуле: S f * Tj= S f * Tj-1+ f * Tj, где S fTj * -1относительные теоретические частоты, накопленные на предыдущих разрядах (четвертый столбец).

5. Вычислить разности между эмпирическими и теоретическими накопленными относительными частотами по каждому разряду (между значениями третьего и четвертого столбцов).

6. Записать в пятый столбец абсолютные величины полученных разностей, обозначить их как d.

7. Определить по пятому столбцу наибольшую абсолютную величину разности dmax.

8. Для данного числа n по таблице определить или рассчитать критические значения dкр. Если dmax³ dкр, то различия между распределениями достоверны.

Задание

1. Конспект лекции

Список литературы:




Этот критерий, так же как и рассмотренный выше критерий Пирсона, предназначен для сопоставления либо эмпирического распределения с теоретическим, либо двух эмпирических распределений. Критерий lпозволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

В предыдущем критерии сопоставлялись частоты двух распределений по каждому разряду отдельно, здесь же сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов, и т.д., то есть, сопоставляются накопленные к данному разряду частоты. Если различия между распределениями статистически значимы, то в определенный момент разность накопленных частот достигнет критического значения, и тогда следует признать различия статистически достоверными.

Статистические гипотезы формулируем следующим образом:

Н0: Различия между двумя распределениями недостоверны (судя по точке максимально накопленного расхождения между ними).

Н1: Различия между двумя распределениями достоверны (судя по точке максимально накопленного расхождения между ними).

Расчет критерия lприведен в алгоритме 12 в случае сопоставления эмпирического и теоретического распределения и в алгоритме 13 в случае сопоставления двух эмпирических распределений. Оба алгоритма будут рассмотрены ниже.

При использовании критерия Колмогорова – Смирнованужно учитывать следующие ограничения.

1.Выборка должна быть достаточно большой. При сопоставлении двух эмпирических распределений должно быть n1,n2 ³ 50. При сопоставлении эмпирического и теоретического распределений допускается n ³ 5.

2.Разряды должны быть упорядочены по нарастанию (или убыванию) значений признака, то есть, они обязательно должны отражать однонаправленное его изменение.

АЛГОРИТМ 12

Расчет абсолютной величины разности d между эмпирическим и равномерным распределениями.

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2. Подсчитать относительные эмпирические частоты для каждого разряда по формуле: f * эмп= fэмп/n (второй столбец).

3. Подсчитать накопленные относительные частоты S fj * поформуле: S fj * = S f * j-1+ fj * , где S fj * -1относительные частоты, накопленные на предыдущих разрядах (третий столбец).

4. Подсчитать накопленные относительные теоретические частоты для каждого разряда по формуле: S f * Tj= S f * Tj-1+ f * Tj, где S fTj * -1относительные теоретические частоты, накопленные на предыдущих разрядах (четвертый столбец).

5. Вычислить разности между эмпирическими и теоретическими накопленными относительными частотами по каждому разряду (между значениями третьего и четвертого столбцов).

6. Записать в пятый столбец абсолютные величины полученных разностей, обозначить их как d.

7. Определить по пятому столбцу наибольшую абсолютную величину разности dmax.

8. Для данного числа n по таблице определить или рассчитать критические значения dкр. Если dmax³ dкр, то различия между распределениями достоверны.

Критерий согласия Колмогорова или Критерий согласия Колмогорова-Смирнова — статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели. Носит имена математиков Андрея Николаевича Колмогорова и Николая Васильевича Смирнова.

Критерий Колмогорова-Смирнова о проверке гипотезы об однородности двух эмпирических законов распределения является одним из основных и наиболее широко используемых непараметрических критериев, так как достаточно чувствителен к различиям в исследуемых выборках.

Содержание

Статистика

Эмпирическая функция распределения (ЭФР) случайной величины , построенная по выборке )" width="" height="" />
, имеет вид:

F_n(x)=\frac<1></p>
<p>\sum_^n I_<X_i\leqslant x>,\!

где \!" width="" height="" />
указывает, попало ли наблюдение в область :


F_n(x)\!

Статистика критерия для эмпирической функции распределения определяется следующим образом:

D_n=\sup_x |F_n(x)-F(x)|,\!

где — точная верхняя грань множества \!" width="" height="" />
, - предполагаемая модель.

Критерий

Обозначим нулевую гипотезу , как гипотезу о том, что выборка подчиняется распределению )\!" width="" height="" />
. Тогда по теореме Колмогорова для введённой статистики справедливо:


Учтём, что критерий имеет правостороннюю критическую область.

Если достаточно близко к 1, то можно приблизительно рассчитать по формуле:

K_\alpha\approx\sqrt<-\frac<1></p>
<p>\ln\frac>.\!

Асимптотическая мощность критерия равна 1.

Обозначим теперь за нулевую гипотезу гипотезу о том, что две исследуемые выборки подчиняются одному распределению случайной величины )\!" width="" height="" />
.

Теорема Смирнова позволяет использовать данный критерий для проверки двух выборок на однородность.

Читайте также: