Лемма неймана пирсона реферат

Обновлено: 03.07.2024

Может ли кто-нибудь объяснить мне лемму в простых словах? Что это заявляет?

Выраженный словами, я понял, что два критерия определяют

(1) P [отклонение нулевой гипотезы | нулевая гипотеза верна] = уровень значимости

Тогда тест является самым мощным тестом из простой гипотезы .

  • Почему это только для простых гипотез? Разве это не может быть сложная гипотеза? Правильно ли мое объяснение словами?

Я думаю, вы хорошо поняли лемму.

Почему это не работает для составной альтернативы? Как вы можете видеть из отношения правдоподобия, нам нужно подключить параметр (и) для альтернативной гипотезы. Если альтернатива является составной, какой параметр вы собираетесь подключить?

Недавно я написал запись в блоге с вопросом, в которой лемма Неймана Пирсона была написана простыми словами и приводится пример. Я нашел пример открытия глаза в смысле четкой интуиции по лемме. Как и в случае с вероятностью, она основана на функции массовой дискретной вероятности, поэтому ее легче выполнить, чем при работе с PDF-файлами. Кроме того, примите во внимание, что я определяю отношение правдоподобия как вероятность альтернативной гипотезы против нулевой гипотезы, вопреки вашему утверждению леммы. Объяснение то же самое, но скорее чем меньше, чем сейчас больше. Я надеюсь, что это помогает.

Не на 100% математически совершенном языке, что нам говорит Нейман-Пирсон, является то, что самый мощный тест, который можно придумать для проверки данной гипотезы на определенном уровне значимости, дается областью отклонения, сделанной всеми возможными наблюдениями, полученными из этого теста с отношение правдоподобия выше определенного порога . вахххх! Кто сказал, что это было легко!

Сохраняйте спокойствие и деконструируйте лемму:

  1. Гипотеза . В статистике всегда работает с двумя гипотезами, что статистический тест должен отклонять или не отклонять. Существует нулевая гипотеза, которая не будет отвергнута, пока выборочные доказательства против нее не станут достаточно убедительными. Существует также альтернативная гипотеза, которую мы примем, если нулевое значение окажется ложным.
  2. Мощность теста (он же чувствительность) говорит нам, сколько раз мы будем правильно отвергать нулевую гипотезу, когда она ошибочна. Нам нужны мощные тесты, поэтому большую часть времени мы отвергаем нулевую гипотезу, мы правы!
  3. Уровень значимости теста (он же уровень ложных срабатываний) говорит нам, сколько раз мы будем ошибочно отвергать нулевую гипотезу, когда она верна. Мы хотим небольшой уровень значимости, поэтому в большинстве случаев мы отвергаем нулевую гипотезу, мы не ошибаемся!
  4. Область отклонения , учитывая все возможные результаты теста, область отклонения включает в себя те результаты, которые заставят нас отвергнуть нулевую гипотезу в пользу ее альтернативной.
  5. Вероятность - это вероятность увидеть наблюдаемый результат теста, учитывая, что нулевая гипотеза (Вероятность нулевой гипотезы) или альтернативная (Вероятность альтернативной гипотезы) были верными.
  6. Отношение правдоподобия - это отношение вероятности альтернативной гипотезы, деленное на вероятность нулевой гипотезы. Если результаты теста очень ожидаемые, если нулевая гипотеза верна по сравнению с альтернативной, отношение правдоподобия должно быть небольшим.

Достаточно определений! (хотя, если вы внимательно посмотрите на них, вы поймете, что они очень проницательны!). Давайте перейдем к тому, что говорят нам Нейман и Пирсон: если вы хотите провести максимально возможный статистический тест с точки зрения его мощности, просто определите область отклонения, включив результаты теста, которые имеют наивысший коэффициент вероятности, и продолжайте добавлять новые тесты. результаты до тех пор, пока вы не достигнете определенного значения для количества раз, когда ваш тест будет отклонять нулевую гипотезу, когда она верна (уровень значимости).

Давайте посмотрим на пример, где, надеюсь, все сойдется. Пример основан на книге, упомянутой выше. Это полностью сделано мной, поэтому его не следует рассматривать как отражающее какую-либо реальность или личное мнение.

Представьте, что кто-то хочет определить, выступает ли кто-то за установление иммиграционных квот (нулевая гипотеза) или нет (альтернативная гипотеза), спрашивая свои чувства по отношению к Европейскому союзу.

Представьте, что мы знали фактическое распределение вероятностей для обоих типов людей относительно ответа на наш вопрос:

enter image description here

Давайте представим, что мы готовы принять ложноположительную ошибку в 30%, то есть в 30% случаев мы отвергнем нулевую гипотезу и предположим, что опрошенный человек против квот, когда он / она действительно для них. Как бы мы построили тест?

Это ситуация, которую имеют все статистические тесты. Там нет ничего такого, как бесплатный обед даже в статистике! Если вы хотите увеличить силу своего теста, вы делаете это за счет повышения уровня значимости. Или, проще говоря: если вы хотите лучше классифицировать хороших парней, вы сделаете это за счет того, что плохие парни будут хорошо выглядеть!

Кто здесь помог? Соотношение правдоподобия Неймана и Человека замечательная идея! Принимая каждый раз ответ с наивысшим отношением правдоподобия, мы смогли включить в новый тест как можно большую мощность (большой числитель), сохраняя при этом значимость (маленький знаменатель)!

Лемма Неймана—Пирсона
Лемма Неймана—Пирсона
Лемма Неймана—Пирсона
Лемма Неймана—Пирсона
Лемма Неймана—Пирсона
Лемма Неймана—Пирсона
Лемма Неймана—Пирсона
Это изображение имеет пустой атрибут alt; его имя файла - image-10-1.jpg

Рассмотрим другой частный случай: набор SB такой же, Но Po (* 0, предположим, что m является целым числом Числовое значение, то есть набор вероятностей Po (* i), * = 1. •••• N — это Соответствующие номера. Преобразуйте эту модель и замените каждую элемент x> 8B на m, элемент x (A), … xi (mi) и положить = 1 миля i ~ l H), Po (, (/)) — = b, -Pi () / «/./= 1 миля. I = l .-. ‘V. Очевидно, исходная статистическая модель взята из трансформатора. Преобразование путем добавления и объединения групп элементов Соответствующая вероятность.

Где .V — некоторая точка D; i = l, …, N и b Незначительная ошибка в уравнении N. A6) От А5) и А6) A7) Использование разобранной разобранной модели с аналогичной вероятностью Возможно, тот же результат с возможностью для Po Ва построен из зоны А и имеет самый высокий вероятный процент Вероятность / i (x,) // o (x,), x, eE, -. Лемма 1 (Неймана а — Р и р, о и а). Для статистики Модель (8B, A, A! > A8) (Где Li (x) — вероятность меры P, а «= 0, 1) — максимум Мощность между всеми областями W одинакового или меньшего размера: (P () A9) где B0)

Предполагая, что носитель плотности f0 (x) конечен, сломайте его Конечное число областей A /, i = 1, …, N, с объемом | D / | = b // o (x /), A5) Людмила Фирмаль

Выполните доказательство непрерывной модели. Пожалуйста, дайте мне E)) φ (x) и φ * (x) являются важными функциями W и W * соответственно. Думаю, функция (Φ * (x) —

0, а мало? G V и т. Д. fi (x) -kfo (x) 0. Следовательно, х ^. $ B OV, интегрировать функция (Φ * (x) -φ (x)) (Mx) — * Mx))> 0.

Итак, на практике эта функция равна нулю Почти все? EV как мера Лебега. Однако μ (x) -> 0 (x)> 0 на S8QV, так что φ * (x) = φ (x) почти все E? Так против почти всех хей? | Критерий W *, определенный в A8), называется критерием Вероятность отношений. Запомни это с продуманной статистикой Статистическая модель статистики Li (x) / L0 (x) дает минимум Достаточное разложение (подробнее см. §6§15, §3§16) Статистика критерия W * является наименьшей функцией Достаточно статистики.

Если вам потребуется заказать статистику вы всегда можете написать мне в whatsapp.

Помощь студентам в учёбе
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal

Образовательный сайт для студентов и школьников

© Фирмаль Людмила Анатольевна — официальный сайт преподавателя математического факультета Дальневосточного государственного физико-технического института

Класс распределений будет называться простым, если он содержит ровно одно распределение. В противном случае он будет называться сложным. Проблема проверки гипотезы полностью описывается соотношениями (4) и (5), если класс К — простой. Если класс также простой, то проблема может быть решена точно. Пусть гипотезе соответствует распределение а гипотезе К — распределение Допустим на время, что эти распределения дискретны, и обозначим для Если ограничиться нерандомизированными критериями, то оптимальный критерий соответствует критической области для которой

Нетрудно понять, какие именно точки должны быть включены в Выбранные точки должны иметь суммарную вероятность, не превосходящую а, в одном случае, и вероятность возможно большую — в другом. Подобные задачи часто возникают и в иной обстановке. Так, покупатель с ограниченными средствами, желающий приобрести как можно больше необходимых ему предметов, будет руководствоваться их количеством на доллар. Лицо, желающее как можно быстрее преодолеть некоторое расстояние, должно выбирать скорейший способ передвижения, т. е. такой, при котором число миль в час оказывается максимальным. Аналогично и в нашей проблеме, наиболее ценными являются точки х с большими значениями:

Точки, следовательно, упорядочиваются соответственно величине этого отношения и затем в включают максимальное число их, согласующееся с требованием (6). Формально это означает, что

есть множество тех точек х, для которых где с определяется условием

Теорема 1. Пусть распределения вероятностей, обладающие плотностями соответственно, по отношению к некоторой мере

(I) Существование. Для проверки при конкурирующей гипотезе найдется критерий и константа такие, что

(II) Достаточное условие для критерия наибольшей мощности. Если критерий удовлетворяет требованиям (7) и (8) при некотором то он является наиболее мощным критерием уровня а для проверки распределения при конкурирующем

(III) Необходимое условие для критерия наибольшей мощности. Если наиболее мощный критерий уровня а для проверки распределения при конкурирующем то при некотором он удовлетворяет (8) почти всюду по мере Он также удовлетворяет (7), кроме случая, когда существует критерий размера и мощности 1.

Доказательство. Для теорема очевидным образом верна: достаточно принять в полагая произведение равным 0. Поэтому мы предположим в дальнейшем, что

(I) Обозначим При вычислении -вероятностей достаточно рассматривать множества, где Поэтому равно вероятности того, что случайная величина превосходит с. Таким образом, является функцией распределения и не возрастает и непрерывна справа,

При данном определим из соотношений и введем критерий полагая

Здесь второе равенство имеет смысл всегда, кроме случая но в этом последнем случае следовательно определена почти всюду. Размер равен

Таким образом, величина участвующая в формулировке теоремы, может быть выбрана равной

Интересно отметить, что величина определяется, по существу, единственным способом. Единственное исключение — это случай, когда для целого интервала значений с. Если такой интервал, причем

То есть множества, соответствующие различным значениям с, отличаются друг от друга точками, в совокупности имеющими нулевую вероятность при обоих распределениях, и потому вообще могут быть исключены из выборочного пространства.

(II) Предположим, что критерий удовлетворяет (7) и (8). Пусть какой-либо другой критерий с . Обозначим множества точек выборочного пространства, в которых соответственно. Если то Аналогично Для всех Следовательно,

и для разности мощностей получаем

что и требовалось доказать.

(III) Предположим, что является наиболее мощным критерием уровня а для проверки гипотезы при альтернативе удовлетворяет условиям (7) и (8). Пусть обозначает пересечение множества на котором и множества Допустим, что Так как произведение положительно на то

т. е. оказывается при альтернативе более мощным, чем Мы приходим к противоречию. Следовательно, что и требовалось доказать.

Доказательство части (III) показывает, что наиболее мощный критерий определяется соотношениями (7) и (8) однозначно всюду, кроме, быть может, точек, для которых На этом множестве можно определить произвольным образом, лишь бы размер критерия был равен а. Действительно, мы показали, что на этом пограничном множестве можно выбрать постоянным. В тривиальном случае, когда существует критерий мощности 1, константа в (8) равна 0, и мы будем принимать во всех точках, где хотя, быть может, размер критерия окажется меньше а.

Из этих замечаний вытекает, что наиболее мощный критерий определяется однозначно из соотношений (7) и (8) (с точностью до множеств нулевой меры) каждый раз, когда множество имеет -меру, равную . Очевидно, что этот единственный критерий будет нерандомизированным. Вообще, мы видели, что рандомизация может потребоваться только на пограничном множестве и только в случае необходимости сделать размер критерия в точности равным а. На практике предпочитают в таком случае заменить уровень значимости таким, который не требует рандомизации. В случае, когда существует критерий мощности 1, соотношения (7) и (8) по-прежнему определяют наиболее мощный критерий, но он может не быть единственным, поскольку может существовать другой наиболее

мощный критерий, удовлетворяющий (7) и (8) при некотором

Следствие 1. Пусть обозначает мощность наиболее мощного критерия уровня а для проверки гипотезы при конкурирующей Тогда за исключением случая

Доказательство. Так как критерий уровня а, определяемый формулой имеет мощность а, то ясно, что а Если то критерий оказывается наиболее мощным, и по теореме 1 (III) он должен удовлетворять (8).

Тогда почти всюду по мере следовательно

Альтернативный метод доказательства теоремы настоящего раздела основан на следующем геометрическом представлении проблемы проверки простой гипотезы при простой альтернативе. Пусть обозначает множество всех точек обладающих свойством: существует критерий для которого

Это множество выпукло, содержит точки (0,0) и (1,1) и центрально симметрично по отношению к точке (т. е. вместе с любой точкой это множестзо содержит также точку (рис. 3,а). Кроме того, множество замкнуто. [Это следует из теоремы о слабой компактности множества критических функций, см. теорему 3 в добавлении; аргументация совпадает с используемой в доказательстве теоремы

При каждом критерии уровня изображаются точками, абсциссы которых Наиболее мощный из этих критериев (а он существует, так как замкнуто) соответствует точке на верхней границе имеющей абсциссу Эта точка будет

единственной, соответствующей наиболее мощному критерию уровня за исключением случая, когда в существует точка

Рассмотрим в качестве примера геометрическое доказательство следствия 1. Предположим, что для некоторого мощность наиболее мощного критерия уровня равна Тогда из выпуклости следует, что включение влечет а из симметрии вытекает, что совпадает с отрезком, соединяющим точки (0,0) и (1,1). Это означает, что для всех и потому -почти всюду, что и требовалось доказать.

Опирающееся на эти идеи доказательство теоремы 1 содержится в более общем доказательстве теоремы 5.

Во многих приложениях возникают задачи проверки многих гипотез. Эту задачу можно описать следующим образом.

Пусть задано конечное разбиение параметрического множества  = 1  2  .  m. Мы проверяем, какому из подмножеств j принадлежит неизвестный параметр . Если проверка покажет, что  k, решение интерпретируется как принятие гипотезы Hk :  k > и отвержение остальных т — 1 гипотез Hj :  j >, j=1,…, m, j k. Гипотезу Hk называют основной, а гипотезы Hj : j k — альтернативными или конкурирующими.


Рассмотрим теперь задачу проверки двух простых гипотез— основной Н и альтернативной .

Принцип Неймана-Пирсона построения критериев для проверки двух простых гипотез основан на понятиях ошибок.

Критерием будем называть любую процедуру (правило) проверки гипотез. Критерии делятся на параметрические и непараметрические. Параметрические критерии строятся на основе параметров выборочной совокупности и представляют функции этих параметров, а непараметрические критерии — функции от выборочных значений. Параметрические критерии применяются только в том случае, когда генеральная совокупность нормальная, и при условии, что генеральные параметры сравниваемых групп равны между собой, т.е. 1 = 2 , 1 = 2

Пусть пространство выборок X, и предположим, что разбито на непересекающиеся множестваS и D, т.е. =SD, SD = . Задаем некоторое достаточно малое число > 0, которое называется уровнем значимости. Допустим, что процедура Т (обозначение) проверки гипотез заключается в том, что еслиXS, то гипотезу Н отвергаем, если же XD, то гипотезу Н не отвергаем (принимаем). Множество S называется критической областью, а Dдоверительной областью.


Любой критерий Т в случае проверки двух простых гипотез можно характеризовать числовой функциейТ(Х) = Р(ХS), которая называется критической функцией критерия Т. Тогда, если ХS, то Т(Х) = 1 и гипотеза, Н отвергается, если же ХD, Т(Х) == 0 и гипотеза Н не отвергается (принимается).

При проверке гипотез возможны следующие ошибки.

Определение 1. Ошибка I (первого) родаэто ошибка состоящая в том, что мы отвергаем гипотезу, которая верна.


Вероятность ошибки I рода Р(ХS/H) = (Т) — называется значимостью критерия T. Для любого критерия Т должно выполняться (Т) ΄ ) для любого критерия Т ΄ из этого класса, Т ΄ Kε.

Рассмотрим гипотезу Н: Х = 1, Х2, . Хn) – выборка из семейства распределений pθ(t)> против альтернативы :Х = 1, Х2, . Хn) – выборка из семейства распределений pθ(t)>.

Обозначим функции правдоподобия

f(θ1)=; f(θ2)=.


Лемма Неймана-Пирсона. Для любого ε, ε[0,1] – наиболее мощный критерий уровня ε существует и совпадает с критерием отношения правдоподобия:

Если с, то принимаем;

Если = с, то с вероятностью1-p принимаем H, c вероятностью р принимаем .

При этом с и р определяется из уравнения ε(Т)= ε или

Р( 0— уровень значимости, а (Т) = Р(Т(Х) = 1/H), и нам надо построить критерийТ. Используя ЦПТ (см. 2.7.3.) мы получим

поскольку EXi, = 1/2, DXi = 1/4, i = 1,2, . n.


Предположим, чтоР(|| 3 / 9 3 4 5 6 7 8 9 > Следующая > >>

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Читайте также: