Формула полной вероятности формула байеса кратко
Обновлено: 09.05.2024
Подробно теорема Байеса излагается в отдельной статье. Это замечательная работа, но в ней 15 000 слов. В этом же переводе статьи от Kalid Azad кратко объясняется самая суть теоремы.
Разберемся в методе
В статье, на которую дана ссылка в начале этого эссе, разбирается метод диагностики (маммограмма), выявляющий рак груди. Рассмотрим этот метод подробно.
- 1% всех женщин болеют раком груди (и, соответственно, 99% не болеют)
- 80% маммограмм выявляют заболевание, когда оно действительно есть (и, соответственно, 20% не выявляют)
- 9,6% исследований выявляют рак, когда его нет (и, соответственно, 90,4% верно определяют отрицательный результат)
- 1% женщин болеют раком груди
- если у пациентки выявили заболевание, смотрим в первую колонку: есть 80% вероятность того, что метод дал верный результат, и 20% вероятность того, что результат исследования неправильный (ложноотрицательный)
- если у пациентки заболевание не выявили, смотрим на вторую колонку. С вероятностью 9,6% можно сказать, что положительный результат исследования неверен, и с 90,4% вероятностью можно сказать, что пациентка действительно здорова.
Насколько метод точен?
Теперь разберем положительный результат теста. Какова вероятность того, что человек действительно болен: 80%, 90%, 1%?
- Есть положительный результат. Разберем все возможные исходы: полученный результат может быть как истинным положительным, так и ложноположительным.
- Вероятность истинного положительного результата равна: вероятность заболеть, умноженная на вероятность того, что тест действительно выявил заболевание. 1% * 80% = .008
- Вероятность ложноположительного результата равна: вероятность того, что заболевания нет, умноженная на вероятность того, что метод выявил заболевание неверно. 99% * 9.6% = .09504
вероятность события = исходы события / все возможные исходы
Вероятность истинного положительного результата – .008. Вероятность положительного результата — это вероятность истинного положительного исхода + вероятность ложноположительного.
(.008 + 0.09504 = .10304)
Итак, вероятность заболевания при положительном результате исследования рассчитывается так: .008/.10304 = 0.0776. Эта величина составляет около 7.8%.
То есть положительный результат маммограммы значит только то, что вероятность наличия заболевания – 7,8%, а не 80% (последняя величина — это лишь предполагаемая точность метода). Такой результат кажется поначалу непонятным и странным, но нужно учесть: метод дает ложноположительный результат в 9,6% случаев (а это довольно много), поэтому в выборке будет много ложноположительных результатов. Для редкого заболевания большинство положительных результатов будут ложноположительными.
Давайте пробежимся глазами по таблице и попробуем интуитивно ухватить смысл теоремы. Если у нас есть 100 человек, только у одного из них есть заболевание (1%). У этого человека с 80% вероятностью метод даст положительный результат. Из оставшихся 99% у 10% будут положительные результаты, что дает нам, грубо говоря, 10 ложноположительных исходов из 100. Если мы рассмотрим все положительные результаты, то только 1 из 11 будет верным. Таким образом, если получен положительный результат, вероятность заболевания составляет 1/11.
Выше мы посчитали, что эта вероятность равна 7,8%, т.е. число на самом деле ближе к 1/13, однако здесь с помощью простого рассуждения нам удалось найти приблизительную оценку без калькулятора.
Теорема Байеса
- Pr(A|X) = вероятность заболевания (А) при положительном результате (X). Это как раз то, что мы хотим знать: какова вероятность события в случае положительного исхода. В нашем примере она равна 7,8%.
- Pr(X|A) = вероятность положительного результата (X) в случае, когда больной действительно болен (А). В нашем случае это величина истинных положительных – 80%
- Pr(A) = вероятность заболеть (1%)
- Pr(not A) = вероятность не заболеть (99%)
- Pr(X|not A) = вероятность положительного исхода исследования в случае, если заболевания нет. Это величина ложноположительных – 9,6 %.
Pr(X) – это константа нормализации. Она сослужила нам хорошую службу: без нее положительный исход испытаний дал бы нам 80% вероятность события.
Pr(X) – это вероятность любого положительного результата, будет ли это настоящий положительный результат при исследовании больных (1%) или ложноположительный при исследовании здоровых людей (99%).
В нашем примере Pr(X) – довольно большое число, потому что велика вероятность ложноположительных результатов.
Pr(X) создает результат 7,8%, который на первый взгляд кажется противоречащим здравому смыслу.
Смысл теоремы
Мы проводим испытания, чтоб выяснить истинное положение вещей. Если наши испытания совершенны и точны, тогда вероятности испытаний и вероятности событий совпадут. Все положительные результаты будут действительно положительными, а отрицательные — отрицательными. Но мы живем в реальном мире. И в нашем мире испытания дают неверные результаты. Теорема Байеса учитывает искаженные результаты, исправляет ошибки, воссоздает генеральную совокупность и находит вероятность истинного положительного результата.
Спам-фильтр
Теорема Байеса удачно применяется в спам-фильтрах.
- событие А — в письме спам
- результат испытания — содержание в письме определенных слов:
Фильтр спама на основе черного списка обладает недостатками — он часто выдает ложноположительные результаты.
Со временем фильтр тренируется на все большей выборке и обновляет вероятности. Так, продвинутые фильтры, созданные на основе теоремы Байеса, проверяют множество слов подряд и используют их в качестве данных.
Следствием правила умножения и формулы полной вероятности является формула Байеса, называемая также формулой гипотез.
Представим себе следующую ситуацию. До опыта о его услових можно было сделать ряд гипотез (в литературе можно также встретить их обозначение не буквой B, а буквой H), несовместных и образующих полную группу.
Вероятности гипотез до опыта (называемые также априорными вероятностями) заданы и равны
Теперь предположим, что опыт произведён и в его результате появилось событие A .
Как нужно пересмотреть вероятности гипотез с учётом этого факта?
Формула Байеса позволяет найти вероятность каждой из гипотез о том, в результате какого из событий, образующих полную систему, наступило событие A (или как часто говорят, найти апостериорные вероятности).
Поэтому формула Байеса представляет собой отношение произведения вероятности одного из событий системы на условную вероятность этого события относительно соответствующего события системы к полной вероятности наступления события A с учётом всех событий системы.
То есть, по формуле Байеса вероятность, как и в самых простых случаях, вычисляется как отношение "одного ко всем":
Видим, что знаменатель в этой формуле - ничто иное, как полная вероятность события A , а числители для каждого отдельного случая равны первому, второму, и так далее до n-го слагаемому суммы, находящейся в знаменателе.
Формула Байеса может быть также записана в виде
Формула Байеса: примеры решения задач
Пример 1. Имеются три урны; в первой 3 белых шара и 1 чёрный, во второй - 2 белых шара и 3 чёрных, в третьей - три белых шара. Некто подходит наугад к одной из урн и вынимает из неё один шар. Этот шар оказался белым. Найти послеопытные (апостериорные) вероятности того, что этот шар вынут из первой, второй, третьей урны.
- выбрана первая урна;
- выбрана вторая урна;
- выбрана третья урна.
Так как урна выбирается наугад, то априорные вероятности гипотез раны:
В результате опыта появилось событие A - из выбранной урны вынут белый шар.
Условные вероятности события A относительно каждой из гипотез:
Применяя формулу Байеса, находим апостериорные вероятности гипотез:
Пример 2. Пример с теми же лампочками, что и в примере 2. Пусть количество и качество электролампочек, поставляемых в магазины некоторого района, определены условиями примера 2. Купленная лампочка оказалась стандартной. Пользуясь формулой Байеса, найти вероятности гипотез о том, что лампочка была изготовлена на первом заводе, на втором, на третьем.
Решение. Итак, для каждой из гипотез в числителе должно быть произведение вероятности одного из событий системы на условную вероятность этого события относительно соответствующего события системы, а в знаменателе - полная вероятность собыия A .
Вероятность того, что купленная лампочка изготовлена на первом заводе и стандартна:
.
Вероятность того, что купленная лампочка изготовлена на втором заводе и стандартна:
.
Вероятность того, что купленная лампочка изготовлена на третьем заводе и стандартна:
.
Вычисляя по формуле Байеса, получаем:
- вероятность того, что купленная стандартная лампочка изготовлена на первом заводе
;
- вероятность того, что купленная стандартная лампочка изготовлена на втором заводе
;
- вероятность того, что купленная стандартная лампочка изготовлена на третьем заводе
.
Пример 3. До опыта об его условиях можно было сделать четыре гипотезы: , , , с вероятностями, равными, соответственно
В результате опыта появилось событие A , которое невозможно при гипотезах , и достоверно при гипотезах , . Найти апостериорные вероятности гипотез.
Решение. Условные вероятности гипотез:
По формуле Байеса получаем:
Пример 4. Расследуются причины авиационной катастрофы, о которых можно сделать четыре гипотезы: , , , . Согласно статистике вероятности гипотез составляют
Осмотр места катастрофы выявляет, что в её ходе произошло событие A - воспламенение горючего. Условные вероятности события A при гипотезах , , , , согласно той же статистике равны
Найти апостериорные вероятности гипотез.
Решение. По формуле Байеса получаем:
Пример 5. В учреждении три чиновника готовят копии документов. Первый чиновник () обрабатывает 40% всех форм, второй () – 35%, третий () – 25%. У первого чиновника удельный вес ошибок составляет 0,04, у второго – 0,06, у третьего – 0,03. В конце дня, выбрав случайно один из подготовленных документов, руководитель констатировал, что в нём есть ошибка (событие A ). Пользуясь формулой Байеса, выяснить, какова вероятность, что ошибку допустил первый чиновник, второй, третий.
Решение. Обозначим события и их вероятности:
:
:
:
A:
Подробно теорема Байеса излагается в отдельной статье. Это замечательная работа, но в ней 15 000 слов. В этом же переводе статьи от Kalid Azad кратко объясняется самая суть теоремы.
Разберемся в методе
В статье, на которую дана ссылка в начале этого эссе, разбирается метод диагностики (маммограмма), выявляющий рак груди. Рассмотрим этот метод подробно.
- 1% всех женщин болеют раком груди (и, соответственно, 99% не болеют)
- 80% маммограмм выявляют заболевание, когда оно действительно есть (и, соответственно, 20% не выявляют)
- 9,6% исследований выявляют рак, когда его нет (и, соответственно, 90,4% верно определяют отрицательный результат)
- 1% женщин болеют раком груди
- если у пациентки выявили заболевание, смотрим в первую колонку: есть 80% вероятность того, что метод дал верный результат, и 20% вероятность того, что результат исследования неправильный (ложноотрицательный)
- если у пациентки заболевание не выявили, смотрим на вторую колонку. С вероятностью 9,6% можно сказать, что положительный результат исследования неверен, и с 90,4% вероятностью можно сказать, что пациентка действительно здорова.
Насколько метод точен?
Теперь разберем положительный результат теста. Какова вероятность того, что человек действительно болен: 80%, 90%, 1%?
- Есть положительный результат. Разберем все возможные исходы: полученный результат может быть как истинным положительным, так и ложноположительным.
- Вероятность истинного положительного результата равна: вероятность заболеть, умноженная на вероятность того, что тест действительно выявил заболевание. 1% * 80% = .008
- Вероятность ложноположительного результата равна: вероятность того, что заболевания нет, умноженная на вероятность того, что метод выявил заболевание неверно. 99% * 9.6% = .09504
вероятность события = исходы события / все возможные исходы
Вероятность истинного положительного результата – .008. Вероятность положительного результата — это вероятность истинного положительного исхода + вероятность ложноположительного.
(.008 + 0.09504 = .10304)
Итак, вероятность заболевания при положительном результате исследования рассчитывается так: .008/.10304 = 0.0776. Эта величина составляет около 7.8%.
То есть положительный результат маммограммы значит только то, что вероятность наличия заболевания – 7,8%, а не 80% (последняя величина — это лишь предполагаемая точность метода). Такой результат кажется поначалу непонятным и странным, но нужно учесть: метод дает ложноположительный результат в 9,6% случаев (а это довольно много), поэтому в выборке будет много ложноположительных результатов. Для редкого заболевания большинство положительных результатов будут ложноположительными.
Давайте пробежимся глазами по таблице и попробуем интуитивно ухватить смысл теоремы. Если у нас есть 100 человек, только у одного из них есть заболевание (1%). У этого человека с 80% вероятностью метод даст положительный результат. Из оставшихся 99% у 10% будут положительные результаты, что дает нам, грубо говоря, 10 ложноположительных исходов из 100. Если мы рассмотрим все положительные результаты, то только 1 из 11 будет верным. Таким образом, если получен положительный результат, вероятность заболевания составляет 1/11.
Выше мы посчитали, что эта вероятность равна 7,8%, т.е. число на самом деле ближе к 1/13, однако здесь с помощью простого рассуждения нам удалось найти приблизительную оценку без калькулятора.
Теорема Байеса
- Pr(A|X) = вероятность заболевания (А) при положительном результате (X). Это как раз то, что мы хотим знать: какова вероятность события в случае положительного исхода. В нашем примере она равна 7,8%.
- Pr(X|A) = вероятность положительного результата (X) в случае, когда больной действительно болен (А). В нашем случае это величина истинных положительных – 80%
- Pr(A) = вероятность заболеть (1%)
- Pr(not A) = вероятность не заболеть (99%)
- Pr(X|not A) = вероятность положительного исхода исследования в случае, если заболевания нет. Это величина ложноположительных – 9,6 %.
Pr(X) – это константа нормализации. Она сослужила нам хорошую службу: без нее положительный исход испытаний дал бы нам 80% вероятность события.
Pr(X) – это вероятность любого положительного результата, будет ли это настоящий положительный результат при исследовании больных (1%) или ложноположительный при исследовании здоровых людей (99%).
В нашем примере Pr(X) – довольно большое число, потому что велика вероятность ложноположительных результатов.
Pr(X) создает результат 7,8%, который на первый взгляд кажется противоречащим здравому смыслу.
Смысл теоремы
Мы проводим испытания, чтоб выяснить истинное положение вещей. Если наши испытания совершенны и точны, тогда вероятности испытаний и вероятности событий совпадут. Все положительные результаты будут действительно положительными, а отрицательные — отрицательными. Но мы живем в реальном мире. И в нашем мире испытания дают неверные результаты. Теорема Байеса учитывает искаженные результаты, исправляет ошибки, воссоздает генеральную совокупность и находит вероятность истинного положительного результата.
Спам-фильтр
Теорема Байеса удачно применяется в спам-фильтрах.
- событие А — в письме спам
- результат испытания — содержание в письме определенных слов:
Фильтр спама на основе черного списка обладает недостатками — он часто выдает ложноположительные результаты.
Со временем фильтр тренируется на все большей выборке и обновляет вероятности. Так, продвинутые фильтры, созданные на основе теоремы Байеса, проверяют множество слов подряд и используют их в качестве данных.
Чтобы вспомнить о сложении и умножении вероятностей и независимых событиях – см. §39 справочника для 9 класса.
Напомним, что два случайных события A и B называют независимыми, если наступление одного из них не изменяет вероятность наступления другого.
Например: при бросании монеты несколько раз каждый следующий бросок совершенно не зависит от предыдущих.
Два случайных события A и B называют зависимыми , если вероятность одного из них зависит от того, произошло или нет другое событие.
Вероятность события B, определенная при условии, что событие A произошло, называется условной вероятностью и обозначается \(P(B|A)\) или \(P_A(B)\).
Для условных вероятностей справедливы формулы: $$ P(A|B)=\frac
,\ \ P(B|A)=\frac
$$ где \(P(A\wedge B)\) - вероятность совместного появления событий A и B.
Например:
Рассмотрим урну, в которой находится 3 белых и 3 черных шара.
Мы достаем шары, смотрим на их цвет и не возвращаем их на место. События в последовательности становятся зависимыми.
Пусть событие A="в 1й раз достаем черный шар",
Событие B="во 2й раз достаем белый шар"
Событие C="во 2й раз достаем черный шар"
После того, как произошло событие A, в урне остается 3 белых и 2 черных шара.
Тогда условная вероятность для события B при условии, что событие A произошло:
\(P(B|A)=\frac35\)
Аналогично, условная вероятность для события C:
\(P(B|A)=\frac25\)
п.2. Вероятность совместного появления событий
Вероятность совместного появления двух зависимых событий равна произведению вероятности одного из них на условную вероятность второго, вычисленную при условии, что первое событие произошло: $$ P(A\wedge B)=P(B)\cdot P(A|B)=P(A)\cdot P(B|A) $$ Это утверждение также называют теоремой умножения вероятностей .
Например:
Продолжая предыдущий пример, вероятность события \((A\wedge B)\) – 1й раз достали черный шар и 2й раз белый – равна: $$ P(A\wedge B)=P(A)\cdot P(B|A)=\frac12\cdot \frac35=0,3 $$ Также, напомним:
Вероятность совместного появления двух независимых событий равна произведению вероятностей этих событий: $$ P(A\wedge B)=P(A)\cdot P(B) $$
Например:
Пусть в урне 3 белых и 3 черных шара. Мы достаем шары, смотрим на их цвет и возвращаем их на место. В последовательности наших действий все события будут независимыми. Каждый раз, вероятность достать белый или черный шар будет равна 1/2. Поэтому, в этом случае вероятность события \((A\wedge B)\) – 1й раз достали черный шар, а 2й раз белый – равна: $$ P(A\wedge B)=P(A)\cdot P(B)=\frac12\cdot\frac12=0,25 $$
п.3. Формула полной вероятности
Если событие A может произойти только при выполнении одного из событий \(B_1,B_2,…,B_k\), которые образуют полную группу событий, то вероятность события A определяется по формуле полной вероятности : $$ P(A)=P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+. +P(B_k)P(A|B_k)=\sum_^k P(B_i)P(A|B_i) $$
i | Класс | К-во учеников | \(P(B_i)\) | К-во знатоков | \(P(A|B_i)\) | \(P(B_i)\cdot P(A|B_i)\) |
1 | 11A | 35 | 35/100=0,35 | 10 | 10/35=2/7 | 0,1 |
2 | 11Б | 35 | 35/100=0,35 | 7 | 7/35=1/5 | 0,07 |
3 | 11В | 30 | 30/100=0,3 | 10 | 3/30=1/10 | 0,03 |
Всего | 100 | 1 | 20 | × | 0,2 |
Получаем полную вероятность \(P(A)=\sum_^3 P(B_i)\cdot P(A|B_i)=0,2\)
В данном случае ответ можно получить и проще: 20 знатоков на 100 человек дает \(P(A)=0,2\).
п.4. Формула Байеса
По данному выше определению полной вероятности событие A случается, если происходит одно из событий полной группы \(\left\\).
Допустим, что событие A случилось. А какова вероятность, что при этом произошло конкретное событие \(B_1\in\left\\)? Т.е., нас интересует условная вероятность \(P(B_1|A)\).
По теореме об умножении вероятностей: $$ P(A\wedge B_1)=P(B_1)\cdot P(A|B_1)=P(A)\cdot P(B_1|A) $$ Откуда: $$ P(B_1|A)=\frac $$ То же самое справедливо для любого события \(B_p\in\left\\). Предположение о том, что случилось событие \(B_p\), называют гипотезой.
Если событие A может произойти только при выполнении одного из событий полной группы \(\left\\) и событие A случилось, то вероятность гипотезы, что при этом случилось событие \(B_p\in\left\\), определяется формулой Байеса : $$ P(B_p|A)=\frac=\frac^k P(B_i)P(A|B_i)> $$ Вероятность \(P(B_p)\) называют априорной вероятностью .
Вероятность \(P(B_p|A)\) называют апостериорной вероятностью . Случившееся событие A может поменять априорную (предварительную) оценку вероятности события \(B_p\).
п.5. Примеры
Пример 1. Двигатель работает в трех режимах: нормальном (65% времени), форсированном (25% времени) и холостом. Вероятность поломки в каждом из режимов соответственно равна \(p_1=0,1;\ p_2=0,8;\ p_3=0,05\).
а) найдите вероятность поломки двигателя во время работы;
б) двигатель сломался. Какова вероятность, что он в этот момент работал в форсированном режиме?
i | Режим | Часть времени \(P(B_i)\) | Вероятность поломки \(P(A|B_i)\) | \(P(B_i)\cdot P(A|B_i)\) |
1 | Нормальный | 0,65 | 0,1 | 0,065 |
2 | Форсированный | 0,25 | 0,8 | 0,2 |
3 | Холостой | 0,1 | 0,05 | 0,005 |
Всего | 1 | × | 0,27 |
Ответ: a) 0,27; б) \(\frac\approx 0,741\)
Пример 2. В состязании лучников участвуют три стрелка. Вероятность попадания в мишень для каждого из них равна 0,3; 0,5 и 0,7. Один из стрелков стреляет и не попадает. Какова вероятность, что это был:
а) первый стрелок;
б) второй стрелок;
в) третий стрелок;
i | \(P(B_i)\) | Вероятность промаха \(P(A|B_i)\) | \(P(B_i)\cdot P(A|B_i)\) |
1 | \(\frac13\) | 1-0,3=0,7 | \(\frac13\cdot 0,7=\frac\) |
2 | \(\frac13\) | 1-0,5=0,5 | \(\frac13\cdot 0,5=\frac\) |
3 | \(\frac13\) | 1-0,7=0,3 | \(\frac13\cdot 0,3=\frac\) |
∑ | 1 | × | 0,5 |
Пример 3. Три фрилансера на площадке выполняют заказы в отношении по количеству 3:4:3. Доля успешно выполненных заказов для каждого из них составляет 98%, 95% и 90%.
а) найдите вероятность успешного выполнения заказа на площадке;
б) найдите вероятность неуспеха на площадке;
в) кто из фрилансеров, вероятнее всего, виноват в неуспешной работе?
i | \(P(B_i)\) | Вероятность успеха \(P(A|B_i)\) | \(P(B_i)\cdot P(A|B_i)\) |
1 | 0,3 | 0,98 | 0,294 |
2 | 0,4 | 0,95 | 0,38 |
3 | 0,3 | 0,9 | 0,27 |
∑ | 1 | × | 0,944 |
Вероятность успешного выполнения (полная вероятность): $$ P(A)=\sum_^3 P(B_i)\cdot P(A|B_i)=0,944 $$ б) Вероятность неуспеха (противоположное событие): $$ P(\overline)=1-P(A)=1-0,944=0,056 $$ в) Составим таблицу неуспешной деятельности:
Ответ: а) 0,944; б) 0,056; в) третий фрилансер.
Пример 4. Докажите, что если полная вероятность события A равна $$ P(A)=\sum_^k P(B_i)\cdot P(A|B_i) $$ то вероятность противоположного события равна \(P(\overline)=1-P(A)\).
Читайте также: