Верите ли вы в прогноз погоды, эффективность лекарств и достоверность анализов, в надежность пешеходных мостов? И если верите - то как сильно?
Чаще всего мы не задумываемся, насколько вероятно наступление какого-нибудь события; насколько точен может быть прогноз и как сильно ошибаться анализ. В лучшем случае большинство из нас обращается к априорной информации: если указано, что вероятность ошибки 1%, то так оно и есть. Но, к сожалению, интуитивные рассуждения часто идут вразрез с теорией вероятности. Сегодня хочу поговорить об одном из таких парадоксальных примеров - теореме Байеса.
Математическая запись ее довольно краткая:
Тем, кто забыл или не знал обозначения, напомню:
P - это вероятность того, что в скобочках,
B - убеждение, которое мы проверяем,
E - свидетельства.
P(B) - вероятность, что B - истинно,
P(E) - вероятность, что E - истинно,
P(B|E) - вероятность, что B - истинно в случае истинности E,
P(E|B) - вероятность того, что истинно E в случае истинности B.
Формула выглядит проще пояснений, но и в них разобраться можно. Результаты эта простая теорема Байеса выдает потрясающие! Рассмотрим несколько надуманный, но очень популярный пример.
Врач дает пациенту направление на анализ редкой болезни (болезнь эта присуща 1% людей). При этом анализ, который будут делать, с вероятностью в 1% может ошибаться в обе стороны (это означает, что 99 из 100 здоровых людей получат отрицательный результат анализа, а у 99 из 100 больных болезнь будет найдена). И вот пациент получает результат анализа - и тот положительный. С какой вероятностью пациент действительно болен?
Частый ответ: 99% - достоверность анализа. Чуть менее частый - 98,01% (0,99 * 0,99). Вариант ответа в 50% называют лишь в шутку: мол, как в анекдоте про динозавра, либо встречу, либо нет. На самым деле именно этот ответ является верным, хотя и по другим причинам.
Для начала попробуем изобразить все на картинке.
Круги здесь обозначают людей: 100 человек. По статистике один из них болен - его мы отметили красным цветом. И один человек из сотни получает ложное срабатывание анализа - его мы отметили желтым цветом. Получается, что анализ выдает положительный результат двум людям из ста. И если пациент получает положительный результат, то он обозначен либо желтым (ложное срабатывание), либо красным (болезнь) кругом. И так, каковы шансы оказаться красным?:) 1/2 - или 50%.
Проверим рисунок математикой. Для этого воспользуемся теоремой Байеса и подставим числа в формулу.
P(B) =0,01 = 1% - это вероятность того, что пациент болен, без привязки к результатам анализа.
P(E|B) = 0,99=99% - это вероятность того, что пациент болен и анализ это распознает.
P(E) - это вероятность получить положительный результат без привязки к тому, болен пациент или нет. Т.е. сюда входят и положительные ложные, и положительные истинные срабатывания анализа. Посчитаем сначала вероятность того, что пациент здоров, а анализ ошибается. Она считается довольно просто: количество ложных срабатываний (1%) умножаем на процент людей, этой болезнью (99%). Получаем, что Вероятность ложного положительного срабатывания равна 0,01*0,99= 0,0099. Вероятность истинных положительных срабатываний считаем схожим образом: точность теста 0,99 умножаем на количество действительно больных людей 0,01. Получаем те же самые 0,0099. Получается, что положительный результат будет получен с вероятностью 0,0099 + 0,0099 = 0,0198. Итак, P(E) = 0,0198
Подставляя все это в формулу, получаем:
0,01 * 0,99 / 0,0198 = 0,5. Вероятность равна 0,5 - или 50%. Как-то контринтуитивно, да?
А что, если болезнь будет более редкой? Точность анализа оставим прежней - 99%, а вот сама болезнь будет присуща 0,1% людей. Подставим новые значения в теорему Байеса.
P(B) = 0,001 = 0,1%
P(E|B) = 0,99 = 99%
P(E) снова надо учитывать вероятность ошибки. Пациент здоров, а анализ ошибается: 0,999*0,01 = 0,00999. Пациент болен, и анализ ему об этом сказал: 0,99 * 0,001 = 0,000999
Суммируем и получаем P(E) = 0,01098
И подставляем все в формулу:
0,001 * 0,99 / 0,01098 = 0,0901639
Получается, что вероятность того, что пациент болен, всего 9%, даже если анализ выдал положительный результат!
Рассмотрим пример с такой низкой вероятностью на картинке. Перед нами группа из тысячи человек - их по-прежнему обозначают круги.
Вероятность того, что человек болен, равна 0,1%. Значит, 1 человек из группы, скорее всего, будет болен: его мы отметили красным цветом.
Анализ, скорее всего, выдаст этому человеку положительный результат. Но из оставшихся 999 человек 1% получат ложное положительное срабатывание анализа - это 10 людей (округленно, конечно же). Их мы отметили желтым.
Получается, что если пациент получил положительный результат анализа и вероятность быть больным одинакова для всех, то этот пациент входит в группу из 11 человек.
А в группе этой болен только один! И шанс пациента действительно быть больным = 1 / 11 = 9%.
Как же быть с такими необычными результатами? А все довольно просто: надо сделать еще один анализ, только теперь учесть результаты предыдущего эксперимента. И так - до тех пор, пока достоверность результатов нас не удовлетворит.
Конечно же, пример выглядит довольно отвлеченным от реальности: мы редко смотрим на статистику заболеваемости, да и достоверность анализов обычному пациенту узнать не так-то просто. Но даже если цифры есть у нас на руках, то однозначно верить теореме Байеса в таких случаях не стоит: врачи, как правило, направляют на анализы не всех подряд, поэтому полностью случайными все процессы назвать нельзя, достоверность истинного положительного срабатывания будет другой.
Простой пример: сосед-алкоголик просит у вас взаймы. Если вы даете ему взаймы первый раз, то оцениваете вероятность возврата как довольно высокую - допустим, 90% (знаете, что есть соседи, которым он должен уже давно). И дальше, если вы приняли решение его кредитовать, вы можете пересчитывать свои шансы вернуть свои деньги и кредитовать соседа вновь.
Байесов подход активно применяется, например, в оценке кредитных или инвестиционных рисков, в спам-фильтрах - вообще, в расчете вероятностей из самых разных областей. При этом его часто считают противоречащим интуиции, т.к вычисления часто противоречат с самым простым для человека ответом, и надо включать мозг. Но ученые отмечают, что и животные умеют применять теорему Байеса значит, сможем и мы, люди.
Сам Байес - автор теоремы - был не только математиком, но и священником, даже формулу в привычном виде он не выводил. И теорему Байеса можно использовать как вопрос веры во что либо. Сам Байес обращал внимание на постоянный пересмотр “доверия” на основе полученных фактов и наблюдений. Чем больше информации мы получаем - тем точнее наши представления о мире, если информацию эту правильно использовать.
Открыл свою теорему Байес на основании мысленного эксперимента. В эксперименте он сидел спиной к квадратному и ровному столу и просил ассистента бросать на этот стол шар - т.е. Байес не видел, куда шар падает. Получается, что шар мог приземлиться в любой точке стола, а Байесу надо было узнать, где мяч. Для этого он просил ассистента бросить еще один шар и сказать, где тот приземлился: справа, слева, спереди или сзади предыдущего. Байес бы это записывал, а потом просил ассистента бросить шар снова. И так - много раз.
Источник фото. Шары, конечно же были другими (они вообще были воображаемыми).
При таком способе Байес мог бы постоянно обновлять свое представление о месте приземления первого шара. Разумеется, он никогда бы не смог быть полностью уверенным в своих предположениях, но с каждым новым броском информация бы уточнялась. Получается, что мы не можем идеально знать что-либо, и наши представления об окружающем мире - это лишь вывод из той порции данных, которую нам удалось обработать.
Байес не опубликовал свою теорему, она была напечатана спустя два года после его смерти, когда родственники Байеса попросили Ричарда Прайса посмотреть записи на предмет чего-нибудь полезного для публикации. После того, как Прайс нашел и отредактировал записи, работа Байеса была прочитана в Британском Королевском обществе. Но почему-то идеи ее не предавались публичной огласке - и французскому математику и физику Лапласу “пришлось” переоткрывать теорему Байеса снова, но уже в виде привычной нам формулы.
Легко заметить, что теорема Байеса не допускает вероятности чего-либо в 100%: она становится просто бессмысленной. Отличие веры от науки как раз в том, что всегда есть вероятность, что научная теория может ошибаться, с помощью теоремы Байеса и серии экспериментов вероятность эту можно уменьшить или увеличить. В вопросах веры нет места для ошибки - и наука там не работает.
@vovochkin, Поздравляю!
Ваш пост был упомянут в моем хит-параде в следующей категории:
@vovochkin Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:
Награда за количество голосов
Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь
Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом
стоп
Первое, что сделал придя сегодня на работу, распечатал ваш пост, чтобы не спеша почитать вечером в парке. Спасибо за отличную работу!
Ваш пост поддержали следующие Инвесторы Сообщества "Добрый кит":
chiliec, polyideic, fetta, archibald116, oleg257, dikaniovs, dimarss, forbon21, vadbars, nefer, chika25, varvar, olga-olga, romapush, gogo.tattoo, yudina-cat, osincevata, boltyn, kvg, oksana0407, i-findirector, felicita, anomalywolf, brika, kertar, tannedd, ifingramota, ssleeperr, vealis, student61, skiexpert, astrofilosof, wedge, ksantoprotein
Поэтому я тоже проголосовал за него!
Узнать подробности о сообществе можно тут:
Разрешите представиться - Кит Добрый
Правила
Инструкция по внесению Инвестиционного взноса
Вы тоже можете стать Инвестором и поддержать проект!!!
Если Вы хотите отказаться от поддержки Доброго Кита, то ответьте на этот комментарий командой "!нехочу"
аж зачитался и залип, забыв про свою работу ) так держать
Спасибо!:)
@vovochkin Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:
Награда за Количество комментариев
Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь
Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом
стоп
Спасибо, интересный пост!
Спасибо, я старался:)
@vovochkin, как это "нет места для ошибки"? Покажите мне верующего, который бы не сомневался в своей религии? Вообще, между верующими людьми и атеистами разница исчезающе мала. Верующий - атеист по отношению ко всем религиям кроме своей (а их - тыщщи), а самый махровый атеист (материалист, сциентист - как угодно) 99 % всего что он знает - принимает на веру, т.к. проверить всё не хватит времени жизни.
Я не поднимаю разницу между религией и атеизмом, я про разницу между религией и наукой. Религия основывается на вере, а наука - на доказательствах. Даже если человек, верящий в теорию тяготения, не проводил всех измерений, то вера его основывается на доказательной базе, подтвержденной другими людьми. И вера в эту теорию может быть поколеблена вполне конкретными фактами - тогда ее место займут другие теории. В случае религии невозможно сказать, что же должно произойти, чтобы человек перестал верить. Но это уже чуть-чуть другая история.
Отдельно отмечу, что верующий человек может заниматься наукой, главное - не смешивать эти 2 абсолютно разных понятия:)
так вроде никто и не смешивает. Поэтому, они даже называются по- разному. Может, в каких-то экзотических сектах, где любят порассуждать о "духовной науке" или "энергоинформационных воздействиях". Вера тоже может быть поколеблена - можно даже договор о фальсификации с верующим составить: что должно случиться, чтобы он отверг свою веру. Например, если после смерти христианин узревает восседающим на облаке не Христа, а Магомета или Будду - это повод...
В белых пятнах науки живут суеверия. А религия - это нечто из другой сферы, с наукой никак не пересекающейся вообще, ни реально, ни потенциально.
@vvvolf, категорически согласен!)
Если не смешивают - все отлично, проблем нет! Если договор получится составить - вообще замечательно, религию заменим наукой:)
Я как раз про "энергоинформационные воздействия" и все в таком духе - о лженауке, в общем.
Заменить не получится по ряду онтологических причин. Религия обычно живёт в "белых пятнах" науки, а они будут всегда.
Не хочу никого обижать, но почему скачет оформление:
Вы уж определитесь доли или проценты.
Спасибо, никаких обид:)
Вроде как переход с математической вероятности (0,01) в проценты (1%) довольно понятен. Да и в тексте, мне казалось, не запутаешься: если знак процента есть - то работаем с процентами:)
Но для корректности добавил перевод из процентов в вероятность.