home | login | register | DMCA | contacts | help | donate |      

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я


my bookshelf | genres | recommend | rating of books | rating of authors | reviews | new | форум | collections | читалки | авторам | add



Теорема Байеса

Теперь мы можем распространить вероятность гипотезы h на данные е, напрямую зависящую от предварительной вероятности и предсказательной силы, которыми обладает h, а также находящуюся в обратной зависимости от предварительной вероятности, которой обладает е, – и облечь всё это в символическую форму. Пусть к – это наше фоновое знание об устройстве мира, е – это явления, которые нужно объяснить, и другие релевантные наблюдаемые данные, h – наша гипотеза, a P(h e&k) – это функция предварительной вероятности, которой обладает h, P(h k) и ее объяснительной силы по отношению к е. Последняя возрастает вместе с предсказательной силой, которой обладает h, P(e h&k), и снижается вместе с предварительной вероятностью, которой обладает е, Р(е k). P(e h&k) – это мера вероятности того, что наблюдаемый феномен е должен возникнуть, если гипотеза h верна (при нашем заданном фоновом знании k). Таким образом, следует ожидать, что чем больше h будет повышать вероятность е, тем больше будет отношение P(e h&k) к Р(е k). Р(е k) определяет предварительную вероятность, которой обладает е, то есть насколько вероятно возникновение е независимо от h, лишь при заданном k к. Очевидно, что чем больше данных мы имеем, чем более разнообразными и в других отношениях необъяснимыми данными мы располагаем, тем ниже (относительно P(e h&k) будет Р(е к) и, опять же, тем выше будет отношение P(e h&k) к Р(е к).

Всё это проясняется основной теоремой теории подтверждения – теоремой Байеса71, которая выглядит следующим образом:

P(h e&k) ­ P(e h&k) P(h k) " Р(е k)

Эта теорема напрямую следует из аксиом, на которых построена математическая теория вероятности, поскольку их истинность покоится на независимых основаниях72. Но обращаясь к этой теореме в дальнейшем, я буду апеллировать главным образом не к этим основаниям, а больше к тем, которые были изложены в этой главе (хотя конкретный способ, с помощью которого P(h e&k) повышается при P(h k) и P(e h&k), но понижается при Р(е k), не зависит от чего-либо, о чем я говорил до сих пор, но должен зависеть от самого объекта).

P(h k), предварительная вероятность, которой обладает h, в нормальном случае зависит, как мы уже поняли, как от внутренней простоты h (и ее ограниченного диапазона), так и от того, насколько хорошо h согласуется с нашим общим фоновым знанием о мире, которое содержится в к. Однако, как мы увидели в 1 главе, любое распределение данных между е и k будет совершенно произвольным. Обычно удобнее всего рассматривать самую последнюю наблюдаемую часть данных е и остальное k, но иногда удобно допустить, что е – это все наблюдаемые данные, а k – просто «тавтологические данные». В последнем случае предварительная вероятность P(h k) – это то, что я буду называть «внутренней (intrinsic) вероятностью» гипотезы h, она будет зависеть главным образом от простоты h (а также в меньшей степени – от узости диапазона). Но если k содержит логически вероятные данные об устройстве мира, то P(h k) будет зависеть также от того, насколько хорошо h согласуется с этими данными. В том случае, если k – это просто «тавтологическая данность», Р(е k) будет тем, что я назову в дальнейшем «внутренней вероятностью» е.

Я сказал о том, что теорема Байеса истинна, но мне следует пояснить, что я подразумеваю, говоря это. Я имею в виду, что в той мере, в которой различные е, h и k могут быть выражены численно, будет справедливо устанавливать численные отношения между ними. А в той мере, в которой они не могут быть точно выражены численно, мое заявление о том, что теорема Байеса истинна, будет просто заявлением, что все утверждения сравнительной вероятности, которые следуют из этой теоремы, истинны. Под утверждениями сравнительной вероятности я подразумеваю утверждения о том, что одна вероятность больше, такая же или меньше другой вероятности (иногда такие утверждения – это всё, что мы можем более или менее оправданно сказать о некоторых вероятностях). Так, из теоремы Байеса следует, что если даны две гипотезы h 1 и h 2, при которых P(e h 1 &k) ­ P(e h 2 &k), то P(e h 1 &k) > P(e h 2 &k), если и только если P(h 1 k) > P(h 2 k). Иными словами, если обе гипотезы h 1 и h 2 полагают равную вероятность того, что мы обнаружим некую данность е, при заданном фоновом знании k, тогда одна из них, h 1 будет более вероятна, чем другая, по всей совокупности данных е и k, если и только если h 1 была более вероятна, чем h 2 только с учетом фоновых данных. Выразим это более формально: если h 1 и h 2 обладают равной предсказательной силой, h 1 будет обладать большей апостериорной вероятностью (то есть вероятностью по всей совокупности данных е и k), чем h 2, если и только если она повышает предварительную вероятность. Так, например, если нам даны две научные теории, с равным успехом предсказывающие некоторые наблюдаемые данные, то одна из них будет более вероятна, чем другая, если и только если она была более вероятной еще до того, как наблюдения были произведены. Или, опять же, из теоремы Байеса следует, что если P(h 1 k) ­­ P(h 2 k) то P(h 1 e&k) > P(h 2 e&k), если и только если P(e h 1 &k) > P(e h 2 &k). Это означает, что если две гипотезы равновероятны до того, как получены некоторые данные е, одна из них будет более вероятна, чем другая, по всей совокупности данных, если и только если согласно этой гипотезе то, что е будет обнаружено, будет более вероятно, чем согласно другой гипотезе (в крайнем случае, h 1, может влечь за собой е – оно может быть дедуктивным следствием h 1, a h 2 может влечь за собой ¬ е, то есть то, что е не произойдет).

Рассмотрим еще один пример, чуть отличный от приведенных выше и иллюстрирующий действие теоремы Байеса. Пусть h – это гипотеза о том, что Джонс ограбил Барклайс Банк, е – это данные о том, что он находился около банка в момент совершения преступления, а k – это фоновое знание о том, что Джонс уже однажды ограбил другой банк (Ллойдс Банк). Тогда P(h e&k) будет определяться объяснительной силой h, отношением P(e h&k) к Р(е k), и предварительной вероятностью h, то есть P(h k). P(h e&k) – это вероятность пропозиции е при данных h и k. В данном случае она равна 1, поскольку, если Джонс ограбил этот банк, он должен был находиться в это время рядом с местом преступления. Р(е k) – это вероятность того, что он будет находиться в это время рядом с местом преступления, с учетом того, что он уже ограбил Ллойдс Банк. Она будет выше, чем P(h k) то есть вероятность того, что Джонс ограбил Барклайс Банк, при условии, что он уже ограбил Ллойдс Банк, поскольку он мог находиться там по совершенно невинному поводу. Следовательно, вероятность того, что он ограбил Барклайс Банк – это предварительная вероятность того, что он это совершил, возрастающая в той мере, в которой гипотеза о том, что он это совершил, делает е более вероятным, чем если бы он его не ограбил.

На этом этапе будет полезно, прежде чем продолжить рассмотрение главного аргумента, сделать еще одно важное замечание относительно утверждения, которое иллюстрирует теорема Байеса. Иногда считается, что мы соглашаемся с той или иной гипотезой только в том случае, если у нас есть возможность ее проверить, может ли она предсказывать определенные события, после чего мы смотрим, произойдут эти события или нет. И только если они произошли, мы соглашаемся принять эту гипотезу. Однако мне кажется, что, хотя мы часто проверяем гипотезы таким образом, нам не следует устанавливать их вероятность на основе очевидности и потому принимать их. Теорема Байеса, конечно же, не подразумевает утверждение (понятое в указанном выше буквальном смысле), что гипотезы должны успешно предсказывать в том случае, когда их вероятность устанавливается на основе очевидности. Согласно этой теореме, совершенно неважно, наблюдается ли е до или после того, как была сформулирована h. Имеют значение только отношения вероятности, существующие между е и h. И, разумеется, теорема верна в этом отношении. То, что я называю P(e h&k) «предсказательной силой», которой обладает h, не подразумевает, что е было обнаружено лишь для того, чтобы постулировать h, предсказавшую его.

Теория движения Ньютона считалась в высшей степени вероятной на основе тех данных, которые были доступны в конце XVII в., даже несмотря на то, что она не давала иных прогнозов, которые можно было бы сразу проверить, кроме уже имевшихся, уже предсказанных и уже объясненных этим законом (например, законы движения планет Кеплера и закон падения тел Галилея). Эта высокая вероятность возникла исключительно из-за того, что данная теория оказалась очень простой фундаментальной теорией, из которой выводились разнообразные законы. В более общем плане, устанавливает ли е вероятность h, разумеется, не влияет решающим образом на то, сформулировали ли мы h до того, как увидели е. Вероятность стала бы чем-то в высшей степени субъективным вместо объективных отношений между данными и гипотезой, если бы это было так. Однако теорема Байеса в состоянии объяснить, почему нередко, а на самом деле в большинстве случаев, нас интересуют прогнозы, которые мы можем проверить после того, как была сформулирована теория. Это случается потому, что только когда у нас есть теория (h), мы точно знаем, какие данные сильно повысят отношение P(e h&k) к Р(е k); только в этом случае мы знаем, какие данные нам нужно получить для того, чтобы эта теория обладала высшей степенью вероятности. Вероятность того, что эти данные уже есть у нас, невысока, обычно нужно их искать. Тем не менее, мы можем их уже иметь. Поэтому нет ничего самого по себе неправильного в гипотезе существования Бога, в том, что она не дает такие прогнозы, которые мы могли бы знать только завтра, а не сегодня, независимо от того, успешны они или нет. Данные теиста могут сделать его гипотезу вероятной без того, чтобы эти условия были успешными73.

Непосредственно из теоремы Байеса следует, что P(h e&k) > P(h k), если и только если P(e h&k) > Р(е k). Именно этот важный принцип Макки74 называет «критерием релевантности»75. Он следует из сравнительно короткого логического действия: P(h e&k) > P(h k), если и только если P(e h&k) > P(e ¬р&k). Это означает, что гипотеза h подтверждается данными е, если и только если эти данные более вероятны в том случае, когда гипотеза истинна, а не когда она ложна. Этот вывод, разумеется, справедлив. Он подразумевается во многих суждениях, которые мы совершаем в повседневной жизни. Отпечатки пальцев Джонса на сейфе подтверждают предположение о том, что Джонс ограбил этот сейф, если и только если их присутствие на сейфе более вероятно в случае совершения преступления, чем в случае его несовершения. Если же их наличие на сейфе равновероятно, независимо от того, ограбил ли он сейф или нет (например, Джонс работает менеджером в том магазине, где стоит этот сейф, и часто открывает его), то они не подтверждают предположение о том, что Джонс ограбил сейф. Из этого следует, что аргумент от е к h является правильным 3-индуктивным доказательством, если и только если е произойдет с большей вероятностью в случае, когда гипотеза h истинна, а не ложна.

Хотя наиболее простая теория (из равных по диапазону и согласованности с фоновыми данными) обладает наибольшей внутренней вероятностью, возникает вопрос: так ли это в отношении чуть более сложных теорий? Практика ученых, историков и т. д. показывает, что они рассматривают очень простую теорию как гораздо более вероятную, чем менее простую. Если множество фактов вы можете объяснить с помощью одной гипотезы, согласно которой их причиной является один агент, это будет гораздо более вероятно, чем теория с той же самой объяснительной силой, согласно которой их причиной являются два агента. А теория, постулирующая закон обратной квадратической зависимости сил взаимного притяжения, является гораздо более внутренне вероятной, чем теория, постулирующая закон притяжения как функцию от расстояния в степени 2,01. Предпочтительнее будет та теория, которая постулирует немного переменных и при этом в состоянии объяснить столько же, сколько теория, постулирующая много переменных.

Однако когда мы имеем дело не с такими простыми теориями (в них может возникнуть необходимость, когда очень простые теории обнаруживают небольшую объяснительную силу), внутренняя вероятность наиболее простой из оставшихся теорий будет не выше, чем внутренняя вероятность другой, менее простой, теории. Теория о том, что сила притяжения зависит от расстояния в степени 2,01, чуть-чуть более внутренне вероятна, чем теория, согласно которой она зависит от расстояния в степени 2,012. К тому же, практика ученых и прочих исследователей показывает, что хотя всегда будет в наличии бесконечное число очень сложных теорий, объясняющих данные с любой объяснительной силой, они всегда оценивают как более вероятную теорию, основанную на доступных в некий момент времени данных, дающую правильное объяснение и находящуюся в группе наиболее простых теорий. Слишком сложные теории считаются слишком невероятными, чтобы быть истинными, если существуют хотя бы умеренно простые теории, обладающие значительной объяснительной силой.

Теист идет в своем доказательстве от мира, от факта его существования и его разнообразных характеристик к Богу, который его создал. Поскольку структура его аргументации такая же, как и в случае доказательства от узкого круга явлений к бестелесной личности (такой как полтергейст, который вызывает их как результат своих действий), мы должны использовать те же самые критерии, воплощенные в теореме Байеса, учитывая при этом (как я уже подчеркивал) различия между разными сферами явлений. Теист ведет свое доказательство от всех феноменов, данных в опыте, а не от узкого круга явлений. Мы будем по очереди задавать значение е как представляющее различные аспекты мира, которые теист приводит как свидетельство в пользу существования Бога, а также различные аспекты, которые атеист приводит как свидетельство против существования Бога. Пусть h будет гипотезой о том, что Бог существует, а к для начала будет просто соответствовать тавтологическим данным. Для того чтобы оценить P(h e&k) в каждом случае, нам нужно будет оценить отношение P(e h&k) к Р(е k) и P(h k). Вероятность существования Бога (с учетом тавтологических данных) будет зависеть от того, насколько хорошо гипотеза существования Бога сможет объяснить возникновение явлений, которые в противном случае были бы в высшей степени невероятны; и от этой предварительной вероятности, которая (поскольку здесь отсутствует фоновое знание) подразумевает ее внутреннюю вероятность, зависят ее диапазон и простота. Теизм – это гипотеза с огромным диапазоном, но, разумеется, точно такой же диапазон у любого другого мировоззрения, например, физикализма. Таким образом, для того, чтобы сравнить его с другим мировоззрением, нам следует отвлечься от вопроса о его диапазоне. И, как я утверждал ранее на примере научной теории (теории Ньютона), во всяком случае, при определении внутренней вероятности, диапазон – критерий гораздо меньшей значимости по сравнению с простотой. Ключевой детерминантой предварительной вероятности теизма должна быть простота. Я буду рассматривать простоту, а следовательно, и внутреннюю вероятность теизма в 5 главе. Объяснительная сила теизма будет меняться, как мы увидим, в зависимости от разных е. Но прежде чем обсуждать доказательную силу различных е (то есть различных аргументов), нам нужно рассмотреть базовые принципы, на которые мы опираемся, определяя значение двух вероятностей, P(h e&k) и Р(е k), определяющих объяснительную силу. Р(е k) связана с тем, насколько в принципе возможно возникновение того или иного феномена, независимо от того, создал его Бог или нет. Это следует из формулы:

Р(е k) ­­ P(e h&k) P(h k)P(e ¬h k).

Первое слагаемое, P(e h&k) P(h k), просто повторяет верхнюю строчку правой части равенства теоремы Байеса. Так, согласно этой теореме, P(h e&k) будет близким к 1, если и только если второе слагаемое, P(h e&k) P(¬h k), будет незначительным (по отношению к первому слагаемому). Это второе слагаемое определяет, насколько вероятно, что е произойдет в том случае, если Бог не существует. Вероятность будет низкой в том случае, если невозможно, чтобы любая другая причина вызвала е, или что е возникло без причины. В 4 главе я буду обсуждать основные принципы, на которые опирается оценка этой вероятности, и особенно вопрос о том, что является основанием для утверждения, что некоторые феномены возникают без причины (то есть необъяснимы). В 6 главе я рассмотрю в общих чертах, как следует оценивать P(e h&k) иными словами, какого типа должно быть е, чтобы Бог был его вероятной причиной. Отмечу, что под h я подразумеваю просто высказывание «Бог существует». Само по себе оно обеспечивает лишь частичное объяснение е. Его нужно соединить с намерением осуществить е для того, чтобы обеспечить полное объяснение е. Значение P(e h&k) для различных е будет зависеть от того, насколько вероятно, что Бог обладает этим намерением.


Обоснование личностного объяснения | Существование Бога | Глава 4. Завершенное объяснение