Как сам Байес пытался решить эту задачу, видно на примере, который сам он приводил, чтобы сделать свои математические формулы нагляднее. Он предлагал представить себе бильярдный стол (годится любой, но давайте представим себе бильярдный ради исторической точности).
Так вот, представьте себе, что вы небрежно бросаете на бильярдный стол красный шар, который катится себе случайным образом и может остановиться в любом месте. Итак, красный шар остановился в каком-то месте, вы его не трогаете, несколько раз прокатываете по столу в том же направлении белый шар и записываете, как часто он останавливается дальше красного шара. Затем Байес, опираясь на то, где останавливались шары на воображаемом столе, предложил вывести математически обоснованный ответ на следующую простую задачку: если вы знаете, что произошло с теми шарами, которые вы уже прокатили по столу, можно ли предсказать, с какой вероятностью следующий белый шар остановится до или после красного (каковы шансы на тот или иной результат)? Байес показал, что можно. Главное – чем больше прокатишь шаров, тем сильнее будет уверенность в результате следующего броска, в точности как у петушка и Солнца.
Мысленный эксперимент с бильярдными шарами очень прост, однако многое говорит о том, насколько фундаментальным был вопрос вероятностей для математики XVIII века. До того времени никто не разобрался, как проделать необходимые выкладки, а концепции, которые легли в основу работы с неопределенностью, были всем в новинку и даже пугали. Байес двигался к формулировке теоремы, которая впоследствии получила его имя – теоремы, при помощи которой можно было вычислить, насколько человек «верит» в гипотезу перед лицом свидетельств, как правдоподобие в чьих-то глазах или уверенность в чем-то связаны с тем, что то или иное утверждение верно.
Чтобы вам легче было понять смысл теоремы и разобраться, как можно применить ее к нашему вопросу о жизни во Вселенной, приведу чуть более красочный и сложный пример, чем восходы и бильярдные шары. Представьте себе, что у меня есть любопытная гипотеза, что 20 % популяции котов на планете составляют чеширские коты[176]. Само собой, чтобы проверить свою гипотезу, я должен пойти и найти какое-то количество котов, выявить среди них чеширских и не-чеширских и посчитать, сколько их. Эта задача не то чтобы разительно отличается от поиска признаков инопланетной жизни – обитаемых и необитаемых планет.
Разумеется, посчитать котов – дело непростое, легко сказать, да трудно сделать. Я мечусь впотьмах, мне не на что опереться, никакой предварительной информации у меня нет. Прежде всего, если я не готов поймать и рассортировать огромное количество котов, распределение результатов у меня неизбежно будет случайным. Если я схвачу и запихну в мешок десять первых попавшихся котов на улице и выясню, что два из них – чеширские, то никак не смогу с уверенностью сказать, что это подтверждает мою гипотезу о 20 % чеширских котов на планете, поскольку выборка будет случайной и из небольшого количества котов, а следовательно, погрешность у моего эксперимента будет очень велика.
Значит, нужно выстроить несколько более хитроумную теорию о количестве чеширских котов и учесть кое-какие ожидания о распространенности (или вариациях) случайно выбранных групп котов. В сущности, нужно, чтобы погрешность можно было предсказать, чтобы я мог заранее представить себе, как должны будут выглядеть мои измерения, если моя гипотеза верна. Мало того что случайная выборка чревата осложнениями, есть еще и вопрос систематической погрешности, вызванной изначальными условиями. Может быть, чеширские коты, в принципе толстые и неповоротливые, легче ловятся, и поэтому я их больше насчитаю. Может быть, моя гипотеза относительно чеширских котов в принципе ошибочна (а такое совсем не исключено, если учесть, что чеширские коты чуть что становятся невидимыми). Однако я вполне мог убедить себя, что она верна, если по воле судьбы в моей случайной выборке оказалось нужное число улыбающихся котов, которых я принял за чеширских.
Так что вероятность того, что моя гипотеза чеширских котов верна, сама по себе равна математической комбинации каких-то других вероятностей, с ней связанных. Прежде всего это вероятность получить конкретный результат измерений с учетом этой гипотезы. Звучит немного странно, однако это означает, что если модель или гипотеза верна, вы вправе ожидать, что подсчет котов принесет определенные результаты. Например, я мог бы определить вполне конкретную вероятность того, что в моей случайной выборке из 10 пойманных котов я насчитаю 1, 2, 3 или любое другое число чеширских.
Далее следует так называемая апостериорная вероятность – и именно ее мы и хотим узнать, когда гоняемся за котами или пытаемся найти ответ на вопрос о жизни во Вселенной. Апостериорная вероятность – обратная сторона вышесказанного, причем интуитивно более понятная. Это вероятность того, что гипотеза верна, в свете свидетельств или измерений. Иначе говоря, эта вероятность говорит нам, каковы шансы, что моя теория о котах верна – или что во Вселенной есть жизнь помимо нас, при том, что мы наблюдаем только жизнь здесь, на Земле. А еще эта та самая мера уверенности, о которой мы говорили в связи с рассветами и бильярдными шарами.
Наконец, при рассмотрении моего примера с котами надо учитывать еще и такой фактор, как сама по себе наша гипотеза, и это называется априорной вероятностью. В данном случае это вероятность, что любой кот окажется чеширским, и мы считаем, что она равна 20 % или 0,2. Мы, конечно, не знаем, точна ли цифра 20 %, это то самое число, которое мы хотим подтвердить, – примерно как вероятность, что на каждой отдельно взятой планете может зародиться жизнь. Интересно, что когда мы приписываем ситуации эту вероятность, то имплицитно исходим из предположения, что сама идея – существование чеширских котов – верна. А такого рода предположения опасны, поскольку мы можем случайно придать слишком много веса безумным гипотезам. Так что лучше всего – если, конечно, мы не страдаем чрезмерной самоуверенностью – оценить побольше возможных «априори» и держать кулаки за то, что данные, которыми мы располагаем, позволят распределить гипотезы-победительницы и гипотезы-аутсайдеры по относительной вероятности.
Формулировка теоремы Байеса предполагает также, что данные, которые мы получаем, должны быть точными, что не будет никаких ложноположительных и ложноотрицательных результатов. Поэтому я в ходе своего исследования кошек предполагаю, что если я беру кота и определяю, что он чеширский, так и есть. Это очень важная оговорка. Например, в мире медицины ложноположительных и ложноотрицательных результатов очень много. В таких случаях формулу Байеса приходится немного подправить, чтобы учесть вероятность неверного диагноза и ошибок при анализах. Если вы пытаетесь оценить вероятность той или иной болезни или даже эпидемической угрозы, главное – точность данных и «априори», на которые вы опираетесь.
Итак, теорема Байеса позволяет нам оценить отношения между тем, что мы можем наблюдать и измерять, и нашими гипотезами или математическими моделями. В принципе, она должна позволять нам приписывать абсолютную вероятность – уверенность, – что наша гипотеза представляет собой точное описание природного феномена. Но тут возникают кое-какие досадные осложнения, и иногда результаты подобных вычислений сильно нас огорчают. Не исключено, что мы не знаем, что считать «априори» и вообще верна наша гипотеза хотя бы приблизительно. И измерения бывают несовершенными из-за случайной выборки или непредвиденных погрешностей – и в моем примере так и есть, поскольку чеширских котов в природе не существует. Поэтому вероятность (то есть мера уверенности), которую мы получаем, оказывается очень маленькой и не помогает нам принять решение.
К счастью, теорема Байеса куда мощнее. Она позволяет обойти эти очевидные препятствия при помощи красивого приема, который ученые часто применяют в повседневной работе – и когда гоняются за котами, и когда оценивают структуру мироздания. Дело в том, что абсолютные значения вероятностей нас обычно не очень интересуют. Нас интересует, какая модель или гипотеза «лучше», то есть вероятнее, прочих. Тогда мы для начала предполагаем, что все гипотезы могут оказаться верными с одинаковой вероятностью. На самом деле главное – разобраться, какая гипотеза лучше всего соответствует нашим данным, какая победит. Конечно, может оказаться, что все они ошибочны, но нам просто хочется узнать, какая из них ошибочна меньше прочих. Для этого нам нужно перевернуть формулу Байеса. В конце концов мы оценим вероятность или уверенность, что наши измерения могут объясняться той или иной гипотезой (по сравнению с остальными). Этот простой прием, как выясняется, – необычайно мощный научный инструмент.