Это удивительно большое число.
Даже если Вы ограничитесь «двоичными деревьями» (то есть деревьями с ветвями, которые разделяются только надвое — а не натрое или больше), общее количество возможных деревьев составит больше чем 34 миллиона.
Ученые терпеливо нашли каждое из этих 34 миллионов деревьев и сравнили каждое с каждым из остальных 33 999 999 деревьев.
Нет, конечно они этого не делали! Это заняло бы слишком много компьютерного времени.
Однако они разработали разумное статистическое приближение, сокращенный аналог этих титанических расчетов.
Вот как этот метод приближения работает.
Они взяли первый из тех пяти генов, скажем, гемоглобин-A (во всех случаях я использую название белка, чтобы обозначить ген, который кодирует этот белок).
Из всех тех миллионов деревьев они хотели найти наиболее «экономное» в отношении гемоглобина-A.
Экономное здесь означает «требующее предположить минимальное число эволюционных изменений».
Например, все те тысячи деревьев, предполагавших, что наиболее близкий кузен человека был кенгуру, в то время как люди и шимпанзе связаны более отдаленным родством, оказались очень неэкономными деревьями: они должны были предположить множество эволюционных изменений, чтобы привести к результату, что у кенгуру и людей был недавний общий предок.
Вердикт гемоглобину-A был в таком духе:
Это ужасно неэкономное дерево.
Мало того, что нужно было бы выполнить много мутационной работы, чтобы закончить со столькими различиями в людях и кенгуру, несмотря на наше близкое родство, предполагаемому этим деревом, также нужно было бы проделать много мутационной работы в другом направлении, чтобы гарантировать, что, несмотря на их большое расхождение на этом конкретном дереве, люди и шимпанзе каким-то образом оказались обладателями столь схожего гемоглобина-A.
Я голосую против этого дерева.
Гемоглобин-A выносит вердикты такого рода, некоторые более благоприятные, чем другие, каждому из этих 34 миллионов деревьев, и, наконец, приходит к выбору нескольких дюжин деревьев высокого ранга.
О каждом из этих высокоранговых деревьев гемоглобин-A мог бы сказать примерно так:
Это дерево определяет людей и шимпанзе как близких кузенов, и оно определяет овец и коров как близких кузенов, и оно помещает кенгуру на отдельную ветвь.
Оно оказалось очень хорошим деревом, потому что почти не заставляет делать какую-либо мутационную работу вообще, чтобы объяснить эволюционные изменения.
Это — на диво экономное дерево.
Оно получило голос гемоглобина-A!
Конечно, было бы хорошо, если бы гемоглобин-A и каждый другой ген могли бы предложить единственное дерево максимальной экономичности, но мы слишком многого хотим.
Среди этих 34 миллионов деревьев ожидается только, что несколько слегка различных деревьев должны конкурировать за высокий рейтинг по гемоглобину-A.
А как насчет гемоглобина-B? Как насчет цитохрома-C? Каждый из этих пяти белков имеет право на свое собственное отдельное голосование, чтобы выявить свои собственные предпочтительные (то есть наиболее экономные) деревья из числа тех 34 миллионов деревьев.
Для цитохрома-C было бы вполне возможно прийти к совершенно другим результатам голосования за наиболее экономное дерево.
Могло бы оказаться, что цитохром-C людей действительно очень похож на цитохром-C кенгуру и очень отличается от такового у шимпанзе.
Далеко не приветствующий соединение в близкую пару овец и коров, обнаруженную гемоглобином-A, цитохром-C мог бы обнаружить, что едва ли нужны мутации вообще, чтобы разместить овец очень близко, скажем, к обезьянам, и чтобы разместить коров очень близко к кроликам.
Согласно гипотезе творения, нет никакой причины, почему этого не должно происходить.
Но что фактически обнаружили Пенни и его коллеги, это удивительно высокое согласование среди всех пяти белков (и они использовали еще более умную статистику, чтобы показать, насколько маловероятно случайное возникновение такого согласования).
Все пять белков «голосовали» практически за одно и то же подмножество деревьев из числа 34 миллионов возможных деревьев.
Это, конечно, именно то, что мы ожидали бы при условии, что действительно есть только одно истинное дерево, связывающее все одиннадцать животных, и что это — генеалогическое дерево: дерево эволюционного родства.
Кроме того, это дерево согласия, за которое голосовали все эти пять молекул, оказалось тем же, которое зоологи уже вывели на анатомических и палеонтологических, не молекулярных, основаниях.
Исследование Пенни было опубликовано в 1982 году, довольно недавно.
Прошедшие годы видели обширное увеличение подробных свидетельств на основании точных последовательностей генов большого числа видов животных и растений.
Согласованность по большинству экономных деревьев теперь простирается далеко за пределы одиннадцати видов и пяти молекул, которые изучал Пенни и его коллеги.
Их исследование было только хорошим примером, очень сильным, как доказали их статистические свидетельства.
Общая сумма информации о генетических последовательностях, доступных теперь, не оставляет по этому вопросу никаких мыслимых сомнений.
Намного более убедительные, даже чем (также очень убедительные) ископаемые свидетельства, свидетельства от сравнений генов сходятся, быстро и решительно, на единственном великом дереве живого.
Выше помещено дерево для одиннадцати видов исследования Пенни, которое представляет собой современное всеобщее голосование многих различных частей генома млекопитающих.
Устойчивость согласованности между всеми различными генами в геноме вселяет в нас уверенность не только в исторической точности самого консенсусного дерева, но также в факт, что эволюция имела место.
Если молекулярная генетическая технология продолжит расширяться с ее нынешней экспоненциальной скоростью, то году к 2050 получить полную последовательность генома животного будет дешево и быстро, едва ли не труднее, чем измерить его температуру или его кровяное давление.
Почему я говорю, что генетическая технология развивается по экспоненте? Может мы даже могли бы ее измерить? Есть аналог с компьютерной технологией, названный Законом Мура.
Названный в честь Гордона Мура, одного из основателей компании компьютерных микросхем Intel, он может быть выражен различными способами, потому что несколько показателей компьютерной мощности связаны друг с другом.
Один вариант закона утверждает, что количество модулей, которые могут быть упакованы в интегральную схему заданного размера, удваивается за срок от восемнадцати месяцев до двух лет или около того.
Это — эмпирический закон, что означает, что он не выводится из некоторой теории, а просто оказывается действительным, когда Вы оцениваете данные.
Он справедлив уже в течение приблизительно пятидесяти лет, и многие эксперты думают, что так будет в течение по крайней мере еще нескольких десятилетий.
Другие экспоненциальные тенденции с подобным удвоением во времени, которые могут быть расценены как версии Закона Мура, включают увеличение скорости вычислений и размера памяти в расчете на единицу стоимости.
Экспоненциальные тенденции всегда приводят к потрясающим результатам, как продемонстрировал Дарвин, когда при помощи своего сына, математика Джорджа, он взял слона как пример медленно размножающегося животного и показал, что лишь через несколько столетий неограниченного экспоненциального роста потомки всего одной пары слонов покрыли бы землю.
Само собой разумеется, рост популяции слонов на практике не экспоненциален.
Он ограничен конкуренцией за пищу и пространство, болезнями и многим другим.
Это действительно было самым главным для Дарвина, поскольку здесь вступает естественный отбор.
Но Закон Мура действительно остается в силе, по крайней мере приблизительно, уже в течение пятидесяти лет.
Хотя ни у кого нет особо четкого представления почему, различные показатели компьютерной мощности на практике фактически увеличивались по экспоненте, тогда как тенденция слона Дарвина экспоненциальна только теоретически.
Мне пришло на ум, что может существовать подобный закон в отношении генетической технологии и секвенирования ДНК.
Я подсказал это Джонатану Ходжкину, оксфордскому профессору генетики (который когда-то был моим студентом-воспитанником).
К моему восхищению оказалось, что он уже думал об этом — и измерил это при подготовке к лекции в своей старой школе.
Он оценил стоимость секвенирования ДНК стандартной длины для четырех дат в истории, 1965, 1975, 1995 и 2000 года.
Я перевел его числа в «отдачу от вложенных средств», или в то, «сколько ДНК можно секвенировать за 1 000 Ј?» Я подготовил иллюстрации в логарифмическом масштабе, выбранном, потому что экспоненциальная тенденция всегда выявляется как прямая линия, когда она построена в логарифмическом масштабе.