В нашей электронной технологии дискретные ячейки памяти могут находиться только в двух состояниях, традиционно представляемых как 0 и 1, хотя их можно трактовать как «высоко-низко», «включено-выключено», «верх и низ»; главное — что они должны быть чётко отличны друг от друга, и совокупность этих состояний может быть «прочитана» так, чтобы на что-то влиять. В электронной технологии используются самые различные физические среды для хранения нулей и единиц — тут и магнитные носители (ленты и диски), и перфорированные карты и ленты, и электронные «чипы» с большим количеством маленьких полупроводниковых ключей внутри.
Главный носитель данных внутри ивовых семян, муравьёв и всех других живых клеток — не электронный, а химический. В нём используется тот факт, что некоторые молекулы способны к «полимеризации», которая заключается в соединении молекул в длинные цепи неограниченной длины. Существует много разных полимеров. Например, «полиэтилен» представляет собой длинные цепи маленькой молекулы, называемой этиленом; т. е. это полимеризированный этилен. Крахмал и целлюлоза — полимеризированный сахар. Некоторые полимерные цепочки являются цепями, состоящими не из однотипных маленьких молекул (как этилен), а молекул двух или более различных видов. Как только такая гетерогенность появляется в полимерной цепи, так информационная технология на ней становится теоретически возможной. Если в нашей цепи имеются два вида маленьких молекул, одну из которых можно полагать нулём, а другую — единицей, так сразу же на ней оказывается возможно хранить любое количество информации любого вида, лишь бы цепь была достаточно длинна. Специфические полимеры, используемые живыми клетками называются полинуклеотидами. В живых клетках существует два главных семейства полинуклеотидов, кратко — ДНК и РНК. Оба представляют собой цепи маленьких молекул, называемых нуклеотидами. И ДНК и РНК — гетерогенные цепи с четырьмя различными видами нуклеотидов. И конечно, именно это открывает возможность для хранения информации. Вместо только двух состояний, «1» и «0», информационная технология живых клеток использует четыре состояния, которые традиционно представляются как A, T, C и G. В принципе, разница между бинарной информационной технологией двух состояний (ткаой, как компьютерная) и технологией четырёх состояний (таковая для живой клетки), очень невелика.
Как я упоминал в конце первой главы, единственная человеческая клетка располагает информационной ёмкостью, достаточной для хранения трёх или четырёх комплектов Британской энциклопедии, в каждом из которых 30 томов. Я не знаю аналогичной цифры для ивы или муравья, но число будет столь же потрясающим. Информационная ёмкость одной клетки зародыша лилии или одного сперматозоида саламандры достаточна для хранения 60 комплектов Британской энциклопедии. Некоторые виды амёб, несправедливо называемых «примитивными» могли бы хранить в своей ДНК 1 000 комплектов Британской энциклопедии.
Как это ни удивительно, но только примерно 1 процент генетической информации, например, в клетках человека, выглядит фактически используемым: примерно эквивалент одного тома Британской энциклопедии. Никто точно не знает, что там делают остальные 99. В предыдущей книге я предположил, что это может быть «безбилетный пассажир», паразитирующий на трудах 1 процента — эта теория была недавно принята молекулярными биологами под названием «эгоистичной ДНК». ДНК Бактерий примерно в 1000 раз менее ёмка, чем ДНК клетки человека, и, вероятно, используется почти полностью: для паразитов тут слишком мало места. Её ДНК могла бы хранить «только» одну копию Нового Завета!
У современных генных инженеров уже есть технология, позволяющая записать Новый Завет или что-либо подобное в ДНК бактерии. «Смысл» символов в любой информационной технологии произволен, и нет никаких препятствий против сопоставления каких-то комбинаций четырёхбуквенного алфавита ДНК, скажем, триплетов, буквам нашего 26-символьного алфавита (и хватило бы места для букв верхнего и нижнего регистра с 12 знаками пунктуации). К сожалению, для записи Нового Завета в бактерию, человеку потребовалось бы примерно пять столетий, так что я сомневаюсь, что кто-нибудь будет суетиться. Но если б это удалось, то благодаря огромной скорости воспроизводства бактерий, 10 миллионов копий Нового Завета могли бы появляться каждый день! Мечта миссионера — если б только люди умели читать алфавит ДНК. Но увы, буквочки там настолько мелкие, что все 10 миллионов копий Нового Завета могли бы одновременно танцевать на булавочной головке.
Электронная память компьютера традиционно подразделяется на ROM и RAM. ROM расшифровывается как «только читаемая память». Строже говоря, это память, в которую пишут лишь однажды, а читают много раз. Комбинация нулей и единиц в них «прожжена» раз и навсегда при изготовлении. В таком виде они и остаются, не изменяясь, в течение всего срока службы памяти, а прочитана эта информация может любое количество раз. В другой тип электронной памяти, называемой RAM, можно «записывать» (вы скоро привыкните к этому неэлегантному компьютерному жаргону), и можно его читать. Поэтому RAM может делать всё то же самое, что и ROM, и даже больше. Расшифровка аббревиатуры RAM фактически вводит в заблуждение, поэтому я не буду приводить её. Особенность RAM в том, что вы можете поместить любой набор нулей и единиц в его любую часть, какую хотите, и столько раз, сколько вам заблагорассудится. Большая часть памяти компьютера — RAM. Напечатанные мною слова поступают прямо в RAM; программа обработки текстов, управляющая этим процессом, тоже находится в RAM, хотя теоретически её можно было бы прожечь в ROM и впоследствии ни разу не менять. ROM используется для фиксированного репертуара стандартных программ, которые необходимы много раз, и которые вы не можете изменить, даже если бы захотели.
ДНК представляет собой ROM. Её можно читать миллионы раз, но записывать лишь однажды — когда она изначально собирается при рождении клетки, в которой она находится. ДНК в клетках любого индивида «прожжена» и никогда не меняется в течение всей его жизни — кроме очень редких случаев поломок. Однако она может быть скопирована. Она дублируется всякий раз, когда клетка делится. Комбинации A, T, C и G нуклеотидов достоверно скопированы в ДНК каждой из триллионов новых клеток, которые образуются при росте ребёнка. При зачатии нового организма в его ДНК ROM «прожигается», новый и уникальный набор информации, с которым он затем и живёт всю свою оставшуюся жизнь. Этот набор копируется во все его клетки, (кроме репродуктивных клеток, в которые, как мы увидим, копируется случайная половина этой ДНК).
Вся компьютерная память, будь то «ROM» или «RAM» проадресована. Это означает, что позиция каждой ячейки памяти имеет уникальное обозначение — обычно номер; впрочем, это произвольное соглашение. Важно понять различие между позицией в памяти и её содержимым. Каждая позиция памяти называется адресом. Например, первые две буквы этой главы, «За» в этот момент находятся в RAM моего компьютера по адресам с номерами 6446 и 6447; всего компьютер может адресовать до 65536 ячеек RAM. В другое время, содержимое ячеек по этим двум адресам будет другим — ячейка хранит последнее записанное туда содержимое. У каждой ячейки ROM тоже есть адрес и содержимое. Отличие в том, что каждый адрес раз и навсегда связан с его содержимым. ДНК собрана в длинные волокна хромосом, как длинные компьютерные ленты. Вся ДНК в каждой из наших клеток адресована в том же самом смысле, как и компьютерная ROM (точнее — как компьютерная лента). Конкретные номера или названия, используемые нами для маркировки данного адреса, произвольны — как и для компьютерной памяти. Важно, что конкретный адрес моей ДНК точно соответствует такому же адресу в вашей ДНК. Содержимое моей ДНК с адресом 321762 может быть, а может и не быть тем же самым, что и содержимое вашей ДНК по адресу 321762. Но мой адрес 321762 находится в точно том же месте в моих клетках, в каком находится ваш адрес 321762 в ваших клетках. «Место» здесь означает позицию на длине данной хромосомы. Точное геометрическое положение хромосомы в клетке не имеет значения. Хромосома плавает в жидкости, и поэтому её геометрическое положение меняется, но каждый адрес на хромосоме точно определён в понятиях линейного порядкового номера по длине хромосомы — также, как на компьютерной ленте, даже если лента разбросана на полу, а не аккуратно смотана. Все мы, все люди, обладают одними и тем же набором адресов ДНК, но не обязательно тем же самым содержимым их. И это главная причина того, почему мы все отличаемся друг от друга.
У других биологических видов другой набор адресов. Например, у шимпанзе 48 хромосом, а у нас — 46. Строго говоря, сравнивать так содержимое ячеек — адрес за адресом, бессмысленно, потому что у разных видов эти адреса интерпретируются совершенно различно. Однако близкородственные виды, такие, как шимпанзе и люди, имеют такие большие куски последовательно совпадающего содержимого, которые мы можем легко идентифицировать как в основном одинаковые, хотя мы не можем использовать одну и ту же систему адресования для этих двух видов. Главный признак вида — это совокупность особей, имеющих одну и ту же систему адресования своей ДНК. За вычетом нескольких незначительных исключений, все члены вида имеют одинаковое число хромосом, и каждое место на длине каждой хромосомы расположено точно там же у всех других особей вида. У разных особей вида может отличаться содержимое этих адресов.