Глава 5
Грамматика жизни. ДНК, гены, геномы
В основе передачи наследственной информации у любых живых организмов, будь то люди, животные, растения, грибы или бактерии, лежит двухцепочечная молекула ДНК74. Каждая из двух цепей – полимер, состоящий из четырех типов мономеров, нуклеотидов аденина (A), тимина (T), цитозина (C) и гуанина (G). Например, вот короткая последовательность одной цепочки ДНК из семи нуклеотидов: GATTACA (это также название известного фантастического фильма). Напротив нуклеотида А одной цепи во второй цепи молекулы ДНК всегда стоит Т, а напротив G – всегда C. Это свойство называется комплементарностью и помогает молекуле ДНК размножаться в ходе процесса, который называется репликация.
Во время репликации двойная спираль расплетается на две одинарные цепи, и к каждой из них достраивается зеркальная, комплементарная копия, нуклеотид за нуклеотидом (А напротив Т, G напротив C и так далее). В результате мы получаем две одинаковые двухцепочечные молекулы, которые при клеточном делении разойдутся к разным полюсам клетки и достанутся двум ее потомкам. Процесс построения осуществляет фермент ДНК-полимераза, названный так потому, что он берет одиночные нуклеотиды (мономеры) и создает из них нить (полимер).
Структура молекулы ДНК была открыта в 1953 году молекулярными биологами Фрэнсисом Криком и Джеймсом Уотсоном. В начале того же года американский химик и впоследствии лауреат двух Нобелевских премий Лайнус Полинг предложил неправильную структуру молекулы ДНК с тремя спиралями75, то есть до Уотсона и Крика структура молекулы ДНК не была очевидной даже для выдающихся ученых. Тем интереснее, что советский ученый Николай Кольцов из самых общих соображений предположил, что наследственная информация должна храниться в виде огромной молекулы, сделанной из двух зеркальных цепей, еще в 1927 году!
Совокупность молекул ДНК какого-нибудь организма называется геномом. У бактерий и архей, образующих группу прокариот – организмов, клетки которых не содержат ядра, – геном обычно представлен одной двухцепочечной молекулой ДНК, замкнутой в кольцо. Иногда у прокариот есть еще несколько дополнительных кольцевых молекул ДНК меньшего размера – плазмид. У эукариот, организмов с клеточными ядрами, к которым принадлежат растения, грибы и животные, а также некоторые одноклеточные простейшие, геном обычно больше, чем у бактерий, и представлен несколькими линейными молекулами ДНК – хромосомами.
В качестве примера рассмотрим геном человека. В его состав входят 22 неполовые хромосомы и половые хромосомы Х и Y. В большинстве наших клеток неполовые хромосомы присутствуют в двух копиях – одна достается нам от мамы, а другая от папы, то есть всего хромосом 46. У мужчин присутствует по одной копии половых хромосом – Х и Y а у женщин две Х-хромосомы. У человека изменение количества хромосом, как правило, либо несовместимо с жизнью (в большинстве случаев), либо приводит к отклонениям вроде синдрома Дауна (когда у человека три 21-х хромосомы). Чего бы там ни говорил один отечественный министр культуры, у народа России (к счастью) лишней хромосомы нет.
Кроме того, отдельный геном имеется у митохондрий – особых структур внутри наших клеток, у которых есть собственная оболочка (мембрана). Митохондрии как будто маленькие отдельные организмы, которые способны размножаться внутри клеток и имеют ряд важных функций, например производство молекул, используемых в качестве источника энергии во многих клеточных процессах.
Одинарный набор хромосом человека насчитывает примерно три миллиарда нуклеотидов, “букв" – это размер его генома. Двойной набор хромосом – это примерно шесть миллиардов нуклеотидов. Если их сшить вместе и вытянуть в нить, получится молекула длиной примерно два метра, которая тем не менее столь тонка и так плотно упакована, что помещается в клеточном ядре, размер которого всего несколько микрометров (один микрометр – это одна миллионная метра).
Наиболее изученный тип функциональных последовательностей ДНК – гены, кодирующие белки. С таких генов считывается молекула матричной РНК (мРНК) в ходе процесса, который называется транскрипция, что переводится как “переписывание". РНК, как и ДНК, состоит из четырех типов мономеров, но вместо нуклеотидов тимина (T) в состав РНК входят нуклеотиды урацила (U). Молекула мРНК – одноцепочечная, комплементарная той цепи молекулы ДНК, с которой она “переписана”. Она играет роль инструкции для синтеза какого-нибудь белка (протеина). Белки, в свою очередь, могут выполнять очень разные функции: “сшивать” клетки вместе, чтобы те образовывали ткани, осуществлять всевозможные химические превращения, регулировать работу генов и так далее.
Представьте, что у вас есть кулинарная книга (геном), которая содержит множество рецептов (генов). Вы можете сделать ксерокопии отдельных рецептов и разослать их поварам. Книга у вас одна, а копий рецептов и поваров много. Такие рецепты в данной аналогии – РНК. Ну а белки – продукт деятельности поваров: различные блюда. В клетках роль поваров выполняют структуры, называющиеся рибосомами, – молекулярные фабрики для синтеза белков. Процесс синтеза белков называется трансляцией (“переводом").
Белки, как и молекулы ДНК и РНК, являются полимерами, только белки состоят не из нуклеотидов, а из аминокислот. Последовательность аминокислот белка определяется последовательностью кодонов – троек нуклеотидов молекулы РНК, а правило соответствия кодонов аминокислотам называется генетическим кодом. Например, у большинства живых организмов кодон GCC кодирует аминокислоту аланин, а кодон AUG – метионин. Последовательность нуклеотидов AUGGCCGCC кодирует последовательность из трех аминокислот: метионин, за которым следуют два аланина.
Три нуклеотида в кодоне и четыре разные буквы генетического алфавита позволяют создать 43, или 64, разных кодона, то есть с их помощью можно закодировать 64 аминокислоты. Но в стандартном генетическом коде присутствует всего 20 аминокислот, то есть одна и та же аминокислота кодируется сразу несколькими различными кодонами. Это свойство генетического кода называется вырожденностью. Стоп-кодонов, командующих рибосоме остановить синтез белка, в стандартном генетическом коде тоже несколько, а точнее три: UGA, UAG, UAA. Слева приведена схема стандартного генетического кода. В круге первом расположены 4 возможные первые буквы кодона (A, C, U, G). Напротив каждой большой буквы расположены 4 буквы поменьше – вторые буквы кодона. В следующем круге расположены третьи буквы кодона. В четвертом круге напротив группы кодонов показана аминокислота, которую они кодируют.
Иногда в СМИ можно услышать не совсем корректное выражение “генетический код мутировал". На самом деле мутации происходят не в генетическом коде, а в молекулах ДНК, в геноме, в результате чего меняются нуклеотидные последовательности. Мутации можно сравнить с заменой буквы в отдельном слове. Например, фраза “Маша ехала на мотоцикле" превращается во фразу “Саша ехала на мотоцикле", если одна буква М “мутировала" в букву С. Изменение генетического кода намного серьезнее – это как изменение алфавита. Представим, что во всем тексте буквы М внезапно превратились в буквы К. Теперь у нас “Каша ехала на котоцикле". Понятно, что такие изменения приводят к значительным последствиям и делают практически любой достаточно длинный текст бессмысленным. Поэтому изменения генетического кода происходят крайне редко. Но происходят!
Небольшое отклонение от стандартного генетического кода есть у некоторых инфузорий. Один или даже два стоп-кодона стандартного генетического кода могут кодировать у этих одноклеточных организмов аминокислоту глутамин76, 77. В случае некоторых организмов можно сделать небольшое искусственное изменение генетического кода. Например, ученым удалось взять кишечную палочку и сделать так, чтобы один из ее трех стоп-кодонов начал кодировать аминокислоту78. Ну а в природе еще одним любопытным исключением является генетический код митохондрий, отличающийся от стандартного кода сразу несколькими кодонами. Если не учитывать митохондрии, у большинства организмов генетический код один и тот же: у человека он такой же, как у червяка, утконоса или огурца, или даже у кишечной палочки. А вот геномы у этих организмов различаются очень сильно. Тот же алфавит, но другой текст.
Но что стоит за генетическим кодом? Почему напротив того или иного кодона ставится определенная аминокислота? Аминокислоты доставляются в рибосому молекулами, которые называются транспортными РНК. К одной части транспортной РНК прикреплена аминокислота, а другая ее часть содержит нуклеотиды, комплементарные кодону, который кодирует аминокислоту. Кодоны различаются, поэтому и транспортные РНК бывают разными.