В 2010 году журнал Nature опубликовал интересную статью об эволюционном движении белков по ландшафтам приспособленности (Povolotskaya, Kondrashov, 2010). Авторы работы решили сравнить аминокислотные последовательности 572 древних белков, которые имелись уже у последнего общего предка всего живого[21] и были унаследованы его потомками, а также нуклеотидные последовательности соответствующих генов 836 прокариот (бактерий и архей). Эти белки называют древними, потому что после более чем 3,5 млрд лет эволюции в телах разнообразных потомков LUCA они до сих пор сохранили сходство своих аминокислотных последовательностей (вплоть до поразительного 40-процентного сходства рибосомных белков L14 у бактерий и архей) и продолжают выполнять те же функции, что и у Луки.
Расширение физической и белковой Вселенной. Стрела времени направлена сверху вниз. Слева: в ходе расширения физической Вселенной увеличиваются расстояния от произвольно выбранного объекта (например, Земли) до других объектов, причем скорость удаления пропорциональна расстоянию. Справа: в ходе расширения «белковой вселенной» дочерние молекулы удаляются в пространстве последовательностей от исходной точки, которая соответствует одному из белков LUCA. При этом дистанции между произвольно выбранным объектом (например, белком, принадлежащим эволюционной линии, которая привела к кишечной палочке E. coli) и другими объектами (родственными белками других эволюционных линий) постепенно растут. Однако белки с данной функцией не могут выйти за пределы «своей» подобласти в пространстве последовательностей – иначе это будет уже другой белок, выполняющий другую функцию (эволюционные события, связанные со сменой функции белка, в обсуждаемой работе не рассматриваются). Границы этой функциональной области показаны внутренним кругом. Рано или поздно расходящиеся белки достигнут этой границы, и дальнейшее расхождение станет невозможным. Стрелочками показано направление движения белков в пространстве последовательностей. По рисунку из Povolotskaya, Kondrashov, 2010.
Для начала Поволоцкая и Кондрашов решили выяснить, достигли уже эти белки максимального расхождения в пространстве последовательностей или их расхождение (накопление различий) все еще продолжается. Сохранение сходства после 3,5 млрд лет независимой эволюции, казалось бы, говорит о том, что возможности изменения этих белков ограниченны. Можно предположить, что области в пространстве последовательностей, соответствующие их функциям, невелики и предел расхождения давно достигнут. Но возможно и другое объяснение. Эти области могут быть велики, но труднопроходимы. Например, они могут представлять собой лабиринт из узких хребтов, разделенных пропастями, и поэтому на «освоение» всего доступного пространства не хватило миллиардов лет, прошедших со времен LUCA.
Исследователи проводят аналогию между эволюцией белков и расширением Вселенной. Эдвин Хаббл обнаружил, что галактики удаляются друг от друга, причем расстояние между галактиками положительно коррелирует со скоростью их разлетания. Экстраполируя эту тенденцию в прошлое, Хаббл пришел к выводу, что разлетание должно было начаться из одной точки. Эта идея легла в основу теории Большого взрыва. Нечто подобное происходит и с белками, расходящимися от общего предка – исходного белка с данной функцией, который был закодирован в геноме LUCA.
Принцип анализа белковых последовательностей, примененный Поволоцкой и Кондрашовым. Использовались четверки гомологичных белков, родственные отношения между которыми изображены в виде дерева. Анализ такой четверки позволяет понять, растет или снижается сходство между первыми двумя белками и четвертым. В данном случае считается, что у первого белка «предковая» (имеющаяся у белков 2 и 3) аминокислота R в 11-й позиции (выделена жирным шрифтом) заменилась на E, что привело к росту сходства первого белка с четвертым, т. е. к их сближению в пространстве последовательностей. У второго белка «предковая» аминокислота K в 3-й позиции (выделена полужирным шрифтом) заменилась на Y, что привело к снижению сходства второго белка с четвертым, т. е. к их расхождению в пространстве последовательностей. По рисунку из Povolotskaya, Kondrashov, 2010.
Чтобы выяснить, закончилось ли уже расширение «вселенной древних белков» или оно продолжается до сих пор, авторы применили оригинальные методы анализа белковых последовательностей. Нам будет полезно с ними ознакомиться – хотя бы для того, чтобы понять логику биоинформатики, молодой науки, занимающейся сравнением и осмыслением генетических текстов.
Использовались четверки гомологичных (происходящих от одного предка) и выполняющих одну функцию белков. Первые два белка в каждой четверке – это близкородственные молекулы с похожими аминокислотными последовательностями. Эти два белка назывались «сестринскими», и именно их эволюция анализировалась в рамках данной четверки.
Третий белок отличался от сестринских белков сильнее, чем они друг от друга. Он выполнял роль «внешней группы», позволяя понять, какие аминокислотные замены произошли в первом, а какие во втором сестринском белке. Например, если у внешнего белка в данной позиции стоит аминокислота K (лизин) и такая же аминокислота стоит здесь у первого из двух сестринских белков, а у второго в этом месте находится другая аминокислота (например, Y – тирозин), то считалось, что K в данной позиции – это «предковое», исходное состояние, а у второго сестринского белка произошла замена K на Y.
К этим трем белкам добавлялся четвертый, еще более далекий от сестринских, чем третий. Если у четвертого белка в данной позиции стоит аминокислота K (как на рисунке), то делался вывод, что у второго сестринского белка произошло эволюционное изменение, увеличившее дистанцию между белками 2 и 4: белки разошлись. Если бы у четвертого белка здесь стояла аминокислота Y, то был бы сделан вывод, что в результате изменения, затронувшего белок 2, белки 2 и 4 сблизились.
В общей сложности было обработано 13,6 млн таких четверок. Для каждой четверки определялось число замен, ведущих к сближению последовательностей и к их расхождению. По соотношению этих двух величин можно понять общую тенденцию: расходятся ли белки, сближаются или балансируют вокруг некого постоянного уровня сходства последовательностей.
Оказалось, что даже у наиболее удаленных друг от друга гомологичных белков тенденция к расхождению значительно преобладает над тенденцией к сближению. Следовательно, «вселенная древних белков» продолжает расширяться и пределы областей, соответствующих их функциям, за 3,5 млрд лет так и не были достигнуты. Эволюция этих белков была крайне медленной. Что же ее сдерживало? Решению этой проблемы посвящена вторая часть статьи, приводящая на память другой рассказ Борхеса – «Сад расходящихся тропок».
Обычного отрицательного отбора, отсеивающего вредные мутации, явно недостаточно для того, чтобы объяснить медленную эволюцию древних белков. Предположение о том, что каждая аминокислота, стоящая в данной позиции, влияет на приспособленность одинаковым образом независимо от «контекста» (т. е. от того, какие аминокислоты стоят в других позициях в том же белке или в других белках, взаимодействующих с ним), соответствует представлению о легкопроходимом ландшафте приспособленности (см. рисунок ниже). Но со времен LUCA в каждом синонимичном сайте (так называют те нуклеотиды в цепи ДНК, изменение которых не влияет на структуру кодируемого белка) произошло уже свыше 100 замен. Синонимичные нуклеотидные замены – это пример движения по ровным горизонтальным поверхностям ландшафта приспособленности. Из этого следует, что в случае хорошей проходимости ландшафта изучаемые белки давным-давно должны были освоить всю потенциально доступную им область в пространстве последовательностей, и тогда мы не наблюдали бы их продолжающегося расхождения.
Резко уменьшить проходимость ландшафта приспособленности – превратить его в лабиринт узких тропок или горных хребтов – может эпистаз. Так называют взаимное влияние разных мутаций (аллелей) на вредность или полезность друг друга. Замена одной аминокислоты может менять эффективность работы белка не сама по себе, а в зависимости от комбинации других аминокислот, занимающих определенные позиции в том же белке. Также эффект мутации может зависеть от других белков, находящихся в непосредственном взаимодействии с белком-мутантом. Иными словами, для определения смысла биологического текста важен контекст. В этом и состоит суть эпистаза. Мы еще не раз встретимся с этим явлением в последующих главах.
Наличие эпистаза предполагает, что многие аминокислотные замены являются допустимыми только в определенном окружении. Если окружение (контекст) неподходящее, то данная замена будет снижать приспособленность, и отбор ее выметет. Это явление в эволюции белков изучалось ранее на конкретных примерах[22]. Если эпистаз широко распространен, белок может добраться до многих потенциально достижимых пунктов в пространстве последовательностей только долгим обходным путем.
Для проверки гипотезы о действенности эпистаза в эволюции белков Поволоцкая и Кондрашов придумали хитроумный тест, основанный на сопоставлении темпов накопления «сближающих» и «разводящих» мутаций с дистанциями между белками. Основная идея состояла в том, что гипотезы о наличии и отсутствии эпистаза дают противоположные предсказания о частоте закрепления сближающих и разводящих мутаций. Если влияние эпистаза невелико, то у двух близких белков темп накопления разводящих мутаций должен быть высоким, а по мере расхождения последовательностей он должен снижаться (если ландшафт приспособленности легкопроходимый, то белки сначала свободно и быстро «блуждают» по ровному плато, соответствующему данной функции, уходя все дальше от исходной точки, но по мере приближения к его краям их расхождение замедляется). Темп накопления сближающих мутаций при этом должен оставаться примерно постоянным. Если же эпистаз оказывает сильное влияние на эволюцию белков, все должно быть наоборот: разводящие мутации должны накапливаться с примерно постоянной скоростью, а темп накопления сближающих мутаций по мере расхождения белков должен снижаться.
Пространство последовательностей можно изобразить в графа, вершины которого соответствуют разным последовательностям (в данном случае показаны последовательности из двух нуклеотидов), а ребра – единичным эволюционным событиям (нуклеотидным заменам). В первом случае (a) ландшафт приспособленности представляет собой сплошное ровное плато: все 16 последовательностей имеют одинаково высокую приспособленность и все возможные мутации разрешены (не будут отбракованы отбором). Два кратчайших пути, соединяющие последовательности AT и GC, состоят всего из двух мутационных шагов (жирные стрелки). Во втором случае (б) половина последовательностей имеют пониженную приспособленность (отмечены жирными кругами). При этом снижение приспособленности определяется не конкретным нуклеотидом в конкретной позиции, а уникальной комбинацией обоих нуклеотидов (т. е. имеется эпистаз). Это резко снижает проходимость ландшафта: число доступных траекторий уменьшается и кратчайший путь между двумя пунктами (например, от AT к GC) удлиняется. В третьем случае (в) тоже половина последовательностей имеют пониженную приспособленность, но эпистаза нет: нуклеотиды A и G во второй позиции снижают приспособленность независимо от состояния первой позиции. Отсутствие эпистаза способствует тому, что ландшафт остается легкопроходимым, и от AT к GC можно прийти всего за два шага, как и в первом случае. По рисунку из Povolotskaya, Kondrashov, 2010.
О проекте
О подписке