У всей жизни один общий предок, но часть наших генов старше него: что происходило на Земле до LUCA
Около четырех миллиардов лет назад на Земле существовал микроорганизм, от которого берут начало все ныне живущие формы жизни — от мельчайших бактерий до человека. В эволюционной биологии этот организм известен как Последний универсальный общий предок, или LUCA (Last Universal Common Ancestor). Долгое время филогенетика — наука, изучающая эволюционные взаимосвязи видов — считала LUCA абсолютным пределом своих возможностей. Традиционные методы анализа генетических последовательностей не позволяли заглянуть в прошлое дальше этой точки, поскольку все современные гены неизбежно сходятся к единому корню, которым и является геном LUCA.
Однако детальные реконструкции генома этого общего предка выявили серьезную проблему для понимания ранней эволюции. LUCA совершенно не был похож на примитивную первую форму жизни. Анализ показывает, что он представлял собой сложнейшую клеточную систему. Этот организм обладал функциональной мембраной, хранил генетическую информацию в виде ДНК, имел полноценный аппарат для трансляции белков (включая рибосомы) и использовал протонные градиенты для синтеза энергии с помощью фермента АТФ-синтазы.
Наличие столь сложной молекулярной архитектуры означает, что огромная часть фундаментальной эволюции жизни произошла до появления LUCA. Возникновение генетического кода, формирование клеточной оболочки, развитие механизмов копирования информации — все это случилось в эпоху, от которой не осталось ни прямых потомков, ни окаменелостей.
Чтобы преодолеть этот барьер и изучать биологию пре-LUCA периода, исследователи обратились к механизму генной дупликации и специфическому классу белков, которые называются универсальными паралогами.
Механика копирования и эволюционное время
Эволюция крайне редко создает новые функции с нуля. Чаще всего инновации возникают благодаря ошибкам при копировании генетического материала. В процессе деления клетки участок ДНК может случайно удвоиться. В результате организм получает две идентичные копии одного и того же гена.
Дальнейшая судьба этих копий различается. Первый ген продолжает выполнять свою первоначальную функцию, обеспечивая выживание организма. Вторая копия, поскольку первая уже справляется с работой, оказывается свободна от жесткого эволюционного давления. Она может накапливать мутации, менять свою структуру и со временем приобретать совершенно новые функции (этот процесс называется неофункционализацией) или брать на себя часть обязанностей исходного гена (субфункционализация). Родственные гены, возникшие в результате такого удвоения внутри одного генома, биологи называют паралогами.
Дупликация генов — явление массовое. В геноме современного человека около 70% генов имеют пару, у бактерий этот показатель доходит до 40-50%. Геном LUCA также подчинялся этому правилу.
Универсальные паралоги — это редкие семейства генов, чье изначальное удвоение произошло до формирования LUCA. Логика этого метода элегантна и строга. Если некий ген удвоился в пре-LUCA эпоху, то сам LUCA уже содержал в своей ДНК две разные, специализирующиеся версии этого гена (Паралог 1 и Паралог 2). Когда LUCA дал начало всем современным формам жизни (бактериям и археям, от которых позже произошли эукариоты), каждый из новых видов унаследовал обе копии.
Если сегодня исследователи секвенируют эти гены у множества современных организмов и построят их филогенетическое древо, оно будет кардинально отличаться от стандартного древа видов. Вместо того чтобы сойтись в одной точке, древо универсальных паралогов разделится на две массивные суб-ветви. На вершине первой суб-ветви будет находиться узел, представляющий Паралог 1 в геноме LUCA. На вершине второй суб-ветви — узел, представляющий Паралог 2.
Самое важное скрыто в линии, которая соединяет эти два узла LUCA. Эта ветвь уходит еще глубже в прошлое, к моменту первичной дупликации гена. Именно этот отрезок филогенетического древа предоставляет физическую возможность реконструировать эволюционные события, происходившие до появления последнего общего предка.
Архитектура древнейшей жизни
На сегодняшний день достоверно идентифицировано лишь небольшое количество универсальных паралогов. Большинство из них обслуживают самые древние и критически важные системы клетки: трансляцию белков, метаболизм аминокислот и мембранный транспорт. Детальный анализ этих белков уже позволил сделать несколько важных открытий о том, как функционировала жизнь до LUCA.
1. Эволюция генетического кода. В современных клетках за правильное считывание генетического кода отвечают ферменты аминоацил-тРНК-синтетазы. Их задача — присоединить конкретную аминокислоту к соответствующей транспортной РНК. Исследователи реконструировали последовательность предка нескольких таких синтетаз, существовавшего до LUCA. Оказалось, что древний фермент не обладал современной точностью: он не мог различить похожие друг на друга аминокислоты — лейцин, изолейцин и валин. Это доказывает, что ранний генетический код был менее специфичным. Кроме того, анализ показал статистически значимое отсутствие аминокислоты триптофан в предковых последовательностях. Триптофан был включен в биологический оборот на самых поздних стадиях пре-LUCA эволюции.
2. Белки широкого профиля. В современном аппарате синтеза белка фактор инициации IF2 отвечает за связывание стартовой РНК и соединение частей рибосомы, а фактор элонгации EF-Tu контролирует дальнейшее продвижение процесса и исправление ошибок. Это два разных инструмента. Реконструкция их общего пре-LUCA предка показала, что до дупликации это был единый фермент-генералист. Он был способен выполнять обе функции, хотя, вероятно, с меньшей эффективностью. Лишь после удвоения гена копии разделили обязанности, что привело к повышению точности синтеза белка у LUCA.
3. Подтверждение клеточной структуры. Долгое время в научном сообществе шли дискуссии о том, был ли LUCA полноценной клеткой, или жизнь на том этапе представляла собой химические процессы на поверхности минералов. Изучение паралогов сигнал-распознающей частицы (SRP) и ее рецептора — системы, которая распознает определенные белки и встраивает их в мембрану, — поставило точку в этом споре. Реконструкция показала, что способность транспортировать белки через мембрану сформировалась до разделения линии LUCA. Следовательно, клеточная организация и сложные мембранные структуры существовали задолго до появления последнего общего предка.
Ограничения метода и технологический скачок
Несмотря на информативность универсальных паралогов, их поиск крайне затруднен. За миллиарды лет эволюции гены подвергаются колоссальным изменениям. Существует три главных препятствия, из-за которых мы видим лишь малую часть пре-LUCA генома.
Первое — потеря генов. В ходе эволюции многие виды утрачивают одну из копий паралога, если она перестает быть жизненно необходимой в их среде обитания. Второе — горизонтальный перенос генов. Бактерии и археи способны обмениваться участками ДНК напрямую. Если чужеродный ген вытесняет исходный (это называется неортологичным замещением), истинная эволюционная история стирается. Третье — сверхвысокая дивергенция последовательностей. Из-за быстрых темпов эволюции последовательность аминокислот в родственных белках у современных видов может различаться настолько, что статистические алгоритмы перестают распознавать их родство.
Однако развитие вычислительной биологии в последние годы меняет ситуацию. Исследователи научились обходить проблему расхождения аминокислотных последовательностей, ориентируясь на пространственную структуру белков. В ходе эволюции трехмерная форма белка сохраняется гораздо дольше, чем его химический текст.
Интеграция методов реконструкции предковых последовательностей с современными системами предсказания фолдинга белков на базе искусственного интеллекта (такими как AlphaFold) позволяет оценивать структурные вариации целых белковых линий. Это дает возможность находить глубокие эволюционные связи, которые раньше игнорировались алгоритмами. Кроме того, появление новых аппаратных технологий, включая специализированные ИИ-чипы и квантовые процессоры, делает возможным точное молекулярно-динамическое моделирование сложных биомолекулярных систем древности.
От филогенетики к синтетической биологии
Сегодня ученые не только рассчитывают предковые последовательности на компьютерах, но и физически синтезируют эти давно исчезнувшие ДНК в лабораториях. Воскрешенные белки внедряются в современные бактерии для проверки их кинетики и работоспособности. Выясняется, что реконструированные пре-LUCA ферменты способны успешно взаимодействовать с современными рибосомами.
Это открывает совершенно новое направление в биоинженерии. Доступ к каталогу белков, которые выполняли фундаментальные каталитические функции четыре миллиарда лет назад, расширяет известный функциональный репертуар жизни. Древние ферменты развивались в условиях экстремальных температур и иного химического состава океанов, что делает их структуру крайне стабильной. Вычислительная реконструкция и последующий лабораторный синтез таких молекул предоставляют исследователям новые, недоступные в современной природе катализаторы для использования в биотехнологическом производстве, фармакологии и синтетической биологии. Анализ самого далекого прошлого становится инструментом для проектирования технологий будущего.
Источник:Cell Genomics
















