Десять значимых событий 2021 года в биологии и медицине
Значимые научные события — это те, что заставляют нас иначе посмотреть на мир, которые ведут к развитию новых технологий, меняющих жизнь. Это итог многолетних трудов множества исследователей, занимающихся фундаментальными научными проблемами. Именно поэтому, как и год назад, в выбранных редакцией значимых научных событиях нет ничего, связанного с коронавирусом. Да, затянувшаяся эпидемия COVID-19 сильнейшим образом повлияла на нас, но она — подчеркнём это вновь — не дала нам никаких принципиально новых знаний ни о вирусах, ни о вызываемых ими болезнях. Лекарства и вакцины, которые используют против COVID-19, были разработаны давно, и пока что мы видим только их модификации, приспособленные к нынешней эпидемии. Впрочем, если говорить о вакцинах, то в минувшем году была опубликована научная работа, которая предлагает новый метод создания противовирусных вакцин — и вполне возможно, что этот метод поможет решить проблему любых вирусных инфекций. С него и начнём.
1Искусственный интеллект проектирует вакцину по лингвистическим правилам
Смысл любой вакцины — показать иммунитету, с чем ему предстоит бороться в будущем. «Действующее вещество» вакцины — это либо обезвреженный возбудитель болезни, либо его фрагменты, то есть молекулярные комплексы, отдельные молекулы или обломки молекул. Иммунитет чувствует чужеродные молекулы не целиком. Если говорить о белках, то и иммунные клетки, и антитела реагируют только на отдельные участки в огромных белковых молекулах. И если мы создаём вакцину против вируса, то она должна показать иммунитету определённый участок какого-либо вирусного белка, по которому иммунитет узнает потом настоящий вирус.
Проблема в том, что некоторые вирусы сильно мутируют. Вирусные белки устроены так, что вирусы могут позволить себе довольно существенные изменения в них, притом что белки будут продолжать работать, как надо. Но для иммунитета это катастрофа: вот только иммунные клетки запомнили, как выглядит тот или иной вирусный белок, какие антитела против него работают, как он уже изменился. Примеры сильно меняющихся вирусов — ВИЧ, против которого до сих пор нет вакцины, и вирус гриппа, вакцину против которого приходится регулярно модифицировать, подгоняя под новый штамм.
Однако даже в очень изменчивых вирусных белках есть зоны, не приспособленные к мутациям: если там что-то изменить, весь белок выйдет из строя. Такие неприкосновенные участки со временем тоже меняются, но очень медленно. Если бы мы умели находить в вирусных белках такие зоны, которые вирусы не способны менять, то можно было бы создать эффективные вакцины даже против очень изменчивых вирусов. Но как их искать? Сотрудники Массачусетского технологического института воспользовались для этого вычислительным методом, применяемым в обработке естественного языка — так называют большое направление искусственного интеллекта и математической лингвистики. Методы обработки естественного языка анализируют, насколько часто те или иные слова стоят рядом друг с другом. Если машина будет знать частоту совместного употребления слов, она сможет более или менее правильно дополнить недописанное предложение. Например, представим, что во фразе «мама мыла раму» нет слова «мыла». Искусственный интеллект, обученный методами обработки естественного языка, подставит туда глагол «красила» или «мыла», или, в конце концов, «ремонтировала» — но там не будет стоять слов «ела», «говорила» или «думала».
Те же принципы использовали при анализе генетических последовательностей, кодирующих вирусные белки. В белке есть зоны, которые могут меняться, но при этом сам белок остаётся «осмысленным», то есть функциональным. И есть зоны, изменения в которых «обессмысливают» молекулу. Машинный алгоритм тренировали искать те участки в вирусных белках, которые способны сильно меняться, для чего использовали 60 тысяч последовательностей от ВИЧ, 45 тысяч последовательностей от вируса гриппа и 4 тысячи коронавирусных последовательностей. (На всякий случай уточним, что это не значит, что у ВИЧ есть 60 тысяч белков, просто один и тот же белок кодируется последовательностью, которая допускает множество мутаций в разных комбинациях.) Смысл обучения был в том, чтобы искусственный интеллект смог потом уже в незнакомом белке отличить неприкосновенные последовательности от свободно мутирующих.
После обучения машине предложили проанализировать три белка от ВИЧ, вируса гриппа и коронавируса SARSCoV-2. В статье в журнале «Science», опубликованной в январе прошлого года, говорится, что в каждом из трёх белков алгоритм нашёл наименее изменчивые части, которые могли бы стать материалом для эффективной долгоиграющей вакцины. Иммунитет, натренированный узнавать малоизменяемые фрагменты вирусных белков, будет уничтожать вирусы вне зависимости от того, какие мутации появились у них в изменяемых частях.
На самом деле такие выгодные мишени в белках вируса гриппа и ВИЧ ищут давно. Результаты машинного поиска вполне согласуются с теми результатами, которые здесь уже есть. Но в данном случае речь о том, чтобы создать метод проектирования вакцин, который работал бы как можно быстрее и с наибольшей эффективностью — не говоря уже о том, что использование приёмов математической лингвистики в биотехнологии само по себе кажется весьма примечательным.
2Альтернативный генетический алфавит и альтернативный генетический код
Генетический алфавит — это буквы А, Т, G, C, обозначающие азотистые основания аденин, тимин, гуанин, цитозин, которые входят в состав ДНК. (В РНК тимин Т заменён на урацил U.) Тройки букв образуют генетические слова — триплеты, или кодоны, соответствующие разным аминокислотам. В двуцепочечной молекуле ДНК буквы двух цепочек связаны друг с другом водородными связями, причём А всегда стоит напротив Т — между ними образуются две водородные связи, а G стоит напротив С — между ними образуются три водородные связи.
У генетических букв могут быть разнообразные химические модификации, но в любом случае число связей в паре остаётся одно и то же. Однако ещё в 1977 году исследователи из Московского государственного университета опубликовали в журнале «Nature» статью, в которой описывали странную ДНК бактериофага S-2L, поражающего цианобактерий. У этого бактериофага в паре с тимином (Т) стоял не аденин (А), а другое азотистое основание под названием 2-аминоаденин, которое для краткости назвали Z. Между Z и Т было не две водородные связи, а три. Не все тимины в ДНК фага были в паре с Z, но большинство. И, учитывая тройную связь между ними, всё выглядело так, как будто вирус использовал альтернативную версию генетического кода.
До поры до времени бактериофаг S-2L считался просто странной аномалией, уникальной в своём роде. Но на самом деле альтернативный алфавит оказался гораздо более распространён, чем могло показаться на первый взгляд. У фага S-2L есть особый фермент, который участвует в синтезе аденина и который создаёт вариант Z. Потом оказалось, что похожий фермент есть у фага, поражающего бактерий рода Vibrio, и в ДНК этого вируса тоже есть нестандартная генетическая буква.
В прошлом году сотрудники Института Пастера (Франция) вместе с коллегами из Германии, Бельгии и США опубликовали в «Science» две статьи: в первой описываются структура и функции фермента из фага бактерий Vibrio, создающего основание Z, во второй — гены альтернативных вирусных ДНК-полимераз. Эти белки нужны для копирования ДНК, они синтезируют новые цепи ДНК на шаблоне старых. Альтернативные ДНК-полимеразы, как можно догадаться, умеют манипулировать не только обычными генетическими буквами, но и нестандартной буквой Z.
Наконец, в третьей статье в «Science» говорится, что белки, необходимые для работы с азотистым основанием Z, есть как минимум у нескольких десятков бактериофагов. Более того, некоторые вирусы перенастраивают бактериальные ферменты, чтобы они помогали синтезировать Z, а специальные вирусные белки понижают уровень «стандартной» буквы А в бактериальной клетке, чтобы она не попала в их геном. Эту статью написали сотрудники Тяньцзиньского университета и других научных центров Китая, США и Сингапура, при участии Ивана Худякова из Всероссийского научно-исследовательского института сельскохозяйственной микробиологии (он был одним из соавторов статьи в «Nature» о необычном геноме фага S-2L).
Зачем вирусам понадобился изменённый генетический алфавит? Дело в том, что у бактерий есть особые ферменты, которые защищают их от вирусного вторжения. Когда в бактериальной клетке появляется фаговая ДНК, эти ферменты её узнают и разрушают. Но если в фаговой ДНК вместо буквы А стоит буква Z, то бактериальные защитные ферменты оказываются бессильны и вирус может спокойно размножаться дальше.
Кроме альтернативного алфавита, может быть и альтернативный код. Напомним, что код — это система триплетов, буквенных троек, кодирующих аминокислоты. Последовательность триплетов в гене соответствует последовательности аминокислот в белке, и когда белоксинтезирующая машина считывает код белка, она считывает его по тройкам. При синтезе белка нужно знать, где начинать и где заканчивать, поэтому кроме кодонов, кодирующих аминокислоты, есть ещё старт- и стоп-кодоны. Старт-кодоны дают сигнал начать синтез белка, одновременно они обозначают аминокислоту метионин. Стоп-кодоны дают сигнал закончить синтез белка и никаких аминокислот не обозначают.
Какое-то время код считался универсальным в том смысле, что у всех живых организмов аминокислоты кодируются одними и теми же кодонами. Но потом выяснилось, что в генетическом коде есть вариации. Особняком стоит код митохондрий (энергетических клеточных органелл, у которых есть своя ДНК). Отклонения от стандартных значений триплетов есть у некоторых архей и бактерий — обычно у них используются альтернативные старт-кодоны, а некоторым стоп-кодонам присвоена какая-нибудь аминокислота (и наоборот — аминокислотный триплет становится стоп-сигналом).
Но есть и более выдающиеся примеры: в ноябрьской статье в журнале «eLife» говорится, что у двенадцати микроорганизмов аминокислотные кодоны сменили значение с одной аминокислоты на другую. Иными словами, если в стандартном коде какому-нибудь триплету соответствует одна аминокислота, например аргинин, то в альтернативном коде тому же триплету соответствует аминокислота триптофан. Очевидно, некоторым бактериям и археям как-то удалось изменить стандартный генетический код, хотя как именно это происходило в эволюции, понять довольно трудно. Может быть, альтернативные версии генетического кода какое-то время развивались вместе со стандартной версией, а может быть, они возникли как модификация стандарта.