Чем занимались биологи в 2023 году
Генетика
Человеческому геному добавили подробностей
Как известно, геном человека прочитали к 2004 году. Однако в нём довольно долго оставались белые пятна — то были участки хромосом, может быть, не самые важные с точки зрения генетической информации, но которые всё же надо было дочитать. Белые пятна закрыли к 2022 году, о чём журнал «Наука и жизнь» писал в прошлогоднем обзоре. Так о каких подробностях речь, геном ведь дочитали? Тут нужно уточнить, что называют прочитанным геномом. Например, взяли ДНК у конкретного человека и прочитали её, то есть просеквенировали последовательность азотистых оснований (генетических букв) во всех хромосомах. Получили прочитанный геном — но геном именно этого человека. Однако люди отличаются друг от друга: по внешности, по физиологии, по интенсивности биохимических реакций. Не все, но многие из этих отличий коренятся в ДНК. Если сравнить геномы любых двух человек, то примерно 0,4% всей ДНК-последовательности у них будут разными.
Поэтому когда говорят о прочитанном геноме не конкретного человека, а человека вообще, имеют в виду референсный геном. Он не соответствует никакой индивидуальной ДНК. Это массив данных, в котором записаны варианты последовательностей в том или ином фрагменте генома, встречающиеся у разных людей. Можно подумать, что для референсного генома нужно прочесть ДНК всего человечества, но это не так. Наши бесконечно разнообразные индивидуальные отличия есть результат сложившейся мозаики многих участков генома. Да, генетические буквы в генах могут меняться одна на другую, но, во-первых, букв всего четыре, а во-вторых, если речь о здоровых вариантах гена, то далеко не во всей последовательности они могут варьировать. Кое-где замены букв (или какие-то другие виды мутаций) дадут такой вариант гена, с которым человек просто не выживет.
В любом случае, чтобы поймать все здоровые вариации человеческого генома, нужна ДНК не от одного человека, а от нескольких десятков или даже сотен. Эту работу ведут давно, и референсный геном уже есть. Однако насколько он полон? ДНК для референсного генома брали более чем у шестидесяти человек, но вариации искали не во всём геноме, а в конкретных зонах. То есть, можно сказать, что где-то референсный геном был очень референсным, а где-то не очень.
Кроме того, частичная референсность генома связана с тем, что ДНК брали у людей преимущественно европейского происхождения. Если же нужен здоровый геном во всём его разнообразии, требуется ДНК разных этнических групп. Дело не в разнообразии как таковом, а в том, что народы перемешиваются, и чем дальше, тем активнее, и у конкретного человека в геноме могут оказаться варианты с противоположных концов мира.
Ещё одна причина неполной референсности заключается в технических ограничениях. Хромосомную ДНК от начала до конца за один раз никто не секвенирует. Её дробят на много коротких отрезков, читают их, а потом с помощью сложных алгоритмов определяют, где какой отрезок стоит в хромосоме. Отрезки получаются отчасти перекрывающиеся друг с другом, и все перекрытия видны в последовательностях генетических букв. Но в геноме есть длинные повторяющиеся куски, которые трудно правильно прочесть. Например, бывает так, что какая-то область в геноме удвоилась (дуплицировалась) и в одной из копий появились небольшие отличия от другой. Чтобы отличить копии друг от друга, каждую нужно прочесть за один раз без разрывов, без разрезания на маленькие фрагменты. Если их разрезать, прочесть отрезки, а потом попробовать смонтировать из них одну большую область, то обе копии в момент сборки генома сольются в одну.
До поры до времени читать непрерывно длинные куски генома было технически невозможно. В конце концов эту трудность преодолели, и благодаря «длинному чтению» удалось дочитать геном до конца и увидеть вариации в повторах. Чтобы повысить общую референсность генома, международный исследовательский консорциум прочитал ДНК у сорока семи человек с разных континентов; результаты были опубликованы весной прошлого года в нескольких статьях в «Nature», «Genome Research», «Nature Biotechnology» и «Nature Methods».
Общечеловеческий геном не только стал выглядеть полнее, новые данные выявили некоторые подробности, относящиеся к человеческой эволюции — в частности, к эволюции мозга. У живых существ гены нередко удваиваются, и новая копия становится эволюционным испытательным полигоном, накапливая мутации и меняя функции. Однако у человека есть несколько десятков генов, которые мало менялись после удвоения. Такие гены оказались связаны с увеличением мозга. В ходе естественного отбора преимущество оказалось у тех из наших предков, чей мозг был крупнее. От генома потребовалось усилить функционирование соответствующих генов, не меняя их сущность, — то есть генов должно было стать больше, но выполнять они должны были ту же самую работу, что и прежде.
Проект «референсизации» человеческого генома ещё не закончен: к середине 2024 года исследователи собираются довести число прочитанных геномов до трёхсот пятидесяти.
Y-хромосому дочитали до конца
Человеческий «игрек» дочитали в рамках всё того же длящегося проекта по ликвидации белых пятен и повышению референсности генома, но результаты, которые получились, всё же стоят несколько особняком. Особенности Y-хромосомы описаны в статье в журнале «Nature», опубликованной в конце прошлого лета сотрудниками Консорциума по изучению структурных вариантов генома человека (Human Genome Structural Variation Consortium). Оказалось, что Y-хромосома необычайно разнообразна. На ней находятся гены TSPY и TSPY2, влияющие на формирование сперматозоидов. У них много копий — по несколько десятков, и их число меняется от человека к человеку. Например, у кого-то может быть тридцать девять копий TSPY, у кого-то — двадцать три, а ещё у кого-то — тридцать.
В геноме, кроме «осмысленных» участков, кодирующих белки и служебные РНК, есть зоны, которые ничего не кодируют. Они бывают очень большими, состоят из множества повторов и выполняют некоторые важные функции. (Например, из бессмысленных повторов состоят центромеры и теломеры: от первых зависит расхождение хромосом по дочерним клеткам во время деления, от вторых — само число клеточных делений.) Выяснилось, что некодирующие зоны у разных мужчин отличаются на миллионы генетических букв. В то же время у отдельного человека размер такой некодирующей зоны может уменьшаться с возрастом. Зависит ли как-то жизнь мужчин от «игрекового» разнообразия, пока что не очень ясно.
Закончив полностью чтение Y-хромосомы, исследователи обнаружили, что фрагменты из неё есть в последовательностях многих бактериальных геномов, которые давно прочитаны и хранятся в базах данных. Дело в том, что образцы бактерий для чтения генома часто брали от людей. Вместе с бактериальной ДНК в процедуру секвенирования попадала и человеческая. Ту человеческую ДНК, из которой состоят другие наши хромосомы, можно было быстро отличить от бактериальной — потому что почти все наши хромосомы были давно и хорошо прочитаны. Ну а «игрек» так и оставался «полусырым». Биоинформатические алгоритмы, собирая бактериальный геном, вставляли «игрек»-фрагменты в бактериальную ДНК, туда, где их можно было смонтировать с соседними бактериальными последовательностями. Судя по базе данных бактериальных геномов, Y-хромосома «наследила» в геномах примерно 5 тысяч видов — но теперь её, конечно, оттуда быстро вычистят. Значимость работы над ошибками не стоит недооценивать: на геномные базы данных опираются исследователи из самых разных научных областей, начиная от тех, которые занимаются эволюционно-теоретическими вопросами, и заканчивая теми, кто ищет новые антибиотики.
Звериные гены
Ещё одно заметное событие, связанное с анализом больших массивов генетических данных, — опубликованные в журнале «Science» одиннадцать статей международного проекта «Зоономия» (Zoonomia Project). В статьях описаны результаты сравнительного анализа геномов 241 вида млекопитающих. У млекопитающих много общего, иначе бы их не объединяли в один биологический класс: они вскармливают детёнышей молоком, на теле у них растёт шерсть, у них очень острое обоняние и т. д. Но у кого-то шерсти много, у кого-то мало, у кого-то нос более чуткий, у кого-то менее, кто-то научился летать, кто-то способен жить в воде. Про мозг и говорить не стоит: есть большой и сложный человеческий мозг, и есть маленький мышиный, на котором вообще нет извилин.