Редактор для генома
Нобелевскую премию по химии 2020 года присудили «за разработку метода редактирования генома». Лауреатами стали Эммануэль Шарпантье из Института инфекционной биологии Общества Макса Планка (Берлин, Германия) и Дженнифер Даудна из Калифорнийского университета (Беркли, США). Метод (или систему) редактирования генома CRISPR-Cas9 специалисты называют методом молекулярных ножниц. Так что это такое?
Любой геном можно сравнить с текстом. Или с книгой — так даже нагляднее: есть книги потолще, есть книги потоньше, есть сложные, есть простые. В книге буквы соединены в слова. Азотистые основания, из которых состоит ДНК, называют генетическими буквами — это аденин (А), тимин (Т), гуанин (G) и цитозин (C). И они тоже складываются в «слова» — соединяясь по три, азотистые основания кодируют аминокислоты. А «слова»-тройки складываются в предложение — последовательность большой белковой молекулы, состоящей из множества аминокислот.
Как и в любом тексте, в геноме тоже случаются ошибки, которые называют мутациями. Большинство мутаций ни на что не влияют. Случаются мутации, которые приносят пользу. И есть мутации, которые вредны. Если ошибки-«мутации» происходят в обычном тексте, их исправят корректоры и редакторы. У живых клеток тоже есть свои корректоры и редакторы, исправляющие погрешности в ДНК — специальные ферменты, входящие в так называемые системы репарации (за расшифровку механизмов ДНК-репарирующих систем в 2015 году дали Нобелевскую премию по химии). Но они не всегда исправляют то, что нужно исправить. Может, стоило бы сконструировать какой-нибудь молекулярный редактор, который мы запускали бы в клетку, и он исправлял бы в ней нежелательные мутации?
Метод CRISPR-Cas9 — как раз один из таких редакторов. В последние годы о нём говорят и пишут чрезвычайно много. Может показаться, будто это единственный метод редактирования генома. На самом деле нет: идея переписывать генетический текст в ДНК возникла давно, и по мере развития молекулярной биологии стали появляться соответствующие экспериментальные техники. Но по-настоящему совершенный метод редактирования генома должен быть точным, универсальным и удобным. Точный метод будет вносить правки только туда, куда нужно, без непредсказуемой самодеятельности. Универсальность означает, что можно выбрать для правки любое место в любой хромосоме. А удобство означает скорость и простоту в обращении. CRISPR-Cas9 не абсолютно точен, не абсолютно универсален и не слишком прост, но для сегодняшней науки он стал поистине революционным.
Однако оценить в полной мере его революционность неспециалисту мешает то, что за CRISPR-Cas9 стоит чрезвычайно непростая наука. Для начала, как расшифровывается CRISPR? Это Clustered Regularly Interspaced Short Palindromic Repeats — короткие палиндромные повторы, регулярно расположенные группами. А Cas9 — это CRISPR-ассоциированный (CRISPR-associated) белок 9. Что это за повторы, где эти группы и почему с ними ассоциированы какие-то белки?
Бактерии против вирусов
Биологи не с нуля придумали CRISPR-Cas9, а подсмотрели её у бактерий и архей. У них CRISPR-Cas9 работает как система противовирусной защиты. В конце 80-х годов XX века в ДНК кишечной палочки и других микробов открыли странные структуры: группы из палиндромных участков, между которыми находились какие-то другие генетические последовательности. Палиндромами называют последовательности нуклеотидов, которые одинаково читаются от конца к началу и от начала к концу, например, как слово «топот». Открытые группы палиндромных последовательностей назвали CRISPR. Но самое интересное было в том, что находилось между палиндромами — а между ними находились фрагменты вирусных последовательностей.
Когда бактериальный вирус (или бактериофаг) нападает на бактерию, он впрыскивает в неё свою нуклеиновую кислоту и начинает размножаться. Бактерия может погибнуть, а может выжить и избавиться от вируса. Выжившие бактерии встраивают фрагменты вирусной ДНК* в свой геном, в участки CRISPR. То есть, образно говоря, CRISPR — это картотека, хранящая информацию о вирусных атаках. Если в клетке снова окажется чужая ДНК, бактерия сравнит её с картотекой CRISPR и, если найдёт совпадение, быстро уничтожит, не дав вирусу ни шанса. Хотя фрагменты вирусных последовательностей в CRISPR довольно короткие, их вполне хватает, чтобы узнать вирус. Так мы, открыв книгу без обложки, быстро поймём, с чем имеем дело, если увидим в каком-нибудь предложении имя Анны Карениной.
*Для простоты будем говорить о ДНК, хотя среди бактериофагов есть и такие, которые хранят свои гены в РНК.
Разумеется, здесь не обойтись без белков. CRISPR-последовательность в ДНК сначала копируется в одну большую РНК, потом эта РНК разрезается на кусочки. Эти кусочки должны прочно связаться с чужой ДНК, то есть между их нуклеотидами должны образоваться комплементарные водородные связи. Если какие-то нуклеотиды провзаимодействовали, а какие-то нет — значит, перед нами никакой не вирус. Но если кусок РНК, синтезированный на картотеке CRISPR, и чужая ДНК сцепились друг с другом, как родные, эту нуклеиновую кислоту надо резать.
Все эти процедуры выполняют белки Cas. Сейчас их в сумме насчитывается уже девяносто три, их гены хранятся в бактериальной хромосоме рядом с CRISPR-картотекой (откуда и аббревиатура Cas — «CRISPR-ассоциированные»). Не все девяносто три белка работают вместе во всех бактериях и археях. Систем CRISPR-Cas есть более двадцати разновидностей, которые отличаются и набором белков, и некоторыми особенностями работы. (В дальнейшем мы будем говорить о системе CRISPR-Cas9, в которой работает белок Cas9.) Но в целом все они заняты одним и тем же: пополнением картотеки CRISPR, поиском потенциально опасных ДНК в клетке, истреблением вирусов и пр. Часто картотеку CRISPR и обслуживающие её белки Cas называют бактериальным иммунитетом. Конечно, иммунная система животных работает совсем иначе, однако у них есть и кое-что общее: и наш иммунитет, и система CRISPRCas узнают и уничтожают опасного чужака по памяти о прошлых инфекциях. У нас память о прошлых инфекциях хранят специальные иммунные клетки, у бактерий — специальный участок в бактериальной хромосоме.
Молекулярные хитрости «бактериального иммунитета»
Хотя впервые на последовательности CRISPR обратили внимание ещё в конце 1980-х, окончательно подтвердить гипотезу о «бактериальном иммунитете» удалось только к 2007 году, а потом ещё несколько лет ушло на то, чтобы расшифровать молекулярный механизм. Чтобы подойти к исследованиям нынешних лауреатов, надо чуть дальше зайти в «дебри» молекулярной биологии. Как сказано выше, CRISPR-участок ДНК со всеми вирусными последовательностями копируется в длинную РНК. Но в таком длинном виде эта РНК работать не может — её нужно нарезать на небольшие фрагменты. Каждый фрагмент несёт в себе образец какого-то одного вируса, и с ним теперь удобно работать Cas-белкам. Длинная РНК, синтезируемая на ДНК с CRISPR, называется pre-crRNA, что означает предшественник CRISPR-RNA. Она должна созреть, то есть разделиться на маленькие кусочки, на множество crRNA, или CRISPR-RNA.