О том, как научить искусственный интеллект понимать, а не угадывать химию

Наука и жизньНаука

Глаз-синхротрон

Беседу ведёт Наталия Лескова

Богдан Олегович Проценко. Фото Виктора Шаповалова

Рентгеновская спектроскопия поглощения — один из самых мощных инструментов изучения вещества. Однако до сих пор расшифровка спектров напоминала детектив с открытым финалом: учёные тратили месяцы на интерпретацию данных, полагаясь на опыт, интуицию и сложные расчёты. Теперь, благодаря методам, основанным на машинном обучении, этот процесс занимает всего несколько минут.

О том, как научить искусственный интеллект понимать, а не угадывать химию, рассказывает Богдан Проценко, лаборант-исследователь Международного исследовательского института интеллектуальных материалов Южного федерального университета (МИИ ИМ ЮФУ).

— Богдан Олегович, что такое рентгеновская спектроскопия и зачем она нужна?

— Это метод исследования вещества. У физиков, как у детей: чтобы понять, что внутри, надо вещь или сломать, или воздействовать на неё чем-то, и уже по результату, отклику делать выводы. Чтобы понять, что арбуз сладкий, достаточно просто похлопать по нему. А вот когда мы переходим к атомам и молекулам, мельчайшим деталям их строения и функционирования, к тому, как вообще устроена материя вокруг нас и почему она такая, а не какая-то другая — всё становится намного сложнее. Нет там «правды», которую можно увидеть глазами: размеры систем много меньше длины волны видимого света, а энергии процессов много больше. Дифракционный предел (который также называют критерием Рэлея или критерием Аббе) ограничивает минимальные размеры того, что можно увидеть. Но если взять длины волн, сопоставимые с размерами атомов и расстояниями между ними, то мы обойдём этот предел и окажемся в рентгеновском диапазоне.

Когда мы светим на вещество рентгеновским излучением, оно рассеивается либо с сохранением энергии, упруго, как говорят физики, либо неупруго, теряя или приобретая энергию после рассеивания. Первый вариант называется дифракцией — это отличный метод исследовать структуру упорядоченных объектов, например кристаллов. Рассеянное на кристаллической решётке рентгеновское излучение интерферирует, давая максимумы и минимумы на разных углах отражения. Но для этого нужен дальний порядок расположения атомов. А вот второму варианту, собственно рентгеновской спектроскопии, это уже безразлично.

Макет строящейся установки СИЛА (СИнхротрон + ЛАзер). Она объединит в себе сразу две установки: лазер на свободных электронах (с энергией 6 ГэВ) и синхротрон. За макетом — Богдан Проценко. Фото: Фото Назара Чубкова

Мы светим рентгеновским излучением разных энергий на вещество и смотрим, как оно поглощается. Это и есть рентгеновская спектроскопия. По форме зависимости поглощения излучения от его энергии, которая и называется спектром рентгеновского поглощения, можно понять, как в веществе расположены атомы и в каком химическом состоянии они находятся. При буквальном переводе с латыни spectrum — «образ», «душа», что как бы подчёркивает, что спектр отражает некоторые уникальные внутренние особенности объекта.

Идея рентгеновской спектроскопии в общем-то простая: раз рассеяние у нас неупругое, то есть часть излучения поглощается, теряет энергию, — значит, эта энергия на что-то расходуется. А идёт она на то, чтобы выбить электроны в атомах со своих «насиженных» мест и отправить их прочь из атома. Выбитый электрон тратит полученную энергию на то, чтобы преодолеть притяжение атома и затем столкнуться с соседними атомами. Ситуацию, когда излучение выбивает электроны из вещества, мы называем фотоэффектом, выбитый электрон — фотоэлектроном, а такого рода рассеяние на соседях с наложением результатов — интерференцией. В сущности, рентгеновская спектроскопия — это интерференция фотоэлектронов, где интерференционной решёткой служит сама материя. Разного рода интерферометры принадлежат к классу самых точных измерительных приборов, взять хотя бы обсерваторию LIGO, где впервые зафиксировали гравитационные волны.

В микромире между частицами и волнами нет чёткой грани — это так называемый корпускулярно-волновой дуализм. Поэтому на вылетевший электрон в силу квантовых эффектов можно смотреть как на волну, которая рассеивается на соседях, накладывается сама на себя и т. д. Представьте себе, что вы кинули в воду камень, и от его падения пошли волны на воде — вот это как бы выбитый электрон. Волны встречают препятствия, отражаются, эти вторичные отражённые волны накладываются уже на первую волну и друг на друга — получается интересная интерференционная картина. При разных энергиях излучения, то есть если с разной силой «пинать» электрон, интерференционная картина будет разной. Вот почему форма зависимости поглощения от энергии содержит в себе информацию как о локальном окружении атомов, так и об их электронной структуре. Примерно как в аналогии с кругами на воде, только с поправкой на то, что все процессы носят квантовый характер: получается, что фотоэлектрон, будучи одной (!) частицей, вполне прекрасно рассеивается сам на себе и учитывает в момент своего вылета (ещё до рассеяния на соседях, как бы «зная будущее наперёд») все возможные варианты того, как он сможет после вылета рассеяться на соседях. Если вам это кажется захватывающим — поздравляю, вы в шаге от вступления в наш клуб спектроскопистов!

— Что нужно, чтобы получить рентгеновский спектр какого-нибудь соединения?

— Понятное дело, что для рентгеновской спектроскопии нужен собственно рентген, и во всём мире строятся огромные установки для генерации очень яркого и сфокусированного излучения. Это синхротроны и рентгеновские лазеры на свободных электронах — монструозные устройства, способные генерировать излучение в миллионы раз ярче Солнца с микро- и фемтосекундным разрешением… На таких сложных и дорогих устройствах, занимающих, как правило, площадь очень большого здания, находится сразу несколько лабораторий — их называют линиями, или каналами, где каждая лаборатория реализует свою методику исследования. Возможности рентгеновской спектроскопии огромны, потому неудивительно, что существует корреляция между научно-техническим уровнем страны и количеством подобных установок. Учёные обычно пишут заявку на то, чтобы получить возможность провести измерения на одной из них, и, если она выигрывает, приезжают командой, с оборудованием и образцами, и проводят измерения круглосуточно — там каждый час на счету. Экспериментальная работа на таких установках позволяет получать уникальные данные, ценные практически в любой области, от искусствоведения и истории до геологии экзопланет, структурной биологии, катализа и материаловедения. Например, структура подавляющего большинства белков человечеству известна во многом благодаря синхротронам.

— Насколько я знаю, в нашей стране на данный момент всего одна такая установка — в Курчатовском институте.

— Да, это Курчатовский источник синхротронного излучения («КИСИ-Курчатов»). Кроме него есть ещё два ускорителя в Новосибирске (ВЭПП-3 и ВЭПП-4), которые часть времени работают на генерацию синхротронного излучения. Ещё активно строятся или планируются новые, например СКИФ (Сибирский Кольцевой Источник Фотонов), СИЛА (СИнхротрон+ЛАзер), РИФ и другие. Думаю, нам в Ростове один, пусть и небольшой ускоритель, тоже бы не помешал.

— Какие всё это решает фундаментальные задачи?

— Спектроскопия рентгеновского поглощения — это один из важнейших инструментов, необходимых для того, чтобы узнать, как на самом деле устроено вещество вокруг нас. Иными словами, понять на атомарном уровне устройство материи, какая она, почему и как функционирует.

Причём ограничений на состояние образца нет, рентгеновская спектроскопия применима для любого агрегатного состояния вещества и может применяться прямо в процессе работы (в этом помогает проникающая способность рентгена), например, можно исследовать, как деградируют катализаторы прямо в ходе реальной реакции или как стареют литий-ионные батареи в циклах зарядки-разрядки. Её используют и для изучения биологических объектов (в частности, металлических центров в белках), для диагностики конструкционных и функциональных материалов, в том числе для микроэлектроники.

Фото Назара Чубкова

— Что представляет собой ваша разработка?

— Наша разработка — это метод для быстрого и точного анализа данных спектроскопии рентгеновского поглощения, основанный на искусственном интеллекте или машинном обучении. Мы с вами говорили про то, как много полезной информации содержится в рентгеновских спектрах и как их измеряют, но ни слова про то, как их, собственно, анализируют. А это очень непросто. Мы не видим отдельные атомы и их состояние, но видим некоторую сложную общую картину. Как будто бы это какая-то тень, отбрасываемая объектом, но не сам объект. А как восстановить объект по отбрасываемой им тени? Если структура однозначно определяет спектр, то спектр не всегда однозначно определяет структуру. В математике даже есть термин для такого рода задач — некорректные обратные задачи. Наша разработка посвящена тому, как решить эту некорректную задачу: с помощью машинного обучения построить алгоритм получения структуры из спектра.

У спектра рентгеновского поглощения есть две основные области: тонкая структура вблизи края поглощения (XANES) и протяжённая тонкая структура поглощения после края (EXAFS). Последняя, поскольку в ней доминирует рассеяние на соседях, позволяет исследователь в большей степени геометрические параметры (то, как расположены атомы), и для неё существует формула, подгоняя которую к данным, учёные получают структурные параметры вещества. А вот для XANES, где есть вклад в рассеяние и геометрии локального окружения и электронного состояния атомов, такой формулы нет. И не будет никогда. Так уж устроена наука, что только в школе всё понятно и для всего есть уравнение, решаемое аналитически, в жизни и науке, увы, не так. Перед нами ларец с ценнейшей информацией, но ключа у нас от него нет… Потому исследователям остаётся либо с весьма ограниченной точностью численно моделировать простейшие системы на суперкомпьютерах, чтобы понять какие-то закономерности, либо сравнивать неизвестную систему с известными.

Спектр каждого материала уникален, и его особенности — как отпечаток пальца человека. Поэтому этот метод так и называется — «метод отпечатка пальца». Исследователи берут библиотеку спектров веществ-эталонов и пристально вглядываются в то, что у этих спектров есть общего и различного с неизвестным спектром. Хотя звучит это не очень точно, надёжно и воспроизводимо… Иными словами, исследователи потратили огромные усилия и деньги, чтобы построить синхротроны, провести на них измерения, — и не могут из этих данных извлечь полезную информацию. Однако давайте приглядимся к последнему методу внимательнее — в нём мы собираем выборку, или библиотеку данных, и на её основе ищем закономерности, воспользовавшись которыми, пытаемся сделать вывод или предсказание для новых данных. Ничего не напоминает? Да это же просто пресловутое машинное обучение, раздел столь популярного ныне искусственного интеллекта!

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Позеленение» Арктики: как его оценить и о чём оно свидетельствует «Позеленение» Арктики: как его оценить и о чём оно свидетельствует

Как арктические экосистемы приспосабливаются к изменениям климатических условий

Наука и жизнь
На египетской картине нашли библейский синий На египетской картине нашли библейский синий

Из чего древние египтяне делали редкую краску — библейский синий

N+1
Кентавр из моря Кентавр из моря

Может ли кентавр существовать с точки зрения биологии?

Вокруг света
Кнут Гамсун Кнут Гамсун

Кнут Гамсун говорил от имени нации и тем сильно её скомпрометировал

Дилетант
Он лгал и учил лгать Он лгал и учил лгать

«Мы не знаем страны, в которой живем». А знаем ли мы Юрия Андропова?

Дилетант
Дейнотерий – слон с берегов Дона Дейнотерий – слон с берегов Дона

Слоны – одни из самых стабильных в эволюционном плане животных...

Наука и техника
Чернохвостые оленихи унаследовали миграционные маршруты матерей Чернохвостые оленихи унаследовали миграционные маршруты матерей

Как самки оленей учатся мигрировать у собственных матерей

N+1
История в фасадах История в фасадах

Число объектов культурного наследия в столице растет

Ведомости
Чистая правда Чистая правда

Хорошо умываться – значит, до «скрипа» кожи? Все с точностью до наоборот

Лиза
Как молния выбирает цель Как молния выбирает цель

Как молния находит молниеотвод среди множества других привлекательных целей?

Наука и жизнь
Чёрные мысли на белом снегу Чёрные мысли на белом снегу

Рассказ Елены Ворон «Чёрные мысли на белом снегу»

Наука и жизнь
Пифагор, или Теорема с одним неизвестным Пифагор, или Теорема с одним неизвестным

«Нет ни одной детали в жизни Пифагора, которая не была бы опровергнута»

Дилетант
Таблетки на ветер? Таблетки на ветер?

Как правильно выбрасывать лекарства из аптечки?

Лиза
О пользе «бумажной волокиты» О пользе «бумажной волокиты»

На каком языке говорили евреи, вернувшиеся из вавилонского пленения?

Знание – сила
Дорогой инноваций Дорогой инноваций

Что изменит высокоскоростная магистраль Москва — Санкт-Петербург

Эксперт
Кадровый агропотенциал Кадровый агропотенциал

Роль государства и бизнеса в решении проблемы дефицита персонала

Агроинвестор
Культурная повестка: «Исток» Культурная повестка: «Исток»

Софья Эрнст — о своем отношении к русской культуре и традициям

Moodboard
Страховка с биткойном Страховка с биткойном

Как работают инвестиционные полисы с привязкой к биткойну

Ведомости
Самовыражение в наклейке Самовыражение в наклейке

Платёжные стикеры популярны, но теряют шансы на рост

Ведомости
«Нас отменили в один день». Что делать, чтобы возродить бренд — опыт «Боржоми» «Нас отменили в один день». Что делать, чтобы возродить бренд — опыт «Боржоми»

Как возрождался известный еще с советского времени бренд «Боржоми»

Inc.
Рабби Давид из люфтваффе Рабби Давид из люфтваффе

В 2019 году Бундестаг одобрил введение в Германии военного раввината

Дилетант
Знать без царя в голове Знать без царя в голове

Мини-сериал о сестрах Митфорд, которые искали любовь, а нашли политику

Weekend
55 и вперед: как «серебряное поколение» адаптируется под новые карьерные треки 55 и вперед: как «серебряное поколение» адаптируется под новые карьерные треки

Как «серебряное поколение» адаптируется к новым карьерным реалиям

Forbes
Японский десант на Великих озерах Японский десант на Великих озерах

Большое поглощение в мировой металлургии все-таки состоится

Монокль
На Марсе будут расти дома: ученые придумали способ, который решит проблему колонизации На Марсе будут расти дома: ученые придумали способ, который решит проблему колонизации

Как строить из того, что предлагает сам Марс?

Inc.
Ученые превратили растительные отходы в топливо для самолетов Ученые превратили растительные отходы в топливо для самолетов

Технологию производства авиатоплива из биомассы создали в РГУ нефти и газа

ТехИнсайдер
«Пишите… А. Куприн» «Пишите… А. Куприн»

Эмиграция сложилась для Куприна не просто трудно, а скорее — трагически

Дилетант
Поверив Гомеру… Поверив Гомеру…

Действительно ли Троя — это тот город, о котором идёт речь в «Илиаде»?

Дилетант
Неандертальцы сделали ретушеры из костей пещерного льва Неандертальцы сделали ретушеры из костей пещерного льва

Неандертальцы изготавливали предметы из костей пещерных львов

N+1
Олег Нестеров — об Александре Кнайфеле и пределах невозможного Олег Нестеров — об Александре Кнайфеле и пределах невозможного

Музыкант Олег Нестеров — о музыке, которую сегодня стоит услышать каждому

РБК
Открыть в приложении