Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

9 абсурдных мифов о человеческом теле, в которые люди продолжают верить несмотря на факты 9 абсурдных мифов о человеческом теле, в которые люди продолжают верить несмотря на факты

Сказки о нашем теле, в которые мы верим

ТехИнсайдер
Принцесса Диана: истоки культа Принцесса Диана: истоки культа

Как появился миф о прекрасной принцессе Диане?

Psychologies
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Змеиный характер Змеиный характер

Стопе повезло: она остановилась в каких-то двадцати сантиметрах от головы змеи

Наука и жизнь
Как стартап россиян по выявлению NFT-подделок привлек $11 млн от инвестора Google Как стартап россиян по выявлению NFT-подделок привлек $11 млн от инвестора Google

Есть ли у стартапа Optic серьезные конкуренты и будущее?

Forbes
«Я пишу те книги, которые хотела бы читать сама». Писательница Вера Камша об «Этерне», «Игре престолов» и золотом веке российской фантастики «Я пишу те книги, которые хотела бы читать сама». Писательница Вера Камша об «Этерне», «Игре престолов» и золотом веке российской фантастики

Вера Камша — о том, как решиться на экранизацию собственной книги?

СНОБ
Больше боли. Шмели умеют терпеть. Значит ли это, что им бывает больно? Больше боли. Шмели умеют терпеть. Значит ли это, что им бывает больно?

Шмели умеют терпеть. Значит ли это, что им бывает больно?

N+1
Время пить из самовара: как и зачем выбирать водогрейную машину в XXI веке Время пить из самовара: как и зачем выбирать водогрейную машину в XXI веке

Есть ли у тебя самовар, товарищ? Нет? Напрасно!

Maxim
Было навсегда, пока не кончилось: как равенство и инклюзия меняют продукты и компании Было навсегда, пока не кончилось: как равенство и инклюзия меняют продукты и компании

Как крупные компании изменились из-за политики DEI

Forbes
Парад гигантов: Кролик размером с человека, конь — со слона и еще троица аномально огромных животных Парад гигантов: Кролик размером с человека, конь — со слона и еще троица аномально огромных животных

Эти звери не догадываются, что занимают почетное место в Книге рекордов Гиннеса

ТехИнсайдер
Формула долголетия: 5 книг, которые помогут вам привить полезные привычки Формула долголетия: 5 книг, которые помогут вам привить полезные привычки

Книги, которые помогут сформировать привычки, ведущие к счастью и богатству

ТехИнсайдер
Груминг и созависимость: устаревшая этика в сериале «Жена путешественника во времени» Груминг и созависимость: устаревшая этика в сериале «Жена путешественника во времени»

Этот сериал c мог бы сместить с пьедестала фильмы о созависимых отношениях

Forbes
МРТ-сканер в виде пиратской шхуны: как геймификация помогает в работе и жизни МРТ-сканер в виде пиратской шхуны: как геймификация помогает в работе и жизни

Как игры помогают добиваться целей в работе и в жизни?

Forbes
Как выбрать весы для кухни: простая инструкция Как выбрать весы для кухни: простая инструкция

Какие детали надо учесть, чтобы выбрать лучшие весы для кухни?

CHIP
6 типов психоэмоциональных вампиров 6 типов психоэмоциональных вампиров

Почему важно распознавать людей, крадущих у нас энергию?

Psychologies
Что случилось с фильмами, в которых главные актеры умирали посреди съемок Что случилось с фильмами, в которых главные актеры умирали посреди съемок

Как выкручивались студии, когда оставались без основного героя

Maxim
«Совместное родительство — это предприятие»: как отцы включаются в заботу о детях «Совместное родительство — это предприятие»: как отцы включаются в заботу о детях

Почему в России до сих пор есть проблемы с включением отцов в воспитание детей

Forbes
Сахелантропу вновь разрешили ходить на двух ногах Сахелантропу вновь разрешили ходить на двух ногах

Ученые исследовали находки, сделанные больше 20 лет назад в Чаде

N+1
Групповые процессы вместо культа индивидуализма: почему сейчас «я» меняется на «мы» Групповые процессы вместо культа индивидуализма: почему сейчас «я» меняется на «мы»

Почему вдруг важными становятся групповые процессы, а не индивидуальность?

Psychologies
О чем на самом деле думают мужчины? Разбираемся, стоит ли это угадывать О чем на самом деле думают мужчины? Разбираемся, стоит ли это угадывать

Что ОН хотел этим сказать, о чем ОН думает, почему ОН так поступил

VOICE
Как избавиться от домашних клопов за один день: готовимся к сезону вредителей Как избавиться от домашних клопов за один день: готовимся к сезону вредителей

Как обезопасить свою постель от домашних клопов?

ТехИнсайдер
Почему цивилизация Древнего Египта пришла в упадок: главная причина падения цивилизации Почему цивилизация Древнего Египта пришла в упадок: главная причина падения цивилизации

Почему некогда великая Египетская империя медленно опускалась на колени?

ТехИнсайдер
Как у Брижит или Хадид Как у Брижит или Хадид

Модная челка: 9 лучших вариантов

Лиза
Опасные люди: как их распознать, если они кажутся «нормальными» Опасные люди: как их распознать, если они кажутся «нормальными»

Опаснее всего не явные тираны, а те, кто поначалу кажутся нормальными

Psychologies
Хоть горшком назови Хоть горшком назови

Какие отечественные автомобильные имена следует возродить

Автопилот
Можно ли стирать пальто в стиральной машине: простые советы по уходу за верхней одеждой Можно ли стирать пальто в стиральной машине: простые советы по уходу за верхней одеждой

Можно ли обойтись без химчистки и как постирать пальто в домашних условиях

ТехИнсайдер
6 удивительных фактов о животных, в которые многие до сих пор не верят 6 удивительных фактов о животных, в которые многие до сих пор не верят

Животные никогда не перестанут удивлять нас

ТехИнсайдер
Как включить клавиатуру на ноутбуке: все проще, чем кажется Как включить клавиатуру на ноутбуке: все проще, чем кажется

Рассказываем о том, как включить клавиатуру на ноутбуке несколькими способами

CHIP
Папины принцессы: чем живут и как выглядят скрытные дочери мировых политиков Папины принцессы: чем живут и как выглядят скрытные дочери мировых политиков

Теперь в башнях прячут наследниц современных политиков

VOICE
Как полиция США использует сервис Google в своих расследованиях Как полиция США использует сервис Google в своих расследованиях

Ордер на геозону может сыграть определяющую роль в делах многих подозреваемых

Forbes
Открыть в приложении