Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

В Южной Корее снова отредактировали собак. Теперь — чтобы укрепить лабрадорам бедра В Южной Корее снова отредактировали собак. Теперь — чтобы укрепить лабрадорам бедра

В Южной Корее родились два генетически модифицированных лабрадора

N+1
«Цена утопии». История российской модернизации «Цена утопии». История российской модернизации

Отрывок из книги «Цена утопии» — как Россия пыталась реализовать утопию

N+1
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
10 красивых фотофейков, в которые все поверили 10 красивых фотофейков, в которые все поверили

Самые красивые и впечатляющие вирусные фото, которые оказались подделкой

Maxim
Бравые наёмники моды Бравые наёмники моды

Самый яркий и необычный костюм эпохи Возрождения

Дилетант
Как работает восьмицилиндровый двигатель: полный разбор на наглядном примере Как работает восьмицилиндровый двигатель: полный разбор на наглядном примере

Engineering Explained распечатал на 3D-принтере объемную модель двигателя V8

ТехИнсайдер
Как сохранить желание: интервью с сексологом Как сохранить желание: интервью с сексологом

Можно ли сохранять сексуальный аппетит на протяжении долгого времени?

Psychologies
В детстве вас не замечали: 7 последствий жизни в токсичной семье В детстве вас не замечали: 7 последствий жизни в токсичной семье

Какие «хвосты» из детства в токсичной семье могут отравлять взрослую жизнь?

Psychologies
10 интересных фактов о принцессе Диане, которых вы, возможно, не знали 10 интересных фактов о принцессе Диане, которых вы, возможно, не знали

Диана была фавориткой не только своей страны, но и целого мира

Правила жизни
«Персеверанс» обнаружил в кратере Езеро вулканические породы вместо осадочных «Персеверанс» обнаружил в кратере Езеро вулканические породы вместо осадочных

Озеро в кратере Езеро исчезло слишком быстро

N+1
Лучшие алкогольные рецепты с арбузом: от классики до экзотических Лучшие алкогольные рецепты с арбузом: от классики до экзотических

Как вдохнуть алкогольную страсть в отношения с арбузом.

Maxim
Из-за чего судятся акционеры одной из самых популярных франшиз «Мозгобойня» Из-за чего судятся акционеры одной из самых популярных франшиз «Мозгобойня»

Почему сеть паб-квизов «Мозгобойня» раздирает корпоративный конфликт

Forbes
Шведы показали превосходство кнопок и крутилок над сенсорным управлением в автомобиле Шведы показали превосходство кнопок и крутилок над сенсорным управлением в автомобиле

Прогресс не всегда полезен: сенсорное управление в машинах оказалось неудобным

N+1
8 программ для записи видео с экрана ноутбука 8 программ для записи видео с экрана ноутбука

Самые подходящие программы для записи видео с экрана компьютера

CHIP
В пустынном солончаке чудом обнаружили древние В пустынном солончаке чудом обнаружили древние

Археологи наткнулись на таинственные «призрачные следы» на солончаках пустыни

ТехИнсайдер
Четыре неочевидные идеи, которые добавят в интерьер дизайнерские нотки Четыре неочевидные идеи, которые добавят в интерьер дизайнерские нотки

Как разнообразить интерьер вашей квартиры и сделать его оригинальным

Караван историй
Гонки с Чикатило: история Александра Пичушкина, который мечтал стать самым известным маньяком в СССР Гонки с Чикатило: история Александра Пичушкина, который мечтал стать самым известным маньяком в СССР

Битцевский маньяк собирался довести число своих жертв до 64

VOICE
Стрит-арт, яхтинг, сиг: что смотреть и пробовать в Нижнем Новгороде Стрит-арт, яхтинг, сиг: что смотреть и пробовать в Нижнем Новгороде

Нижний Новгород — один из центров отечественного гастротуризма

РБК
Дети и старческая деменция: как научить ребенка не злиться на больного Дети и старческая деменция: как научить ребенка не злиться на больного

Как научить взаимодействовать с человеком, который может забыть собственное имя?

Psychologies

У Веры было много талантов, один из них — это умение дружить

Караван историй
Леонид Федун покидает «Спартак»: он владел клубом 18 лет Леонид Федун покидает «Спартак»: он владел клубом 18 лет

Жизнь «Спартака» при Федуне получилась скомканной

Maxim
Как делают футбольные мячи: простая вещь со сложной разработкой Как делают футбольные мячи: простая вещь со сложной разработкой

Создание профессионального футбольного мяча — это целая наука

ТехИнсайдер
Какие привычные продукты богаты железом: рацион для укрепления иммунитета Какие привычные продукты богаты железом: рацион для укрепления иммунитета

Простые продукты, в которых много железа

ТехИнсайдер
Потерянный человек в потерянном раю Потерянный человек в потерянном раю

Памяти Натальи Нестеровой

Weekend
«Пускай родится мальчик»: зачем девочкам дают имена-заклинания «Пускай родится мальчик»: зачем девочкам дают имена-заклинания

Как живут девочки, которым дают имена-заклинания на рождение мальчика?

Forbes
9 причин, почему современные автомобили хуже тех, что выпускали в 90-е и 2000-е 9 причин, почему современные автомобили хуже тех, что выпускали в 90-е и 2000-е

За плюсы современных машин мы заплатили сторицей

Maxim
5 математических трюков, которые помогут решить любую задачу за секунды 5 математических трюков, которые помогут решить любую задачу за секунды

Простые трюки могут облегчить решение любых повседневных математических задач

ТехИнсайдер
15 главных фактов о коньяке, без которых его просто стыдно пить 15 главных фактов о коньяке, без которых его просто стыдно пить

12 фактов о самом благородном из алкогольных напитков

Maxim
Девушка с плаката: как пропаганда использовала женcкие образы во время войн в XX веке Девушка с плаката: как пропаганда использовала женcкие образы во время войн в XX веке

Ккак именно женские образы использовались для воздействия на фронт и тыл

Forbes
Генотерапия вернула слух мышам Генотерапия вернула слух мышам

Ученые разработали препарат, который вернул мышам слух

N+1
Открыть в приложении