Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Грабеж, обман, обогащение: 10 фильмов про мошенников и аферистов Грабеж, обман, обогащение: 10 фильмов про мошенников и аферистов

Лучшие художественные фильмы талантливых, но опасных людей

Forbes
Потерянный человек в потерянном раю Потерянный человек в потерянном раю

Памяти Натальи Нестеровой

Weekend
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Работа — стиль жизни, коллектив — семья: работники рассказывают о «тревожных звоночках» на собеседованиях Работа — стиль жизни, коллектив — семья: работники рассказывают о «тревожных звоночках» на собеседованиях

Какие высказывания нанимателей на собеседованиях считаются «тревожным звоночком»

VC.RU
Протесты, допинг и бункер в гараже: 10 документальных фильмов о современной России Протесты, допинг и бункер в гараже: 10 документальных фильмов о современной России

Самые острые и важные документальные фильмы о России последнего времени

Forbes
Маньяк, который продолжил убивать в тюрьме: история «архангельского Чикатило» Сергея Шипилова Маньяк, который продолжил убивать в тюрьме: история «архангельского Чикатило» Сергея Шипилова

«Я — архангельский Чикатило», — обычно говорит он с гордой улыбкой

VOICE
Космическая медицина на орбите и на Земле Космическая медицина на орбите и на Земле

Как медики изучают влияние космического полета на организм

ТехИнсайдер
Правила жизни Салмана Рушди Правила жизни Салмана Рушди

Правила жизни романиста Салмана Рушди

Правила жизни
9 причин, почему современные автомобили хуже тех, что выпускали в 90-е и 2000-е 9 причин, почему современные автомобили хуже тех, что выпускали в 90-е и 2000-е

За плюсы современных машин мы заплатили сторицей

Maxim
Право на месть и милосердие: о чем говорили сторонники и противники смертной казни Право на месть и милосердие: о чем говорили сторонники и противники смертной казни

Отрывок из книги Тамары Эйдельман «Право на жизнь. История смертной казни»

Forbes
Объем волос на полгода: что такое буст ап и кому он подойдет Объем волос на полгода: что такое буст ап и кому он подойдет

Процедура boost up — отличный способ вернуть объем волосам

VOICE
Переславль-Залесский: для дачников, моряков и не только Переславль-Залесский: для дачников, моряков и не только

Лето в одном из самых красивых городов Золотого кольца

Лиза
«Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения? «Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения?

Почему женщины не хотят секса в браке и как об этом говорить?

Правила жизни
Почему во время путча по телевизору показывали «Лебединое озеро» Почему во время путча по телевизору показывали «Лебединое озеро»

Как знаменитый балет стал символом путча и государственного переворота

Maxim
Ни отеля, ни лошадей: 5 советов, как не испортить себе отпуск невнимательностью к деталям Ни отеля, ни лошадей: 5 советов, как не испортить себе отпуск невнимательностью к деталям

Два москвича собрались в горы, но вместо релакса получили череду казусов

Вокруг света
«Еврейка, которая шпионила против фашистов»: отрывок из биографии Урсулы Кучински «Еврейка, которая шпионила против фашистов»: отрывок из биографии Урсулы Кучински

Отрывок из книги «Агент Соня. Любовница, мать, шпионка, боец»

Forbes
Моторы-миллионники: четыре уникальных двигателя из прошлого Моторы-миллионники: четыре уникальных двигателя из прошлого

Именно они вызвали к жизни легенду о том, что “раньше машины были надёжнее”

ТехИнсайдер
Пролегомены к «философии нового порядка» Пролегомены к «философии нового порядка»

Книгу «Преображение гуманизма» должен был бы написать философ, но написал физик

Эксперт
В захвате Австралии кроликами обвинили английского фермера XIX века В захвате Австралии кроликами обвинили английского фермера XIX века

Австралийские кролики происходят от особей, которых выпустил Томас Остин

N+1
Вера Васильева: Вера Васильева:

Что меня поддерживает? Может быть, это любовь к близким?

Караван историй
Федун ушел. Возродится ли «Спартак»? Федун ушел. Возродится ли «Спартак»?

В историю спорта Леонид Федун войдет как один из самых ярких владельцев клуба

Эксперт
Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе

Такой привычный с детства фрукт, как яблоко, вопросов вроде бы не вызывает

Maxim
«Любимый ребенок Компартии»: как TikTok связан с провластными СМИ Китая «Любимый ребенок Компартии»: как TikTok связан с провластными СМИ Китая

Коммунистическая партия, провластные СМИ и TikTok

Forbes
История одной фотографии: пещера с золотом нацистов История одной фотографии: пещера с золотом нацистов

Реальные сокровища Рейха выглядели круче, чем в фильмах про Индиану Джонса!

Maxim
Метаповерхности излучили запутанные фотоны с переменной длиной волны Метаповерхности излучили запутанные фотоны с переменной длиной волны

Тонкие метаповерхности, состоящие из массивов кремниевых нанорезонаторов

N+1
Шведы показали превосходство кнопок и крутилок над сенсорным управлением в автомобиле Шведы показали превосходство кнопок и крутилок над сенсорным управлением в автомобиле

Прогресс не всегда полезен: сенсорное управление в машинах оказалось неудобным

N+1
Не только разогревать еду: как еще можно использовать микроволновку в быту Не только разогревать еду: как еще можно использовать микроволновку в быту

Ваша микроволновая печь способна на большее!

ТехИнсайдер
Как ухаживать за кожаной обувью: следуйте этим правилам, и ботинки прослужат вам дольше Как ухаживать за кожаной обувью: следуйте этим правилам, и ботинки прослужат вам дольше

Как правильно ухаживать за ботинками из кожи, чтобы сохранить их состояние

ТехИнсайдер
Чилийские игнимбриты объяснили поведение супервулканов перед извержениями Чилийские игнимбриты объяснили поведение супервулканов перед извержениями

Магматические очаги будущих суперизвержений росли всего пару тысяч лет

N+1
Как стартап россиян по выявлению NFT-подделок привлек $11 млн от инвестора Google Как стартап россиян по выявлению NFT-подделок привлек $11 млн от инвестора Google

Есть ли у стартапа Optic серьезные конкуренты и будущее?

Forbes
Открыть в приложении