Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

NLP: терапевтическая магия или обман NLP: терапевтическая магия или обман

Как работают техники НЛП?

Лиза
Земля кочевая Земля кочевая

Башкирская земля всегда рада гостям

Отдых в России
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
«Пока не сыграл в ящик»: как составить список самых важных дел «Пока не сыграл в ящик»: как составить список самых важных дел

Как составить bucket list и при этом избежать ошибок?

Psychologies
Биоархеологи обнаружили различия в рационе мужчин и женщин из римского некрополя Биоархеологи обнаружили различия в рационе мужчин и женщин из римского некрополя

Женщины и мужчины в Риме питались по-разному

N+1
20 любопытных фактов о пингвинах: жизнь в смокинге 20 любопытных фактов о пингвинах: жизнь в смокинге

Что еще вы знаете о пингвинах?

ТехИнсайдер
Что такое похмелье с точки зрения науки? И как быстро от него избавиться? Что такое похмелье с точки зрения науки? И как быстро от него избавиться?

Может ли современная медицина ответить на вопрос как избавиться от похмелья?

ТехИнсайдер
3 главные загадки Древнего Египта, которые ученые до сих пор не могут раскрыть 3 главные загадки Древнего Египта, которые ученые до сих пор не могут раскрыть

Мы до сих пор очень мало знаем о загадочных египетских пирамидах

ТехИнсайдер
Охота на ведьм и поиски козла отпущения: как работают механизмы коллективного насилия Охота на ведьм и поиски козла отпущения: как работают механизмы коллективного насилия

Почему на протяжении всей истории человечества одни сообщества преследуют другие

Forbes
Ее зверски пытали, но маленькая героиня не сдала своих: за что немцы зверски расправились с Зоей Космодемьянской Ее зверски пытали, но маленькая героиня не сдала своих: за что немцы зверски расправились с Зоей Космодемьянской

Положение на фронте с каждым днем становилось все хуже

ТехИнсайдер
Как переживал начало Второй мировой войны ювелирный дом Cartier Как переживал начало Второй мировой войны ювелирный дом Cartier

Отрывок из книги об одном из самых известных ювелирных домов в мире

СНОБ
Новая «нормальность» российского свиноводства Новая «нормальность» российского свиноводства

Перспективы развития сектора российского свиноводства в 2022–2025 годах

Агроинвестор
15 незаметных признаков очень больших денег 15 незаметных признаков очень больших денег

Настоящее богатство видно при очень внимательном рассмотрении и хорошей дедукции

Maxim
У бактерий нашли дополнительные белки для борьбы с вирусами и бактериофагами У бактерий нашли дополнительные белки для борьбы с вирусами и бактериофагами

Ученые из MIT нашли у прокариот новый механизм борьбы с вирусными инфекциями

N+1
Дочери Евы: генеалогию человечества по женской линии можно проследить до самой праматери Дочери Евы: генеалогию человечества по женской линии можно проследить до самой праматери

«Адам» и «Ева» — виртуальные точки, с которых человечество ведет родословную

ТехИнсайдер
Хлебное место Хлебное место

Экспедиция на «буханке» в деревню, которой нет

Автопилот
Глобальное изменение климата сыграло на руку большинству инфекционных заболеваний Глобальное изменение климата сыграло на руку большинству инфекционных заболеваний

Глобальное изменение климата повышает распространенность инфекций

N+1
Финансовая сепарация: что делать, если женщина материально зависит от мужа Финансовая сепарация: что делать, если женщина материально зависит от мужа

Как бороться с финансовой зависимостью в отношениях?

Psychologies
Как бережно подталкивать людей к изменениям Как бережно подталкивать людей к изменениям

Действительно, влиять на других людей очень сложно, но это умение можно развить

Psychologies
Идеальный плейлист для собак: эта музыка успокоит вашего пса в дорожном путешествии Идеальный плейлист для собак: эта музыка успокоит вашего пса в дорожном путешествии

Эта музыка поможет собаке расслабиться, когда она сидит взаперти в машине

ТехИнсайдер
Кто умнее: кошки или собаки? Кто умнее: кошки или собаки?

Учение измерили когнитивные способности кошек и собак

Maxim
Бразильская команда: как правильно искать менеджеров в Сан-Паулу и Рио Бразильская команда: как правильно искать менеджеров в Сан-Паулу и Рио

Что нужно знать перед тем, как нанять управленца для запуска проекта в Бразилии

Forbes
Как убрать и подтянуть живот после родов. Упражнения и другие действенные способы Как убрать и подтянуть живот после родов. Упражнения и другие действенные способы

Какие упражнения и привычки в питании помогут быстро привести себя в форму?

Лиза
Токсичные отношения: почему VFX-художники называют Marvel худшим работодателем Токсичные отношения: почему VFX-художники называют Marvel худшим работодателем

Выход сериала Marvel вызвал дискуссию о токсичном отношении студии к художникам

Forbes
Археологи обнаружили древнейшее просо Британии Археологи обнаружили древнейшее просо Британии

Это просо вырастили в Британии около 910–800 годов до нашей эры

N+1
Металлические стекла оказались частично жидкими Металлические стекла оказались частично жидкими

Доказано, что часть атомов в металлических стеклах движется подобно жидкости

N+1
Право матери-ехидны. Как наладить отношения с детьми, если после развода они остались с отцом Право матери-ехидны. Как наладить отношения с детьми, если после развода они остались с отцом

Как матери вести себя после развода и расставания с детьми?

СНОБ
8 способов обмануть аппетит (например во время интервального голодания) 8 способов обмануть аппетит (например во время интервального голодания)

Можно ли убедить организм, что он не голоден?

Inc.
Что опаснее для ребенка: игра Among Us, новое видео А4 или онлайн-груминг? Что опаснее для ребенка: игра Among Us, новое видео А4 или онлайн-груминг?

Многие родители сражаются не с теми врагами в интернете

Psychologies
Надежда Батоева Надежда Батоева

Балерина Надежда Батоева — о том, как она стала примой Мариинского театра

Собака.ru
Открыть в приложении