Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Рэйография, редимейд, ракурс: как Ман Рэй изменил искусство Рэйография, редимейд, ракурс: как Ман Рэй изменил искусство

На примере пяти работ показываем, как Ман Рэй изменил фотографию и искусство

Правила жизни
Как укоренить розу из букета в домашних условиях Как укоренить розу из букета в домашних условиях

Срезанный цветок можно укоренить в домашних условиях

TechInsider
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
От Голды Меир до Индиры Ганди: как женщины становились премьер-министрами От Голды Меир до Индиры Ганди: как женщины становились премьер-министрами

Женщины, которые, несмотря на трудности, реализовали свои политические амбиции

Forbes
Стесняюсь спросить: почему женщинам бывает тяжело достичь оргазма с партнером? Стесняюсь спросить: почему женщинам бывает тяжело достичь оргазма с партнером?

Что делать, если оргазм не наступает без подручных средств?

Правила жизни
Как должна вести себя настоящая женщина: советы и наблюдения со страниц дневника таинственной японки Мурасаки Как должна вести себя настоящая женщина: советы и наблюдения со страниц дневника таинственной японки Мурасаки

Как девушке сохранять достоинство, занимая высокое положение в обществе?

VOICE
Маргарита Терехова. Убегающая в темноту Маргарита Терехова. Убегающая в темноту

Сноб размышляет о судьбе актрисы Маргариты Тереховой

СНОБ
8 способов похудеть для очень занятых людей 8 способов похудеть для очень занятых людей

Мы составили самую простую и быструю программу похудения

Psychologies
Одна вокруг света: озеро на месте «звездной раны» и деревенская прачечная в Боливии Одна вокруг света: озеро на месте «звездной раны» и деревенская прачечная в Боливии

182-я серия о кругосветном путешествии москвички Ирины Сидоренко: Боливия

Forbes
«Истории о женщинах в дефиците»: Василиса Кузьмина о пути в режиссуре и фильме «Ника» «Истории о женщинах в дефиците»: Василиса Кузьмина о пути в режиссуре и фильме «Ника»

Сложно ли женщине прийти в режиссуру, которую многие считают мужским делом

Forbes
Кофейный пояс, пыльный котел, банановая республика: расшифровываем 7 географических метафор Кофейный пояс, пыльный котел, банановая республика: расшифровываем 7 географических метафор

Что скрывается за звучными названиями мест, маршрутов и событий

Вокруг света
Электрон попал внутрь полости октафторкубана Электрон попал внутрь полости октафторкубана

Химики из Японии впервые синтезировали полностью фторированный аналог кубана

N+1
Собаки, которые живут в семьях, могут иметь психологические проблемы Собаки, которые живут в семьях, могут иметь психологические проблемы

Иногда жизнь в квартире — не лучший вариант для собаки!

TechInsider
Весь мозг на одном кристалле. Будущее мемристоров приближается Весь мозг на одном кристалле. Будущее мемристоров приближается

Мемристорная вычислительная техника может прийти на смену традиционной

TechInsider
«Свобода определяется рамками»: как пианист Риад Маммадов переосмысляет классику «Свобода определяется рамками»: как пианист Риад Маммадов переосмысляет классику

Риад Маммадов — как строится карьера классических музыкантов в России?

Forbes
От бомбочек с содой к ягелю и морошке: как бренд крафтовой косметики из Излучинска нашел свою нишу От бомбочек с содой к ягелю и морошке: как бренд крафтовой косметики из Излучинска нашел свою нишу

Как аллергия приводит к новому хобби, а хобби превращается в бизнес

Inc.
Вопрос психологу: как перестать искать у себя болезни Вопрос психологу: как перестать искать у себя болезни

Почему озабоченность здоровьем может перерастать в одержимость?

Правила жизни
5 вопросов про Ивана Грозного 5 вопросов про Ивана Грозного

Основанные на домыслах вопросы о жизни Ивана Грозного

Maxim
Поворот сюжета Поворот сюжета

История лесничего Ивана Рейнмана

Дилетант
NLP: терапевтическая магия или обман NLP: терапевтическая магия или обман

Как работают техники НЛП?

Лиза
Идеальное выдуманное Идеальное выдуманное

Автопромышленность параллельного СССР

Автопилот
Невидим, свободен... Невидим, свободен...

Теоретики рассматривали двумерные структуры на основе углерода ещё в XX веке

Наука и жизнь
Если голуби перестанут трясти головой, они ослепнут! 5 удивительных фактов про голубей, о которых вы не догадывались Если голуби перестанут трясти головой, они ослепнут! 5 удивительных фактов про голубей, о которых вы не догадывались

Оказывается, голуби не так просты, как кажется!

TechInsider
Как на самом деле действуют отбеливающие пасты и чем могут быть опасны Как на самом деле действуют отбеливающие пасты и чем могут быть опасны

Советуют ли стоматологи использовать отбеливающие пасты?

Лиза
Битва за Гран-Чако Битва за Гран-Чако

Война марок между Боливией и Парагваем

Дилетант
Как приготовить омлет «Пуляр», фирменное блюдо Александра Богданова, бренд-шефа Cafe Claret и Marius Как приготовить омлет «Пуляр», фирменное блюдо Александра Богданова, бренд-шефа Cafe Claret и Marius

Омлет «Пуляр» настолько пышный и воздушный, что напоминает скорее десерт

Правила жизни
«Разовая выплата 12 окладов»: как IT-компании нанимают персонал после «спецоперации» «Разовая выплата 12 окладов»: как IT-компании нанимают персонал после «спецоперации»

Количество вакансий в IT-компаниях России в июле 2022 года снизилось на 9%

Forbes
Инвесторы назвали 5 фраз, от которых фаундерам нужно отказаться во время питчинга стартапа Инвесторы назвали 5 фраз, от которых фаундерам нужно отказаться во время питчинга стартапа

Фразы, которые не стоит использовать в презентации стартапа

Inc.
В арктических водах поймали рыбу с настоящим В арктических водах поймали рыбу с настоящим

Арктическая рыба с телом, очень устойчивым к низким температурам

TechInsider
Урок для родителей Урок для родителей

Школа меняет жизнь не только детей. К чему надо готовиться взрослым?

Лиза
Открыть в приложении