Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

ГМ-бактерия разрушила избыточные оксалаты в кишечнике крыс и людей ГМ-бактерия разрушила избыточные оксалаты в кишечнике крыс и людей

Как ученые создали бактерию для борьбы с кишечной гипероксалурией

N+1
Зачем анализировать обратную связь от пользователей приложений: инсайд для тех, кто решил развивать свой продукт Зачем анализировать обратную связь от пользователей приложений: инсайд для тех, кто решил развивать свой продукт

Изучение обратной связи — важный этап в развитии продукта

ТехИнсайдер
Опасно ли летать на старых самолетах и почему их до сих пор так много Опасно ли летать на старых самолетах и почему их до сих пор так много

Почему авиакомпании используют самолеты, которые можно называть пожилыми?

Maxim
Археологи раскопали дом небогатых жителей Помпей Археологи раскопали дом небогатых жителей Помпей

Внутри дома в Помпеях находились предметы быта и остатки мебели

N+1
Краткая история мысли Краткая история мысли

Трактат по философии для подрастающего поколения

kiozk originals
История Товия, или почему ветхозаветные сюжеты стали популярны в эпоху барокко? История Товия, или почему ветхозаветные сюжеты стали популярны в эпоху барокко?

Еще одна интересная картина из постоянной экспозиции Эрмитажа

Правила жизни
Инструмент мечты или экзистенциальная угроза: сможет ли нейросеть заменить художника Инструмент мечты или экзистенциальная угроза: сможет ли нейросеть заменить художника

Человек vs машина: кто способен лучше рисовать картины?

Forbes
Двигатель EmDrive в самом деле нарушает законы физики, или это очередной фейк? Двигатель EmDrive в самом деле нарушает законы физики, или это очередной фейк?

По словам изобретателя, этот двигатель опровергает принципы физики

ТехИнсайдер
Нарциссы: кто это и как вести себя с этими людьми Нарциссы: кто это и как вести себя с этими людьми

Разбираемся, кто такие нарциссы и как с ними взаимодействовать

РБК
Эмили Ратаковски, Шакира и другие роскошные женщины, которым изменили мужья Эмили Ратаковски, Шакира и другие роскошные женщины, которым изменили мужья

Даже звезды порой сталкиваются с циничным обманом

VOICE
Слова — трансгендеры: они сменили род, чтобы нам понравиться Слова — трансгендеры: они сменили род, чтобы нам понравиться

Может ли с течением времени меняться род имен существительных в нашем языке?

ТехИнсайдер
Новый метод позволяет редактировать ДНК миллиарда клеток за один прогон Новый метод позволяет редактировать ДНК миллиарда клеток за один прогон

Как обойтись без вируса и при этом заменить в ДНК целый ген?

ТехИнсайдер
Человечество может погибнуть при экстремальных вариантах изменения климата Человечество может погибнуть при экстремальных вариантах изменения климата

«Четырех всадника» климатического апокалипсиса

ТехИнсайдер
Завтрак инков Завтрак инков

Настоящий перуанец обязательно съест воскресным утром порцию тамалеса

Вокруг света
Райская ягода жаркого лета: выбираем самый сладкий арбуз Райская ягода жаркого лета: выбираем самый сладкий арбуз

Давайте раз и навсегда запомним, как выбрать самый спелый и сладкий арбуз.

ТехИнсайдер
Как развить самодисциплину всего за 5 минут в день Как развить самодисциплину всего за 5 минут в день

Как пустяковые полезные привычки могут привести тебя к большим свершениям

Maxim
8 признаков здорового нарциссизма, которые ведут к успеху 8 признаков здорового нарциссизма, которые ведут к успеху

Здоровый нарциссизм, который способствует личностному росту

Psychologies
Не только для подогрева еды Не только для подогрева еды

10 неочевидных способов использования микроволновки в быту

Лиза
Как не нужно делать: оказалось, что опытные Как не нужно делать: оказалось, что опытные

Опыт — не главный критерий, когда речь заходит об общении кошки и человека

ТехИнсайдер
Футбол и лирика: в прокат вышел документальный фильм о клубе «Манчестер Юнайтед» Футбол и лирика: в прокат вышел документальный фильм о клубе «Манчестер Юнайтед»

До российского проката добрался документальный фильм «Великий «Юнайтед»

Forbes
«Хочу быть вместе с ней»: каким был Михаил Горбачев в мемуарах своей жены Раисы «Хочу быть вместе с ней»: каким был Михаил Горбачев в мемуарах своей жены Раисы

В день смерти Михаила Горбачева Forbes Woman обратился к мемуарам его жены Раисы

Forbes
Вы расстались, а он нашел другую? Признание мужчины комментирует психолог Вы расстались, а он нашел другую? Признание мужчины комментирует психолог

После разрыва ваш бывший быстро нашел утешение в новом романе? Почему?

Psychologies
В Россию возвращаются машины из Ирана. Что нужно знать про Iran Khodro В Россию возвращаются машины из Ирана. Что нужно знать про Iran Khodro

Iran Khodro — французская техника, иранский дизайн и новый амбициозный кроссовер

РБК
Почему пора перестать считать целлюлит недостатком Почему пора перестать считать целлюлит недостатком

Целлюлит — не болезнь: новый взгляд на проблему

Лиза
Луна образовалась в результате столкновения Земли с неизвестной планетой: новые доказательства старой теории Луна образовалась в результате столкновения Земли с неизвестной планетой: новые доказательства старой теории

Следы газов в недрах лунной породы принадлежат только сформировавшейся Земле

ТехИнсайдер
Как русская девочка влюбила в себя Голливуд, но умерла молодой при загадочных обстоятельствах: трагедия Натали Вуд Как русская девочка влюбила в себя Голливуд, но умерла молодой при загадочных обстоятельствах: трагедия Натали Вуд

Натали Вуд была олицетворением сказки о Золушке

VOICE
Хайп мирового масштаба от исследователя NASA. Кто придумал нейросеть Midjourney и отберет ли она работу у живых художников и дизайнеров? Хайп мирового масштаба от исследователя NASA. Кто придумал нейросеть Midjourney и отберет ли она работу у живых художников и дизайнеров?

Может ли машина заменить живых дизайнеров? История нейросети Midjourney

Inc.
Как выглядеть отдохнувшей: 7 рекомендаций Как выглядеть отдохнувшей: 7 рекомендаций

Несколько простых способов освежиться

Psychologies
После людей После людей

Призраки прошлого служат наглядным напоминанием об ошибках человечества

Вокруг света
Платья непрямого действия Платья непрямого действия

Путеводитель по сюрреалистическим мирам Эльзы Скьяпарелли

Weekend
Открыть в приложении