Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Какими были валютные магазины «Березка» в СССР Какими были валютные магазины «Березка» в СССР

Что за магазины «Березка» были в СССР

Forbes
«У чёрта на куличках» — это где? Даем геолокацию «куличек», где обитал тот самый чëрт «У чёрта на куличках» — это где? Даем геолокацию «куличек», где обитал тот самый чëрт

«У черта на куличках» есть реальная историческая основа, и даже конкретное место

ТехИнсайдер
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
6 Изобретений Золотого века, которые изменили мир 6 Изобретений Золотого века, которые изменили мир

Без этих изобретений Золотого века наш мир был бы совсем другим

ТехИнсайдер

Страхи в постели часто вообще никак не связаны с реальным положением дел

VOICE
Пространство для роскоши. Очень крутые минивэны из Китая Пространство для роскоши. Очень крутые минивэны из Китая

Шику и пафосу этих китайских автобусов позавидуют многие лимузины

РБК
Репрессии, геноцид, войны: 20 фильмов о коллективной травме и катастрофах прошлого Репрессии, геноцид, войны: 20 фильмов о коллективной травме и катастрофах прошлого

Фильмы об исторических катастрофах и о попытках осмыслить природу зла

Forbes
Генетики нашли сходство в ДНК у неродственных двойников Генетики нашли сходство в ДНК у неродственных двойников

Так ли похожи неродственные двойники?

N+1
Рыбников и Ларионова: неидеальная история любви самой красивой пары советского кинематографа Рыбников и Ларионова: неидеальная история любви самой красивой пары советского кинематографа

Николай Рыбников всю жизнь любил только одну женщину - Аллу Ларионову

VOICE
«Добрый доктор Нильс»: история медбрата, который сотнями убивал пациентов «Добрый доктор Нильс»: история медбрата, который сотнями убивал пациентов

Когда дежурит Нильс Хёгель, смертность пациентов резко возрастает

VOICE
Слизь так важна для жизни, что разные виды самостоятельно получали ее в ходе эволюции снова и снова Слизь так важна для жизни, что разные виды самостоятельно получали ее в ходе эволюции снова и снова

Слизь появлялась на мировом эволюционном древе ни один и не два раза

ТехИнсайдер
Стрит-арт, яхтинг, сиг: что смотреть и пробовать в Нижнем Новгороде Стрит-арт, яхтинг, сиг: что смотреть и пробовать в Нижнем Новгороде

Нижний Новгород — один из центров отечественного гастротуризма

РБК
Как завести автомобиль, у которого сел аккумулятор Как завести автомобиль, у которого сел аккумулятор

Как безопасно завести машину с севшим аккумулятором?

ТехИнсайдер
Уровень воды в Ниле позволил египтянам подвозить камень к месту строительства пирамид Уровень воды в Ниле позволил египтянам подвозить камень к месту строительства пирамид

Как египтяне возводили пирамиды Гизы?

N+1
Милиция его не искала: история «тольяттинского потрошителя», который убивал и насиловал детей Милиция его не искала: история «тольяттинского потрошителя», который убивал и насиловал детей

Во время убийств он испытывал «высшее наслаждение»

VOICE
Археологи раскопали в Хакасии погребение младенца окуневской культуры с кинжалом и мраморным шаром Археологи раскопали в Хакасии погребение младенца окуневской культуры с кинжалом и мраморным шаром

Археологи раскопали в Хакасии необычное погребение младенца окуневской культуры

N+1
Их сгубила Черная Луна: почему ушли из жизни знаменитости из Их сгубила Черная Луна: почему ушли из жизни знаменитости из

Почему творческие личности покидают мир именно в возрасте 27 лет?

VOICE
Как почистить куки в браузере: разбираемся на примере Chrome, Яндекс браузера, и Opera Как почистить куки в браузере: разбираемся на примере Chrome, Яндекс браузера, и Opera

Все рано или поздно задаются вопросом, как почистить куки файлы

CHIP
Человечество может погибнуть при экстремальных вариантах изменения климата Человечество может погибнуть при экстремальных вариантах изменения климата

«Четырех всадника» климатического апокалипсиса

ТехИнсайдер
Оказалось, что эмбрионы птиц проходят Оказалось, что эмбрионы птиц проходят

В какой-то момент эмбрионы птиц больше похожи на динозавров, чем на самих птиц

ТехИнсайдер
Моторы-миллионники: четыре уникальных двигателя из прошлого Моторы-миллионники: четыре уникальных двигателя из прошлого

Именно они вызвали к жизни легенду о том, что “раньше машины были надёжнее”

ТехИнсайдер
Жизненные, провокативные, смешные: лучшие мультсериалы, которые понравятся взрослым больше, чем детям Жизненные, провокативные, смешные: лучшие мультсериалы, которые понравятся взрослым больше, чем детям

Мультфильмы, которые созданы скорее для взрослых

VOICE
Чахоточный шик: как смертельное заболевание превратилось в элемент моды Чахоточный шик: как смертельное заболевание превратилось в элемент моды

Отрывок из книги «Чахоточный шик. История красоты, моды и недуга»

Forbes
Инновации на кухне. Кто и как может стать изобретателем Инновации на кухне. Кто и как может стать изобретателем

Что важно для современного изобретателя и почему не всегда нужен узкий профиль

СНОБ
Как выбрать TWS-наушники: 6 важных критериев Как выбрать TWS-наушники: 6 важных критериев

К выбору TWS-наушников стоит подойти максимально серьезно

CHIP
Тело Дженнифер: что Лопес делает с собой, чтобы в 53 выглядеть на 30 — уроки антистарения Тело Дженнифер: что Лопес делает с собой, чтобы в 53 выглядеть на 30 — уроки антистарения

Джей Ло годами (да что там годами — десятилетиями) живет в турбо-режиме

VOICE
Праведник из камеры смертников: как убийца чуть не получил Нобелевскую премию за детские книги Праведник из камеры смертников: как убийца чуть не получил Нобелевскую премию за детские книги

Преступник, который выдвигался на Нобелевскую премию девять раз

VOICE
Растянутая футболка или стильный халат: зачем нужно красиво одеваться дома? Растянутая футболка или стильный халат: зачем нужно красиво одеваться дома?

Почему мы на улице и мы дома — два разных человека?

Psychologies
«Персеверанс» обнаружил в кратере Езеро вулканические породы вместо осадочных «Персеверанс» обнаружил в кратере Езеро вулканические породы вместо осадочных

Озеро в кратере Езеро исчезло слишком быстро

N+1
Как стать эффективным: 9 простых советов Как стать эффективным: 9 простых советов

Вы упорно работаете, отдаете все силы, но результата почему-то все нет?

Psychologies
Открыть в приложении