Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Будущее пятого поколения Будущее пятого поколения

Время 4G на исходе. 5G серьезно изменит нашу жизнь

Популярная механика
«Смотришь на эти вывески, и они честно заявляют — стало хуже». Что не так с ребрендингом западных компаний, попавших в руки российских бизнесменов «Смотришь на эти вывески, и они честно заявляют — стало хуже». Что не так с ребрендингом западных компаний, попавших в руки российских бизнесменов

Почему правильный ребрендинг — это важно? И почему он не у всех получается?

Inc.
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Вместо чая с печеньками. 5 вариантов правильных вечерних перекусов Вместо чая с печеньками. 5 вариантов правильных вечерних перекусов

Чтобы питание способствовало стройности, перекусывать можно и нужно

Лиза
Моторы-миллионники: четыре уникальных двигателя из прошлого Моторы-миллионники: четыре уникальных двигателя из прошлого

Именно они вызвали к жизни легенду о том, что “раньше машины были надёжнее”

ТехИнсайдер
Почему легкие свистят и стоит ли переживать по этому поводу? Почему легкие свистят и стоит ли переживать по этому поводу?

Свистящее дыхание — обычное явление, с которым сталкивается большинство из нас

ТехИнсайдер
Как создать финансовую подушку безопасности Как создать финансовую подушку безопасности

Как сформировать финансовую подушку, можно ли иногда изымать из нее средства?

Psychologies
Идеальное выдуманное Идеальное выдуманное

Автопромышленность параллельного СССР

Автопилот
Немецкий дьявол с итальянскими корнями, привезенный из Америки: откуда взялось слово Немецкий дьявол с итальянскими корнями, привезенный из Америки: откуда взялось слово

Откуда взялось слово картофель и что оно означает?

ТехИнсайдер
Почему вы просыпаетесь уставшим: 8 причин Почему вы просыпаетесь уставшим: 8 причин

Многие люди часто не просто не высыпаются, а встают разбитыми и уставшими

ТехИнсайдер
Инстаграмное место: как соцсети изменили представления об идеальном пространстве Инстаграмное место: как соцсети изменили представления об идеальном пространстве

Отрывок из книги «Формула грез» — почему минимализм превратился в эстетику

Forbes
5 способов спасти себя от разрушительного стресса 5 способов спасти себя от разрушительного стресса

Комплекс мер по поддержанию нормальной работы мозга во время стресса

Psychologies
У древних колоссальных динозавров была мягкая У древних колоссальных динозавров была мягкая

Что позволяло огромным зауроподам иметь такой большой вес?

ТехИнсайдер
Стоит ли продвигать бизнес с помощью личного бренда: история функционального печенья BIKKI Стоит ли продвигать бизнес с помощью личного бренда: история функционального печенья BIKKI

Как личный бренд поможет сократить бюджет на маркетинг

VC.RU
Правила самогонщиков: почему медь вкуснее нержавейки и как отсечь хвосты на глаз Правила самогонщиков: почему медь вкуснее нержавейки и как отсечь хвосты на глаз

Рано или поздно любой благородный муж приходит к мысли о самогоноварении

Maxim
Стрит-арт, яхтинг, сиг: что смотреть и пробовать в Нижнем Новгороде Стрит-арт, яхтинг, сиг: что смотреть и пробовать в Нижнем Новгороде

Нижний Новгород — один из центров отечественного гастротуризма

РБК
В пищевых добавках обнаружили избыток вещества, составляющего основу для лекарства от болезни Паркинсона В пищевых добавках обнаружили избыток вещества, составляющего основу для лекарства от болезни Паркинсона

Пищевые добавки могут содержать необычайно высокие уровни молекулы леводопа

ТехИнсайдер
Как выглядела прокладка кабеля под Атлантическим океаном в 1866 году Как выглядела прокладка кабеля под Атлантическим океаном в 1866 году

Как первопроходцы прокладывали кабель через океан в XIX веке?

Maxim
Все время спешим и ничего не успеваем: виноват ли в этом цифровой прогресс? Все время спешим и ничего не успеваем: виноват ли в этом цифровой прогресс?

Отрывок из книги «Времени в обрез: ускорение жизни при цифровом капитализме»

Psychologies
3 современные российские книги о детско-родительской травме 3 современные российские книги о детско-родительской травме

Бибилиотерапия, которая поможет осмыслить детско-родительские травмы

Psychologies
«Тараканы» руководителя: как мышление лидера влияет на команду «Тараканы» руководителя: как мышление лидера влияет на команду

Сотрудники перенимают модель поведения руководителя

Psychologies
Биотехнологии в борьбе с кровососами: ученые нашли способ избавиться от комаров на даче. Теперь отдыхаем спокойно! Биотехнологии в борьбе с кровососами: ученые нашли способ избавиться от комаров на даче. Теперь отдыхаем спокойно!

Решения, которые позволяют быстро избавиться от насекомых

ТехИнсайдер
Переход на приготовленную пищу помог людям тратить на жевание в пять раз меньше энергии Переход на приготовленную пищу помог людям тратить на жевание в пять раз меньше энергии

Человек тратит на жевание до 0,5 процента от обмена веществ в покое

N+1
Чертоги памяти. Как работает «метод Шерлока» в реальности и можно ли его освоить, если вы простой смертный Чертоги памяти. Как работает «метод Шерлока» в реальности и можно ли его освоить, если вы простой смертный

Как работает одна из самых популярных мнемонических техник?

Inc.
Можно ли удлинить ногтевое ложе? Да! Рассказываем, как это сделать Можно ли удлинить ногтевое ложе? Да! Рассказываем, как это сделать

Что делать, если природа не подарила тебе изящные ногти?

VOICE
7 советов, которые помогут похудеть после 40 лет 7 советов, которые помогут похудеть после 40 лет

Кто сказал, что красивая фигура после 40 лет – сложно?

ТехИнсайдер
Слизь так важна для жизни, что разные виды самостоятельно получали ее в ходе эволюции снова и снова Слизь так важна для жизни, что разные виды самостоятельно получали ее в ходе эволюции снова и снова

Слизь появлялась на мировом эволюционном древе ни один и не два раза

ТехИнсайдер
Никита Ковтунов — об учебе у Брусникина и преподавании в Gogol School Никита Ковтунов — об учебе у Брусникина и преподавании в Gogol School

Никита Ковтунов — об универсальности артиста и русской литературе

РБК
Ядовитые реки, отравленные моря Ядовитые реки, отравленные моря

Катастрофы, угрожающие живым организмам, происходят довольно часто

Наука и жизнь
Археологи обнаружили в Фанагории детскую спальню хазарского времени Археологи обнаружили в Фанагории детскую спальню хазарского времени

Владимир Кузнецов рассказал о результатах раскопок средневековой Фанагории

N+1
Открыть в приложении