Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Города будущего в настоящем: 10 примеров проектов инновационных городов | Cities of the Future in the Present: 10 Projects of Innovative Cities Worldwide Города будущего в настоящем: 10 примеров проектов инновационных городов | Cities of the Future in the Present: 10 Projects of Innovative Cities Worldwide

Как города меняются прямо на наших глазах

Позитивные изменения
Тобольск: перепрограммирование городского «софта» Тобольск: перепрограммирование городского «софта»

Задача Тобольска — стать туристической столицей Сибири

Эксперт
6 способов защиты от болезни Альцгеймера 6 способов защиты от болезни Альцгеймера

Есть полезные привычки, которые помогут сохранить ясность ума

Psychologies
Ни отеля, ни лошадей: 5 советов, как не испортить себе отпуск невнимательностью к деталям Ни отеля, ни лошадей: 5 советов, как не испортить себе отпуск невнимательностью к деталям

Два москвича собрались в горы, но вместо релакса получили череду казусов

Вокруг света
Как уроженец Сомали построил бизнес на корпоративных переводах с редких языков и заработал $32 млн за год Как уроженец Сомали построил бизнес на корпоративных переводах с редких языков и заработал $32 млн за год

Как Мохамед Хусейн разбогател на переводах?

Inc.
Возобновляемый ресурс: как отработанное ядерное топливо может залить мир энергией Возобновляемый ресурс: как отработанное ядерное топливо может залить мир энергией

Могут ли отходы от ядерного топлива стать ценнейшей энергией?

Forbes
Синдром одомашнивания: отрывок из книги «Парадокс добродетели» Ричарда Рэнгема Синдром одомашнивания: отрывок из книги «Парадокс добродетели» Ричарда Рэнгема

Почему людям свойственны одновременно доброта и жестокость?

СНОБ
Великий угольный путь: что за разъездом? Великий угольный путь: что за разъездом?

БАМ располагает серьезным потенциалом за угольным контуром

Эксперт
Жить – можно Жить – можно

Что такое «биполярка» и почему шизофрения больше не приговор?

Psychologies
«16 эссе об истории искусства». Как описывать и анализировать предметы искусства и культуры «16 эссе об истории искусства». Как описывать и анализировать предметы искусства и культуры

Глава из «16 эссе об истории искусства» — как маски стали музейными экспонатами

N+1
Измельчитель пищевых отходов для раковины: что это такое и зачем он нужен Измельчитель пищевых отходов для раковины: что это такое и зачем он нужен

Диспозер: измельчитель пищевых отходов, который станет частью вашей жизни

CHIP
Как мы дошли до спотифая? Краткая история звукозаписи Как мы дошли до спотифая? Краткая история звукозаписи

Звучащая речь из 19 века преодолела свой путь в 21 век силами не одного ученого

ТехИнсайдер
Моторы-миллионники: четыре уникальных двигателя из прошлого Моторы-миллионники: четыре уникальных двигателя из прошлого

Именно они вызвали к жизни легенду о том, что “раньше машины были надёжнее”

ТехИнсайдер
Керамика, мечи и украшения: в Германии найдены богатые могилы каменного века и раннего Средневековья Керамика, мечи и украшения: в Германии найдены богатые могилы каменного века и раннего Средневековья

Найденные сокровища говорят о долгой истории проживания людей у ​​реки Дунай

ТехИнсайдер
Токсичные отношения: почему VFX-художники называют Marvel худшим работодателем Токсичные отношения: почему VFX-художники называют Marvel худшим работодателем

Выход сериала Marvel вызвал дискуссию о токсичном отношении студии к художникам

Forbes
Переменчивая как погода Переменчивая как погода

Тося Чайкина шутит, что она уже никакой не фрешмен

OK!
Газлайтинг: насилие, о котором не говорят Газлайтинг: насилие, о котором не говорят

Чем опасно постоянное обесценивание наших переживаний и суждений

Psychologies
Переславль-Залесский: для дачников, моряков и не только Переславль-Залесский: для дачников, моряков и не только

Лето в одном из самых красивых городов Золотого кольца

Лиза
Январское извержение вулкана Тонга запустило цунами высотой 90 метров Январское извержение вулкана Тонга запустило цунами высотой 90 метров

Высота цунами, вызванного извержением вулкана, составляла 90 метров

N+1
Потерянного колумбийского колибри-саблекрыла переоткрыли спустя 12 лет Потерянного колумбийского колибри-саблекрыла переоткрыли спустя 12 лет

Орнитолог-любитель нашел потерянного колумбийского колибри

N+1
«Истории о женщинах в дефиците»: Василиса Кузьмина о пути в режиссуре и фильме «Ника» «Истории о женщинах в дефиците»: Василиса Кузьмина о пути в режиссуре и фильме «Ника»

Сложно ли женщине прийти в режиссуру, которую многие считают мужским делом

Forbes
Собаки, которые живут в семьях, могут иметь психологические проблемы Собаки, которые живут в семьях, могут иметь психологические проблемы

Иногда жизнь в квартире — не лучший вариант для собаки!

ТехИнсайдер
В Казахстане раскопали погребения восьми мужчин-воинов и женщины-жрицы эпохи ранних кочевников В Казахстане раскопали погребения восьми мужчин-воинов и женщины-жрицы эпохи ранних кочевников

Эти номады умерли в конце VI – начале V века до нашей эры

N+1
В Узбекистане нашли следы пребывания древних людей возрастом около 90 тысяч лет В Узбекистане нашли следы пребывания древних людей возрастом около 90 тысяч лет

Археологи исследовали памятник Куксарай-2, расположенный на Западном Тянь-Шане

N+1
«За Горбачева»: как создавалась скандальная реклама пиццы Pizza Hut с Михаилом Горбачевым «За Горбачева»: как создавалась скандальная реклама пиццы Pizza Hut с Михаилом Горбачевым

Почему бывший советский лидер согласился стать лицом сети ресторанов пиццы

Правила жизни
Астрономы ищут в океане неизвестный объект, который, вероятно, прибыл из межзвездного пространства Астрономы ищут в океане неизвестный объект, который, вероятно, прибыл из межзвездного пространства

В 2014 году странный объект упал недалеко от побережья Папуа-Новой Гвинеи

ТехИнсайдер
Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе

Такой привычный с детства фрукт, как яблоко, вопросов вроде бы не вызывает

Maxim
Готовится ли Тайвань к войне? Готовится ли Тайвань к войне?

Китаевед Андрей Дагаев — о том, как устроено тайваньское общество

Эксперт
«Дом Дракона»: каким получился долгожданный приквел «Игры престолов» «Дом Дракона»: каким получился долгожданный приквел «Игры престолов»

Каким получился один из самых ожидаемых проектов года, «Дом Дракона»

Forbes
От горячего шоколада до спелой сливы: 7 классных вариантов маникюра для подготовки к осени От горячего шоколада до спелой сливы: 7 классных вариантов маникюра для подготовки к осени

Подборка нейл-дизайнов в самых трендовых оттенках осени

VOICE
Открыть в приложении