Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему 5G – билет в будущее для бизнеса Почему 5G – билет в будущее для бизнеса

Будущее зависит от возможности подключения к интернету

Популярная механика
Хочется пожить для себя Хочется пожить для себя

Почему людей в зрелом возрасте так часто тянет на авантюры

Лиза
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
7 способов повысить интеллект ребенка 7 способов повысить интеллект ребенка

Несколько простых советов, которые помогут улучшить работу детского мозга

Лиза
В захвате Австралии кроликами обвинили английского фермера XIX века В захвате Австралии кроликами обвинили английского фермера XIX века

Австралийские кролики происходят от особей, которых выпустил Томас Остин

N+1
Технологии в помощь здоровому сну: современные и необычные гаджеты для повышения качества сна Технологии в помощь здоровому сну: современные и необычные гаджеты для повышения качества сна

Среди специалистов по сну активно обсуждается вред для сна от гаджетов

ТехИнсайдер
Скоро осень: как спасти дачные растения от предстоящих заморозков Скоро осень: как спасти дачные растения от предстоящих заморозков

Готовим растения к осеннему сезону

ТехИнсайдер
6 признаков того, что в вашей интимной жизни есть проблемы, и как это исправить 6 признаков того, что в вашей интимной жизни есть проблемы, и как это исправить

6 признаков того, что у вас что-то разладилось — и способы все починить

VOICE
Все испортили? Почему дизайнеры наняли моделей плюс-сайз и все равно не угодили девушкам Все испортили? Почему дизайнеры наняли моделей плюс-сайз и все равно не угодили девушкам

Что не так с современной модой для плюс-сайз девушек?

VOICE
Как правильно вести себя с ребенком с тяжелым заболеванием Как правильно вести себя с ребенком с тяжелым заболеванием

Есть ли разница в отношении к больному и здоровому ребенку?

Psychologies
От супергероев до советской драмы: какое кино поможет в воспитании детей От супергероев до советской драмы: какое кино поможет в воспитании детей

Какие фильмы лучше посмотреть вместе с детьми

Psychologies
Кто придумал баскетбол и хоккей? Главное о популярных видах спорта Кто придумал баскетбол и хоккей? Главное о популярных видах спорта

Как появились всем известные регби, фигурное катание и гольф

ТехИнсайдер
Переменчивая как погода Переменчивая как погода

Тося Чайкина шутит, что она уже никакой не фрешмен

OK!
Греть предметы, а не воздух: в чем особенность инфракрасных обогревателей Греть предметы, а не воздух: в чем особенность инфракрасных обогревателей

Какой обогреватель лучше — инфракрасный или конвекционный?

CHIP
Биологи построили теорию происхождения сложных клеток, из которых построены высшие организмы, в том числе человек Биологи построили теорию происхождения сложных клеток, из которых построены высшие организмы, в том числе человек

Как возникают сложные клетки — эукариоты?

ТехИнсайдер
Бабочки умеют мигрировать не хуже птиц: удивительное открытие Бабочки умеют мигрировать не хуже птиц: удивительное открытие

Как насекомое может сохранять совершенно прямую траекторию полёта?

ТехИнсайдер
Святое Собеседование: рождение жанра Святое Собеседование: рождение жанра

Живописец Ян ван Эйк жил по принципу: «любой каприз за ваши деньги»

Дилетант
Биоархеологи обнаружили различия в рационе мужчин и женщин из римского некрополя Биоархеологи обнаружили различия в рационе мужчин и женщин из римского некрополя

Женщины и мужчины в Риме питались по-разному

N+1
А если он не бил, а просто замахнулся? Виды насилия в семье и когда точно пора бежать А если он не бил, а просто замахнулся? Виды насилия в семье и когда точно пора бежать

Каким бывает насилие в семье, и когда стоит расставаться

Psychologies
Вернуть страсть: как снова соблазнить мужа, если вы давно вместе Вернуть страсть: как снова соблазнить мужа, если вы давно вместе

Существует ли способ разжечь сексуальный пыл?

VOICE
Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна

Знаковые романы Роберта Хайнлайна

ТехИнсайдер
В бедре древнего японца нашли шип хвостокола В бедре древнего японца нашли шип хвостокола

В бедро мужчине, жившему около 429–827 г. н. э., был воткнут шип хвостокола

N+1
Луна образовалась в результате столкновения Земли с неизвестной планетой: новые доказательства старой теории Луна образовалась в результате столкновения Земли с неизвестной планетой: новые доказательства старой теории

Следы газов в недрах лунной породы принадлежат только сформировавшейся Земле

ТехИнсайдер
Физики пленили нейтральные атомы с помощью металинзы Физики пленили нейтральные атомы с помощью металинзы

Физики изготовили кремниевую металинзу для нужд оптических пинцетов и решеток

N+1
Многочасовое сидение может вызывать проблемы со здоровьем. Как минимизировать риски? Многочасовое сидение может вызывать проблемы со здоровьем. Как минимизировать риски?

Что делать, если ваша работа связана с сидячим образом жизни?

ТехИнсайдер
Слишком консервативен: какими получились рассказы Владимира Сорокина о женщинах Слишком консервативен: какими получились рассказы Владимира Сорокина о женщинах

Владимир Сорокин о женщинах — стереотипно и мизогинно

Forbes
Часики больше не тикают: есть ли правильный ответ на вопрос «когда рожать» Часики больше не тикают: есть ли правильный ответ на вопрос «когда рожать»

Почему на женщин влияют стереотипы о том, что она должна реализоваться как мать

Forbes
Шнековая или центробежная соковыжималка: чей сок лучше Шнековая или центробежная соковыжималка: чей сок лучше

Чем отличаются разные соковыжималки по принципу работы?

CHIP
Люди сжульничали независимо от предыдущей победы или поражения Люди сжульничали независимо от предыдущей победы или поражения

От чего зависит жульничество в азартных играх?

N+1
Леонид Федун покидает «Спартак»: он владел клубом 18 лет Леонид Федун покидает «Спартак»: он владел клубом 18 лет

Жизнь «Спартака» при Федуне получилась скомканной

Maxim
Открыть в приложении