Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Богатство, равенство, братство: рецепт благополучной и счастливой жизни граждан ОАЭ Богатство, равенство, братство: рецепт благополучной и счастливой жизни граждан ОАЭ

Бедуины-кочевники смогли превратить свою жизнь в восточную сказку

Вокруг света
Треть цинка попала на Землю вместе с метеоритами Треть цинка попала на Землю вместе с метеоритами

Метеориты могут быть источником цинка, ртути, селена на Земле

N+1
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Праведник из камеры смертников: как убийца чуть не получил Нобелевскую премию за детские книги Праведник из камеры смертников: как убийца чуть не получил Нобелевскую премию за детские книги

Преступник, который выдвигался на Нобелевскую премию девять раз

VOICE
Опасные зависимости, которые при этом абсолютно легальны Опасные зависимости, которые при этом абсолютно легальны

Зависимости, которые иногда даже пропагандируются!

Maxim
Формируем полезные привычки: 3 лайфхака Формируем полезные привычки: 3 лайфхака

Как без лишних усилий развить и закрепить желаемое поведение

Psychologies
Как выглядит и живет женщина с ногтями длиной 130 сантиметров Как выглядит и живет женщина с ногтями длиной 130 сантиметров

Диана Армстронг отращивает ноги уже 25 лет

VOICE
Несовместимая пара: как быть, если ты и твой мужчина слишком разные люди Несовместимая пара: как быть, если ты и твой мужчина слишком разные люди

Как построить счастливые отношения, если вы очевидно не подходите друг другу

VOICE
Убийцы Барби и Кен: как молодые супруги стали главными маньяками Канады Убийцы Барби и Кен: как молодые супруги стали главными маньяками Канады

Они годами вселяли страх в молодых женщин и девочек пригорода Торонто

VOICE
«Я почитала аффирмации и не выздоровела»: почему не стоит слишком увлекаться психосоматикой «Я почитала аффирмации и не выздоровела»: почему не стоит слишком увлекаться психосоматикой

Роль психосоматики в последнее время явно преувеличена, и вот почему

Psychologies
Гид по метаверсу от Покраса Гид по метаверсу от Покраса

Покрас Лампас — о метаверсе, метаценностях и метамодернизме

Собака.ru
Неочевидные детали, на которые нужно обратить внимание при покупке б/у смартфона Неочевидные детали, на которые нужно обратить внимание при покупке б/у смартфона

Как купить подержанный телефон и не облажаться

Maxim
Букеровский лауреат Джордж Сондерс — о рассказе Льва Толстого «Хозяин и работник». Фрагмент книги «Купание в пруду под дождем» Букеровский лауреат Джордж Сондерс — о рассказе Льва Толстого «Хозяин и работник». Фрагмент книги «Купание в пруду под дождем»

Фрагмент книги, посвященный рассказу Льва Толстого «Хозяин и работник»

Правила жизни
Что такое похмелье с точки зрения науки? И как быстро от него избавиться? Что такое похмелье с точки зрения науки? И как быстро от него избавиться?

Может ли современная медицина ответить на вопрос как избавиться от похмелья?

ТехИнсайдер
Татьяна Абрамова: «Некоторые называют меня стервой» Татьяна Абрамова: «Некоторые называют меня стервой»

О жизни, гастролях и интересных знакомствах — рассказывает Татьяна Абрамова

Коллекция. Караван историй
Материнская депрессия: как проходит групповая терапия для мам Материнская депрессия: как проходит групповая терапия для мам

Рассказываем об опыте потока психотерапевтической группы «Мама в порядке»

Psychologies
Что происходит, когда семью содержит женщина? Что происходит, когда семью содержит женщина?

Женщины, которые полностью обеспечивают семью, рассказали о своем выборе

Psychologies
Советские мультфильмы, которые учили детей вредному Советские мультфильмы, которые учили детей вредному

Если пересмотреть мультики нашего детства, то к многим из них возникают вопросы

Maxim
Два в одном: спортивный болид и электрокар в концепции Porsche Taycan Два в одном: спортивный болид и электрокар в концепции Porsche Taycan

Porsche Taycan принято считать первым электромобилем немецкого концерна Porsche

ТехИнсайдер
Вот что будет с телом, если каждый день стоять в планке Вот что будет с телом, если каждый день стоять в планке

Действительно ли планка — идеальное упражнение?

ТехИнсайдер
Послевоенные преступления Послевоенные преступления

Жан-Пьер Мельвиль и его нуары

Weekend
5 книг, которые помогут пережить расставание 5 книг, которые помогут пережить расставание

Книги, которые помогут найти точки опоры после расставания

СНОБ
Мифы о месячных: отвечаем на вопросы, которые ты стеснялась задать Мифы о месячных: отвечаем на вопросы, которые ты стеснялась задать

Собрали волнующие вопросы о месячных и попросили экспертов внести ясность

VOICE
Как развить самодисциплину всего за 5 минут в день Как развить самодисциплину всего за 5 минут в день

Как пустяковые полезные привычки могут привести тебя к большим свершениям

Maxim
Режиссер Келли Райхардт — о фильме «Первая корова», внутренней кухне кино и о том, как снимать кино об Америке начала XIX века Режиссер Келли Райхардт — о фильме «Первая корова», внутренней кухне кино и о том, как снимать кино об Америке начала XIX века

Вспоминаем наше интервью с Келли Райхардт о картине «Первая корова»

Правила жизни
Посмотрите на 10 самых древних произведений искусства Посмотрите на 10 самых древних произведений искусства

Как самовыражался древний человек?

ТехИнсайдер
«Дождь, пар и скорость» Уильяма Тернера, или Как Великобритания пересела на железнодорожные рельсы «Дождь, пар и скорость» Уильяма Тернера, или Как Великобритания пересела на железнодорожные рельсы

Погружаемся в пучину промышленной революции в Великобритании

Правила жизни
Это просто белый яд: разоблачаем самые распространённые мифы о соли Это просто белый яд: разоблачаем самые распространённые мифы о соли

Эту самую простую приправу обвиняют во многих грехах

VOICE
Рубцы на коже: почему необходим комплексный подход к лечению Рубцы на коже: почему необходим комплексный подход к лечению

Можно ли сделать так, чтобы рубцы стали незаметными?

Psychologies
От чего стоит отказаться при повышенном сахаре в крови: 9 опасных продуктов, о которых должен знать каждый От чего стоит отказаться при повышенном сахаре в крови: 9 опасных продуктов, о которых должен знать каждый

От эти продуктов лучше отказаться — на время или навсегда

ТехИнсайдер
Открыть в приложении