Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дайте «Оскар» этой богине! Дайте «Оскар» этой богине!

В мире более 70 пород кошек, и выделить самых красивых очень сложно

Лиза
Одна вокруг света: путешествие через вулкан Тунупа и розовый фламинго, дитя заката Одна вокруг света: путешествие через вулкан Тунупа и розовый фламинго, дитя заката

История о трудной дороге и бескрайних залежах соли, в которых отражается небо

Forbes
Желаю всего самого лучшего Желаю всего самого лучшего

Что будет, если попробовать желать себе всего самого лучшего

Psychologies
Почему черные дыры по праву зовутся самыми опасными объектами во Вселенной Почему черные дыры по праву зовутся самыми опасными объектами во Вселенной

Черные дыры — нарушение законов физики, чудовищная гравитация и зверский аппетит

ТехИнсайдер
Как пить, чтобы похудеть Как пить, чтобы похудеть

Влияет ли употребление алкоголя на набор веса?

Maxim
Какими были валютные магазины «Березка» в СССР Какими были валютные магазины «Березка» в СССР

Что за магазины «Березка» были в СССР

Forbes
Что такое сознание. Теперь есть ответ? Что такое сознание. Теперь есть ответ?

Физики предложили теорию сознания. Она основана на идеях теории относительности

ТехИнсайдер
«Боец музыкального фронта» «Боец музыкального фронта»

Жавдет Айдаров навсегда остался настоящим ленинградцем

Дилетант
Почему собакам не нравятся некоторые люди Почему собакам не нравятся некоторые люди

Даже самый дружелюбный пес может облаять человека, который ему не нравится

ТехИнсайдер
Тело Дженнифер: что Лопес делает с собой, чтобы в 53 выглядеть на 30 — уроки антистарения Тело Дженнифер: что Лопес делает с собой, чтобы в 53 выглядеть на 30 — уроки антистарения

Джей Ло годами (да что там годами — десятилетиями) живет в турбо-режиме

VOICE
Беги быстрее: как спорт превратился в социальный лифт и почему он не всегда работает Беги быстрее: как спорт превратился в социальный лифт и почему он не всегда работает

Почему в большом спорте одни добиваются успеха, а другие уносят с собой травмы

Forbes
Моторы-миллионники: четыре уникальных двигателя из прошлого Моторы-миллионники: четыре уникальных двигателя из прошлого

Именно они вызвали к жизни легенду о том, что “раньше машины были надёжнее”

ТехИнсайдер
Зависимость и независимость: как найти баланс? Зависимость и независимость: как найти баланс?

Взрослая личность вполне способна развить в себе недостающие качества

Psychologies
В пищевых добавках обнаружили избыток вещества, составляющего основу для лекарства от болезни Паркинсона В пищевых добавках обнаружили избыток вещества, составляющего основу для лекарства от болезни Паркинсона

Пищевые добавки могут содержать необычайно высокие уровни молекулы леводопа

ТехИнсайдер
Истощение эго: почему мы устаем от принятия решений Истощение эго: почему мы устаем от принятия решений

Как мы принимаем решения и почему от этого так сильно устаем?

Psychologies
Рассекая волны: почему женщины вынуждены делать аборты за границей или посреди моря Рассекая волны: почему женщины вынуждены делать аборты за границей или посреди моря

Кто помогает женщинам делать аборты и с какими сложностями они сталкиваются

Forbes
История одной песни: «Gangnam Style», PSY, 2012 История одной песни: «Gangnam Style», PSY, 2012

Летом 2012 года YouTube пережил первое в своей истории музыкальное потрясение

Maxim
Давай голосом. Вспоминаем историю Siri — голосового помощника, который опередил Google, продался Apple и изменил жизни миллионов Давай голосом. Вспоминаем историю Siri — голосового помощника, который опередил Google, продался Apple и изменил жизни миллионов

Отрывок из книги «Harvard Business Review: 10 лучших статей»

Inc.
Фрагмент книги «О чем молчит Ласточка» — потенциального международного бестселлера о сложных отношениях Фрагмент книги «О чем молчит Ласточка» — потенциального международного бестселлера о сложных отношениях

Отрывок из «О чем молчит Ласточка» — сложной истории об отношениях двух мужчин

Правила жизни
«Люди мы русские, имена же наши Карл, Инегельд, Фарлоф...» «Люди мы русские, имена же наши Карл, Инегельд, Фарлоф...»

У сторонников версии о призвании норманнов на Русь есть железный аргумент

Дилетант
Конец двусмысленности Конец двусмысленности

Краткая история культурных реформ — от открытия до закрытия «Гоголь-центра»

Weekend
История одной вещи: орешки со сгущенкой — один из самых любимых советских десертов История одной вещи: орешки со сгущенкой — один из самых любимых советских десертов

Рассказываем о орешках со сгущенкой из СССР и делимся рецептом

Правила жизни
Как оптимизировать Windows 11 и Windows 10 для игр: компьютер будет «летать»! Как оптимизировать Windows 11 и Windows 10 для игр: компьютер будет «летать»!

Мало купить мощный компьютер, его нужно еще и оптимизировать

ТехИнсайдер
6 фруктов, которые богаты белком 6 фруктов, которые богаты белком

Если вы следите за потреблением белка, обратите внимание на эти фрукты

ТехИнсайдер
Как подключить ноутбук к монитору: провода необязательны Как подключить ноутбук к монитору: провода необязательны

Как легко подключить лэптоп к обычному монитору?

CHIP
Пять золотых Пять золотых

В истории наградной системы особое место занимают золотые офицерские кресты

Дилетант
Как спланировать бюджет на месяц, чтобы сэкономить и заработать на мечту Как спланировать бюджет на месяц, чтобы сэкономить и заработать на мечту

Чтобы сэкономить на ненужных тратах и заработать больше, нужно составить бюджет

ТехИнсайдер
Правила жизни Джеймса Кэмерона Правила жизни Джеймса Кэмерона

Правила жизни культового режиссера Джеймса Кэмерона

Правила жизни
Групповые процессы вместо культа индивидуализма: почему сейчас «я» меняется на «мы» Групповые процессы вместо культа индивидуализма: почему сейчас «я» меняется на «мы»

Почему вдруг важными становятся групповые процессы, а не индивидуальность?

Psychologies
Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе

Такой привычный с детства фрукт, как яблоко, вопросов вроде бы не вызывает

Maxim
Открыть в приложении