Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как запустить Windows с флешки: пошаговая инструкция Как запустить Windows с флешки: пошаговая инструкция

Как создать загрузочную флешку с Windows?

CHIP
Инструмент мечты или экзистенциальная угроза: сможет ли нейросеть заменить художника Инструмент мечты или экзистенциальная угроза: сможет ли нейросеть заменить художника

Человек vs машина: кто способен лучше рисовать картины?

Forbes
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
Как выглядеть отдохнувшей: 7 рекомендаций Как выглядеть отдохнувшей: 7 рекомендаций

Несколько простых способов освежиться

Psychologies
Будем цифросексуалами? Будем цифросексуалами?

Как изменятся наши отношения?

Psychologies
«Мы не говорим, что когда-то будет лучше, мы делаем, чтобы каждый год становилось лучше» «Мы не говорим, что когда-то будет лучше, мы делаем, чтобы каждый год становилось лучше»

Заместитель генерального директора РЖД — о перспективах развития железных дорог

Эксперт
Какие тайны выдают дома Анастасии Волочковой, Николая Баскова и Яны Рудковской о своих владельцах — рассказывает эксперт Какие тайны выдают дома Анастасии Волочковой, Николая Баскова и Яны Рудковской о своих владельцах — рассказывает эксперт

О чем говорит дизайн домов знаменитостей

Maxim
Что такое настоящая любовь к женщине: смешная и мудрая цитата Романа Карцева Что такое настоящая любовь к женщине: смешная и мудрая цитата Романа Карцева

Монологи Романа Карцева смешат нас до сих пор

VOICE
В Южной Корее снова отредактировали собак. Теперь — чтобы укрепить лабрадорам бедра В Южной Корее снова отредактировали собак. Теперь — чтобы укрепить лабрадорам бедра

В Южной Корее родились два генетически модифицированных лабрадора

N+1
Принцесса и драконы: 7 теорий заговора вокруг гибели Дианы Спенсер Принцесса и драконы: 7 теорий заговора вокруг гибели Дианы Спенсер

За 25 лет после гибели Дианы возникло много конспирологических теорий ее кончины

Правила жизни
Воскрешение в воскресенье: как настроиться на тяжёлую неделю Воскрешение в воскресенье: как настроиться на тяжёлую неделю

Как с помощью воскресенья сделать подарок себе будущему

VC.RU
От Нобелевской до Букеровской: как женщины впервые получали литературные премии От Нобелевской до Букеровской: как женщины впервые получали литературные премии

О женщинах, которые первыми получили крупнейшие в мире литературные премии

Forbes
Их сгубила Черная Луна: почему ушли из жизни знаменитости из Их сгубила Черная Луна: почему ушли из жизни знаменитости из

Почему творческие личности покидают мир именно в возрасте 27 лет?

VOICE
Птицетазовые динозавры начали жить стаями уже в юрском периоде Птицетазовые динозавры начали жить стаями уже в юрском периоде

Палеонтологи реконструировали несколько особей лесотозавров разных возрастов

N+1
«Жанна д’Арк из Сирии»: как Назик аль-Абид добивалась свободы для страны и для женщин «Жанна д’Арк из Сирии»: как Назик аль-Абид добивалась свободы для страны и для женщин

Назик аль-Абид — женщина-генерал, посвятившая жизнь борьбе за права женщин

Forbes
Непентес приспособился использовать энергию падающих капель дождя для поимки жертв Непентес приспособился использовать энергию падающих капель дождя для поимки жертв

Механизм ловушки этого растения работает не так, как предполагалось ранее

N+1
Избыточная мужественность: почему слишком много тестостерона — это плохо Избыточная мужественность: почему слишком много тестостерона — это плохо

Разбираемся, как распознать опасно высокий уровень тестостерона

Maxim
Финансовая сепарация: что делать, если женщина материально зависит от мужа Финансовая сепарация: что делать, если женщина материально зависит от мужа

Как бороться с финансовой зависимостью в отношениях?

Psychologies
Бунт женских хромосом: трансгендерные лемминги и консервативные мухи Бунт женских хромосом: трансгендерные лемминги и консервативные мухи

Почему самцов и самок не всегда бывает поровну

СНОБ
В чем разница между 48- и 108-Мп камерами смартфонов, если все они делают 12-Мп снимки? В чем разница между 48- и 108-Мп камерами смартфонов, если все они делают 12-Мп снимки?

Есть ли разница в разрешении камер на смартфоне?

CHIP
Психиатр и специалист по питанию из Гарварда назвала 6 продуктов, которые сохранят мозг «молодым и здоровым» Психиатр и специалист по питанию из Гарварда назвала 6 продуктов, которые сохранят мозг «молодым и здоровым»

Чем витамины группы В полезны для мозга и в каких продуктах они содержатся

Inc.
Сизые горожане Сизые горожане

Почему голуби стали жить рядом с человеком?

Вокруг света
Как воспитать в ребенке внутреннюю свободу — советы Димы Зицера Как воспитать в ребенке внутреннюю свободу — советы Димы Зицера

Что делать, если у ребенка конфликт с учителем?

СНОБ
«Боец музыкального фронта» «Боец музыкального фронта»

Жавдет Айдаров навсегда остался настоящим ленинградцем

Дилетант
Мягкая сила. Как управлять бизнесом в новой реальности: правила первого зампреда правления Росбанка Перизат Шайхиной Мягкая сила. Как управлять бизнесом в новой реальности: правила первого зампреда правления Росбанка Перизат Шайхиной

Как замотивировать сотрудников, не прибегая к авторитарным мерам

Правила жизни
Моторы-миллионники: четыре уникальных двигателя из прошлого Моторы-миллионники: четыре уникальных двигателя из прошлого

Именно они вызвали к жизни легенду о том, что “раньше машины были надёжнее”

ТехИнсайдер
Физики реализовали оптическое стохастическое охлаждение пучков частиц Физики реализовали оптическое стохастическое охлаждение пучков частиц

Физикам удалось реализовать оптическое стохастическое охлаждение пучков частиц

N+1
Йога в самиздате, ритмическая гимнастика по ТВ и суперфуд в трехлитровой банке: каким был ЗОЖ в СССР Йога в самиздате, ритмическая гимнастика по ТВ и суперфуд в трехлитровой банке: каким был ЗОЖ в СССР

Думаете, повальное увлечение ЗОЖем — явление последних 10–15 лет? А вот и нет

Правила жизни
«Пускай родится мальчик»: зачем девочкам дают имена-заклинания «Пускай родится мальчик»: зачем девочкам дают имена-заклинания

Как живут девочки, которым дают имена-заклинания на рождение мальчика?

Forbes
Чилийские игнимбриты объяснили поведение супервулканов перед извержениями Чилийские игнимбриты объяснили поведение супервулканов перед извержениями

Магматические очаги будущих суперизвержений росли всего пару тысяч лет

N+1
Открыть в приложении