Новый алгоритм DeepMind самостоятельно освоил игры Atari

Елизавета Ивтушок

Разработчики DeepMind представили MuZero — алгоритм, который может справиться с любой игрой, не зная правил на начальном этапе. Вместо построения модели игровой среды MuZero использует информацию о текущем и предыдущем шаге, а также о возможном исходе одного из следующих шагов, в результате чего обучается играть самостоятельно. Алгоритм научили играть не только в классические для алгоритмов DeepMind го, сёги и шахматы, на также 57 игр для приставки Atari, включая Ms. Pac-Man. Статья опубликована в журнале Nature.

Одна из ключевых задач машинного обучения — это создание алгоритмов, которые могут эффективно взаимодействовать с какой-либо средой: это может быть какое-то открытое пространство (например, дорога для беспилотного автомобиля) или массив больших данных (например, текстовый корпус для алгоритмов обработки естественного языка). Для ее решения сначала необходимо научиться решать много маленьких задач, одна из которых — планирование дальнейших действий в среде.

Новый алгоритм DeepMind самостоятельно освоил игры Atari

Рекомендуемые статьи

Крысы физиологически и интеллектуально близки к человеку

Самые удивительные и знаменитые арт-объекты мира

Шесть моделей поведения, которые делают любовные отношения счастливыми

Оказывается гитлеровские прихвостни первыми изобрели самолет-невидимку

История нашей героини о том, почему она отказалась от омолаживающих процедур

Какой хайлайтер выбрать и как им правильно пользоваться?

Женщины мечтают об отношениях и первыми теряют в них интерес к партнеру

Ученые нашли одну из самых некрасивых орхидей в мире

«О чем размышляет мужчина, которому за пятьдесят?»

Чтобы ты не ломал голову над подарками под елочку, мы все выбрали за тебя

Президент музея имени Пушкина Ирина Антонова о спонсорах и детях

Мы перестали ходить на каблуках, но стали ли от этого счастливее наши ноги?

Как быть, если у жителя мегаполиса в лифтах начинаются панические атаки?

Отрывок из книги Эрика Канделя «Расстроенная психика»

Фитнес-гуру Наташа Давыдова теперь на ТВ

Эксперты помогают разобраться в проблеме увеличения веса у женщин старше 50 лет

Фрагмент книги «Наука сознания. Современная теория субъективного опыта»

Интервью с основательницей неорусского концепт-стора «Палаты» Юлией Лобойко

Пробный проект, по итогам которого родилось бюро P+Z

Атмосферные серии любимых телешоу гарантируют праздничное настроение

Советы психологов о том, как лучше всего реагировать на критику

Психолог из «Лиза Алерт» делится своей историей

История выборов президента в нашей стране

Десять профессий, над которыми не властны инфляция, санкции и творческие кризисы

Куда дамы любят выгуливать своих новых кавалеров?

Интервью с Анатолием Вассерманом

Сравниваем, как выглядят звезды на обложках журналов, а как – в жизни

Что не так с официальной статистикой люфтваффе времен Второй мировой?

Не спеши отказываться от удивительного кухонного инструмента овощечистки!

Почему большинство людей так склонны любить тех, кто над ними издевается?