Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Карина-вирус! Карина-вирус!

В это тревожное время героиней обложки стала главная медсестра страны

Maxim
Что такое RunFlat-шины и чем они отличаются от обычных Что такое RunFlat-шины и чем они отличаются от обычных

RunFlat — шины, на которых можно ездить без воздуха

РБК
Владимир Васильев: «Гонка технологических «вооружений» уже началась» Владимир Васильев: «Гонка технологических «вооружений» уже началась»

Владимир Васильев – о влиянии больших языковых моделей на будущее человека

РБК
Токсичная родня Токсичная родня

Как распознать токсичных родственников и что с ними делать

Лиза
Агенты Дмитрия Самозванца убивают сына Бориса Годунова Агенты Дмитрия Самозванца убивают сына Бориса Годунова

Момент, когда низвергнутый царь, сумевший дать отпор убийцам, лишается сил

Дилетант
Ты «чушпан», а я пацан. О чем сериал «Слово пацана. Кровь на асфальте» Ты «чушпан», а я пацан. О чем сериал «Слово пацана. Кровь на асфальте»

Почему «Слово пацана. Кровь на асфальте» стал таким популярным

Psychologies
Genesis GV80. Премиальный — не значит дорогой Genesis GV80. Премиальный — не значит дорогой

Genesis GV80 — альтернатива премиальным кроссоверам BMW и Medcedes

4x4 Club
«Современные фильмы страшно захламлены без всякого смысла» «Современные фильмы страшно захламлены без всякого смысла»

Елена Жукова о том, где и как живут герои в российском кино

Weekend
Супрематизм сквозь время Супрематизм сквозь время

В1919 году антрополог Альфред Крёбер вывел закон цикличности моды

Дилетант
«О самом лютом из владык» «О самом лютом из владык»

В том, что Влад Дракул был реальной исторической личностью, сомнений нет

Дилетант
«Автор неизвестен»: объективная ценность произведения искусства «Автор неизвестен»: объективная ценность произведения искусства

Можно ли воспринимать анонимные произведения искусства

Монокль
Потребители поддержали мясные цены Потребители поддержали мясные цены

Увеличившийся спрос стал стабилизирующим фактором на рынке свинины и птицы

Агроинвестор
Дорого внимание Дорого внимание

Ольга Карпуть разбирается, действительно ли юмор продает

Правила жизни
Философия нового времени Философия нового времени

Современное пространство в стиле минимализм для комфортной жизни большой семьи

SALON-Interior
Переучреждение Московской патриархии в 1943 году и наследие Поместного собора 1917–1918 годов Переучреждение Московской патриархии в 1943 году и наследие Поместного собора 1917–1918 годов

Чем являлись события 1943 года с точки зрения канонов Русской церкви?

Наука
Планетам земной группы разрешили формироваться в сильно облученных протопланетных дисках Планетам земной группы разрешили формироваться в сильно облученных протопланетных дисках

Как может протекать процесс формирования планет земной группы

N+1
Привидения Дома Кранкенгагена Привидения Дома Кранкенгагена

Дом Кранкенгагена известен в Петербурге всем, чья страсть — привидения

СНОБ
«Плохая девочка», Пугачева под фонк и новый пик Лолиты: как ремейки захватили чарты «Плохая девочка», Пугачева под фонк и новый пик Лолиты: как ремейки захватили чарты

Почему все вдруг пошли делать и слушать ремейки старых песен

Правила жизни
8 фактов о фильме «Убить Билла» 8 фактов о фильме «Убить Билла»

Как Тарантино снял безделушку, которую пересматривают тысячу раз

Maxim
Будущее сейчас Будущее сейчас

Андрей Лихачёв рассказал о том, что делает СберСити уникальным для России и мира

Robb Report
Современные «Отцы и дети»: психологический разбор героев нового российского сериала «Цикады» Современные «Отцы и дети»: психологический разбор героев нового российского сериала «Цикады»

На что могут повлиять детско-родительские отношения? Разбираем на «Цикадах»

Psychologies
Сбитый гонщик Сбитый гонщик

«Феррари»: разочаровывающий долгострой Майкла Манна

Weekend
Корица Корица

Почему вам стоит добавить корицу в свой рацион?

Здоровье
Работа над отношениями Работа над отношениями

Как остановить офисные конфликты и сохранить свой степлер неприкосновенным

VOICE
За гранью возможного За гранью возможного

Какие скрытые резервы хранит в себе человеческий организм

Зеркало Мира
Рецепт донны Тани Рецепт донны Тани

Майя Кучерская о бразильской балерине Татьяне Лесковой

Seasons of life
(Не)сладкая история (Не)сладкая история

5 простых советов, которые помогут снизить риск диабета

Лиза
Елена Карпенко: «Самым главным по-прежнему остается контент» Елена Карпенко: «Самым главным по-прежнему остается контент»

О конкуренции традиционного ТВ и онлайн-платформ

РБК
Уметь = преуспеть Уметь = преуспеть

Есть такие умения, которые пригодятся везде и всегда. Их стоит отточить

Лиза
Банкам недокладывают денег? Банкам недокладывают денег?

Банковский сектор перешел в состояние дефицита ликвидности

Монокль
Открыть в приложении