Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

5 типов алкоголиков: к какому можно отнести вас 5 типов алкоголиков: к какому можно отнести вас

Наркологи выделили 5 типов выпивающих людей.

Maxim
Можно ли купить рождения и как вернуть многодетность Можно ли купить рождения и как вернуть многодетность

Способны ли ограничение или запрет абортов повысить рождаемость

Монокль
Никита Мещерский: Инженеры Tesla – гении, воплощающие в жизнь безумные идеи Маска Никита Мещерский: Инженеры Tesla – гении, воплощающие в жизнь безумные идеи Маска

В Cybertruck есть гораздо больше, чем угловатый дизайн и невыполненные обещания

4x4 Club
Мусор оптом: проблема стихийных свалок на Южном Урале Мусор оптом: проблема стихийных свалок на Южном Урале

Как устранить очаги захламления земель?

ФедералПресс
Дешево и сердито Дешево и сердито

Дискаунтеры захватывают российский рынок

Агроинвестор
В мире животных В мире животных

8 мест России, где можно понаблюдать за братьями нашими меньшими

Лиза
Елена Карпенко: «Самым главным по-прежнему остается контент» Елена Карпенко: «Самым главным по-прежнему остается контент»

О конкуренции традиционного ТВ и онлайн-платформ

РБК
Сам себе психолог: как найти внутреннюю опору Сам себе психолог: как найти внутреннюю опору

Как взрастить внутренний стержень?

Правила жизни
Условно-досрочная пенсия Условно-досрочная пенсия

Как сформировать долгосрочные сбережения и разморозить пенсионные в 2024 году

Деньги
Сделаю завтра: почему мы нарушаем дедлайны и как с этим покончить Сделаю завтра: почему мы нарушаем дедлайны и как с этим покончить

Почему многие люди — независимо от силы воли — откладывают дела, срывают сроки

РБК
Изменить себя Изменить себя

Почти на 50% здоровье зависит от образа жизни. Что мы пьем и едим, чем дышим

Лиза
Программа Space Shuttle: смотрите, как не надо делать Программа Space Shuttle: смотрите, как не надо делать

Программа Space Shuttle угодила в ловушку

Монокль
Фабрика счастья: как гуру, коучи и предприниматели зарабатывают на наших эмоциях Фабрика счастья: как гуру, коучи и предприниматели зарабатывают на наших эмоциях

Отрывок из книги «Фабрика счастливых граждан» об экономике счастья

Forbes
Рукокрылые резервуары Рукокрылые резервуары

Почему летучие мыши резко выделяются среди источников инфекционных болезней?

Знание – сила
Сколько секса нужно для счастья? Сколько секса нужно для счастья?

Сколько секса нам нужно?

Добрые советы
Джоли Алиен Джоли Алиен

Художница Джоли Алиен — как найти авторский стиль, чего ждать от моды

Grazia
Время удивительных историй Время удивительных историй

5 интересных историй о путешествиях

СНОБ
Невероятный подвиг 23-летней Матрены Вольской, которая, будучи беременной, спасла 3 225 детей от фашистов Невероятный подвиг 23-летней Матрены Вольской, которая, будучи беременной, спасла 3 225 детей от фашистов

Как простая учительница организовала партизанскую операцию по спасению детей

ТехИнсайдер
Новый код спешит на помощь Новый код спешит на помощь

Программируем 2024-й: как искусственный разум изменит нашу жизнь

Монокль
«Инновационная экосистема Москвы превращает идеи в бизнес» «Инновационная экосистема Москвы превращает идеи в бизнес»

О поддержке в столице высокотехнологичных компаний и роли научной долины МГУ

РБК
Вся правда о мандаринах: какие самые сладкие и без косточек. И самое главное: сколько килограммов в день можно съесть? Вся правда о мандаринах: какие самые сладкие и без косточек. И самое главное: сколько килограммов в день можно съесть?

Как выбрать вкусные мандарины и сколько их можно съесть

ТехИнсайдер
Привыкшие к зеркалу и к сородичам мыши прошли зеркальный тест Привыкшие к зеркалу и к сородичам мыши прошли зеркальный тест

Ученые определили, что отвечает за распознавание себя в зеркале

N+1
Женский шутинг: почему он происходит реже мужского Женский шутинг: почему он происходит реже мужского

Как взаимосвязаны гендер и насилие и почему среди мужчин стрелков больше

Psychologies
Друзья человека: как психология помогает нам находить контакт с животными Друзья человека: как психология помогает нам находить контакт с животными

Почему между зверем и человеком больше общего, чем кажется

Psychologies
От авторства до монополии От авторства до монополии

Как лучше защищать свои творческие и инновационные достижения

Наука и Техника
Еще раз о числе π и о неразрешимой проблеме «квадратуры круга» Еще раз о числе π и о неразрешимой проблеме «квадратуры круга»

Два феномена – число π и египетские пирамиды – связаны невидимыми нитями

Зеркало Мира
Теневой биткоин: Как наказывают майнеров, ворующих электричество Теневой биткоин: Как наказывают майнеров, ворующих электричество

Энергетики сдерживают аппетиты воротил «серого» сектора биткоинов

ФедералПресс
Неизгладимое впечатление Неизгладимое впечатление

Чешский бренд светильников Lasvit переосмысливает ботанические принты

Robb Report
Все только по делу Все только по делу

Какой Chery выбрать для бизнеса

Автопилот
Новые штаммы ускорят экономику Новые штаммы ускорят экономику

Как генно-модифицированные микроорганизмы повысят эффективность производств

Монокль
Открыть в приложении