Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Зажечь плазму для термояда и сделать зеркало для рентгена Зажечь плазму для термояда и сделать зеркало для рентгена

Академик Григорий Денисов — чем занимаются физики в ИПФ РАН Нижнего Новгорода

Наука и жизнь
Бережный уход Бережный уход

Попробуем вместе построить маршрут к новому, идеальному месту работы

Лиза
Россияне пока не догоняют Россияне пока не догоняют

Как сравнить уровень жизни в разных странах?

Монокль
Хождение по мухам Хождение по мухам

Как испортился квартирный вопрос и что с этим делать

Weekend
Когда гигиеническая помада не помогла: что делать, если сильно трескаются губы Когда гигиеническая помада не помогла: что делать, если сильно трескаются губы

Почему трескаются губы?

ТехИнсайдер
Как есть больше белка: простые советы, которые помогут сделать питание полноценным, а тело - подтянутым Как есть больше белка: простые советы, которые помогут сделать питание полноценным, а тело - подтянутым

Как повысить потребление белка без резких перемен в меню

VOICE
Хореограф Кацура Кан: Не ведитесь на европейское чувство красоты Хореограф Кацура Кан: Не ведитесь на европейское чувство красоты

Интервью с японским хореографом и мастером буто Кацурой Кан

СНОБ
На все четыре стороны На все четыре стороны

Куда отправиться в путешествие за настоящей зимней сказкой?

Добрые советы
Супрематизм сквозь время Супрематизм сквозь время

В1919 году антрополог Альфред Крёбер вывел закон цикличности моды

Дилетант
Как кибернетические протезы делают общество лучше и справедливее Как кибернетические протезы делают общество лучше и справедливее

Как технологии делают жизнь людей проще и комфортнее

ФедералПресс
Сколько волков человеку надо Сколько волков человеку надо

Волк — прекрасный приспособленец и космополит

Наука
В банде только девушки В банде только девушки

«Контрабандистки»: корейское криминальное ретро с женским характером

Weekend
Плечо для внешней торговли Плечо для внешней торговли

Рост российского несырьевого неэнергетического экспорта — в числе приоритетов

РБК
Минимум танинов и никакой выдержки. Как выбрать вино для глинтвейна Минимум танинов и никакой выдержки. Как выбрать вино для глинтвейна

Из какого вина лучшего всего варить глинтвейн

СНОБ
“Он улетел, но обещал вернуться”. Как долго кошка помнит своего хозяина? “Он улетел, но обещал вернуться”. Как долго кошка помнит своего хозяина?

Привязываются ли коты к людям?

ТехИнсайдер
Работа над отношениями Работа над отношениями

Как остановить офисные конфликты и сохранить свой степлер неприкосновенным

VOICE
А теперь начнем сначала А теперь начнем сначала

Истории людей, прошедших дорогой перемен

Men Today
... а вместо сердца пламенный... ротор! ... а вместо сердца пламенный... ротор!

Почему роторным двигателям не удалось завоевать мир?

Зеркало Мира
Ловись, рыбка! Ловись, рыбка!

Выбирайте для своего стола лучшую рыбу

Добрые советы
10 фильмов о фигурном катании: от драмы Крыжовникова до сериала про копию Тутберидзе 10 фильмов о фигурном катании: от драмы Крыжовникова до сериала про копию Тутберидзе

Фильмы о фигурном катании с неожиданными сюжетами

Forbes
Спутник Echostar–24 Спутник Echostar–24

Был осуществлен пуск ракеты-носителя Falcon Heavy со спутником EchoStar–24

Наука и техника
Европа призвала Африку к декарбонизации Европа призвала Африку к декарбонизации

Ежегодные конференции ООН по климату официально называются конференциями сторон

Монокль
Законы взаимного притяжения: 4 вопроса юнгианскому аналитику о выборе партнера Законы взаимного притяжения: 4 вопроса юнгианскому аналитику о выборе партнера

Почему некоторые люди притягивают настолько сильно, что становятся партнерами?

Psychologies
Движение вокруг недвижимости Движение вокруг недвижимости

Как искусственный интеллект захватывает один из ключевых рынков

РБК
«Черный торт»: сериал о семейных тайнах, травмирующем прошлом и опыте эмиграции «Черный торт»: сериал о семейных тайнах, травмирующем прошлом и опыте эмиграции

Сериал «Черный торт»: как миграция влияет на самоидентификацию женщин

Forbes
Врач, который всегда был не согласен с коллегами Врач, который всегда был не согласен с коллегами

Макс фон Петтенкофер — основатель первого в Европе Института гигиены в Мюнхене

Знание – сила
«Немой учитель» «Немой учитель»

Тысячелетняя история книги: от глиняных табличек до электронных ридеров

Зеркало Мира
«Нам пришлось снять шляпу перед нашей субстанцией» «Нам пришлось снять шляпу перед нашей субстанцией»

Наверное, каждый задумывался, как из неживой материи однажды появилась живая

Наука
Как почистить клавиатуру от пыли и крошек: инструкция Как почистить клавиатуру от пыли и крошек: инструкция

Как правильно чистить клавиатуру в домашних условиях

ТехИнсайдер
Как уменьшить нагрузку на глаза при работе на компьютере: 7 важных правил Как уменьшить нагрузку на глаза при работе на компьютере: 7 важных правил

Несколько правил, чтобы больше не сталкиваться с компьютерным синдромом

ТехИнсайдер
Открыть в приложении