Имеет ли значение доминирование английского языка для ИИ-моделей?

ТехИнсайдерHi-Tech

Оказалось, что у ИИ-моделей есть родной язык: чаще всего это английский

Владимир Губайловский

Исследователи Федеральной политехнической школы Лозанны (EPFL) показали, что большие языковые модели, первоначально обученные на английских текстах, похоже, сами используют английский для внутренних задач, даже когда получают подсказки (промпты) на другом языке. Поскольку ИИ все сильнее вмешивается в нашу жизнь, такое превалирование английского может иметь самые серьезные последствия в отношении языковых и культурных предубеждений.

Большие языковые модели, такие как ChatGPT, покорили мир, удивив нас своей способностью понимать наши слова и отвечать на нашем родном языке — гладко и связанно. Но есть нюанс: оказывается у них есть родной язык, и этот язык — английский.

Хотя с большими языковые моделями (LLM), такими как ChatGPT от Open AI и Gemini от Google, можно взаимодействовать на любом языке, первоначально они обучены работе с сотнями миллиардов текстовых параметров, в основном, на английском. Некоторые исследователи выдвинули гипотезу, что большую часть внутренней обработки LLM выполняют на английском языке и переводят полученный текст на целевой язык в самый последний момент. Однако доказательств этому до сих пор было мало.

Тестирование Llama

Исследователи Федеральной политехнической школы Лозанны (EPFL) изучили LLM с открытым исходным кодом Llama-2 (Large Language Model Meta (признана экстремистской организацией на территории РФ) AI), чтобы определить, какие языки использовались на каких этапах вычислительной цепочки.

«Большие языковые модели обучены предсказывать следующее слово. Они делают это, сопоставляя каждое слово с вектором чисел, по сути, с точкой в многомерном пространстве данных. Например, слово "the" всегда будет находиться в одной и той же фиксированной точке координат», — пояснил профессор Роберт Уэст, возглавивший исследование.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Палеонтологи нашли родственников европейских драконов-ольма в Казахстане Палеонтологи нашли родственников европейских драконов-ольма в Казахстане

У современных амфибий-драконов нашлись древние родственники

ТехИнсайдер
Как США стали сверхдержавой и почему им в этом помогли союзы с диктаторами и Голливуд Как США стали сверхдержавой и почему им в этом помогли союзы с диктаторами и Голливуд

Глава из книги «Американцы и все остальные: Истоки и смысл внешней политики США»

Forbes
Японцы представили 16-килограммовую робособаку с открытой архитектурой Японцы представили 16-килограммовую робособаку с открытой архитектурой

Робособаку MEVIUS можно собрать из коммерчески доступных компонентов

N+1
Как и зачем айтишник из Якутии пытается сохранить исчезающие языки малочисленных народов России с помощью современных технологий Как и зачем айтишник из Якутии пытается сохранить исчезающие языки малочисленных народов России с помощью современных технологий

Как эколог стал IT-специалистом и сложно ли ИИ говорить на редких языках

СНОБ
Бегом-бегом: 6 секретов, как сэкономить время и везде успеть Бегом-бегом: 6 секретов, как сэкономить время и везде успеть

Как научиться трезво оценивать свой список задач и успевать намного больше?

Psychologies
Если вы хотите завести питомца: 8 вопросов, которые стоит задать себе Если вы хотите завести питомца: 8 вопросов, которые стоит задать себе

Если вы подумываете о том, чтобы купить или взять из приюта животное, не спешите

Psychologies
Константин Дебликов: «Насколько ты будешь функциональным, зависит не от протеза, а от тебя» Константин Дебликов: «Насколько ты будешь функциональным, зависит не от протеза, а от тебя»

Человек-киборг Константин Дебликов — каково это жить с новыми и разными руками

РБК
Фарфоровый камин и китайский кабинет: как реставраторы работают на деньги меценатов Фарфоровый камин и китайский кабинет: как реставраторы работают на деньги меценатов

О сложных реставрациях-реконструкциях, выполненных на деньги меценатов

Forbes
По ком звонит телефон По ком звонит телефон

Как работают похитители средств граждан и как им противостоять

Деньги
Инженер придумал сверхэффективную модульную печь для цементной промышленности Инженер придумал сверхэффективную модульную печь для цементной промышленности

На каждую тонну цемента в атмосферу выбрасывается 600 кг углекислого газа

Inc.
Сделка с ангелом: где стартапам ранних стадий найти инвестиции Сделка с ангелом: где стартапам ранних стадий найти инвестиции

Где основателям стартапов искать деньги прямо сейчас

Forbes
Как поведение хозяина влияет на его собаку: объяснение зоопсихолога Как поведение хозяина влияет на его собаку: объяснение зоопсихолога

Поведение собаки зависит от того, что происходит с его хозяевами

Psychologies
Энтони Блант: хранитель королевских картинных галерей и советский разведчик Энтони Блант: хранитель королевских картинных галерей и советский разведчик

О жизни британского аристократа Энтони Бланта

ТехИнсайдер
Катастрофическое вымышленное Катастрофическое вымышленное

«Предчувствие»: Бертран Бонелло объясняет, что такое тревога

Weekend
Правильный путь Правильный путь

Rolls-Royce Джейсона Момоа Phantom II 1929 года стал полностью электрическим

Y Magazine
Пиво и гормоны. Что содержится в пенном напитке и как он влияет на мужчин и женщин Пиво и гормоны. Что содержится в пенном напитке и как он влияет на мужчин и женщин

Собралась купить банку пенного напитка? Не спеши! Выясняем почему

Лиза
Зачем люди коллекционируют кроссовки и почему это хорошая инвестиция Зачем люди коллекционируют кроссовки и почему это хорошая инвестиция

Рассказываем о тех, кто покупает редкие кроссовки и зарабатывает на этом

Maxim
Лучшие друзья не подведут: как и зачем женщины инвестируют в бриллианты Лучшие друзья не подведут: как и зачем женщины инвестируют в бриллианты

Как выбрать инвестиционные бриллианты, какая судьба ждет эти камни

Forbes
6 особенностей квартиры, которые выдают неуверенную в себе женщину 6 особенностей квартиры, которые выдают неуверенную в себе женщину

Что интерьер квартиры может рассказать про самооценку её хозяйки?

Psychologies
Как выглядели самые первые в истории президентские выборы в России Как выглядели самые первые в истории президентские выборы в России

Фотографии невероятного для России события — первых демократических выборов

Maxim
Глава из дебютного романа Светланы Тюльбашевой «Лес» Глава из дебютного романа Светланы Тюльбашевой «Лес»

Роман о кошмарах, которые скрываются не только в темных северных лесах

СНОБ
Не пора ли подумать о протекционизме? Не пора ли подумать о протекционизме?

Протекционизма как системы защиты в России пока нет

Монокль
Без пчел Без пчел

Дроны уже готовятся заменить летающих созданий в садах и на плантациях

ТехИнсайдер
Сельхозпроизводство условно стабильно Сельхозпроизводство условно стабильно

В 2023 году сельхозпроизводство показало небольшое снижение и устойчивость

Агроинвестор
3 вопроса о гипертонии 3 вопроса о гипертонии

Артериальная гипертензия – ведущий фактор риска развития инсультов и инфарктов

Здоровье
«Серьезный вызов даже для передовых технологий» «Серьезный вызов даже для передовых технологий»

Что говорят эксперты о перспективах применения биопринтинга в медицине

РБК
Мирослава Карпович: «Жить в мире с собой и своей совестью – огромное счастье!» Мирослава Карпович: «Жить в мире с собой и своей совестью – огромное счастье!»

Мирослава Карпович про «артистическое» питание, об отношении к хейту и здоровью

Здоровье
Настроим четкость Настроим четкость

3 предвестника близорукости, на которые мало кто обращает внимание

Лиза
Восемь продуктов, повышающих гемоглобин Восемь продуктов, повышающих гемоглобин

Какие продукты помогут повысить гемоглобин в крови и справиться с анемией

РБК
Своевременное вневременное Своевременное вневременное

Как математик Александр Константинов стал художником чистой линии

Weekend
Открыть в приложении