Как система KnowHalu помогает бороться с галлюцинацими

ТехИнсайдерHi-Tech

Разработан новый метод борьбы с галлюцинациями больших лингвистических моделей

Исследователи из Университета Иллинойса в Урбане-Шампейне представили систему для обнаружения галлюцинаций в тексте, генерируемом LLM. Система получила название KnowHalu

Владимир Губайловский

Галлюцинация LLM. DALLE-3

Галлюцинации становятся едва ли не главным препятствием в развитии больших лингвистических моделей. Человек хочет использовать модели, но он не может доверять.

Большие языковые модели (LLM) — это диалоговые системы на основе искусственного интеллекта, которые могут отвечать на запросы пользователей и генерировать убедительные тексты, следуя инструкциям пользователя (промптам). После появления ChatGPT, разработанной OpenAI, эти модели становятся все более популярными, и все больше компаний сейчас инвестируют в их разработку.

Но чем чаще люди используют LLM, тем большую ответственность они возлагают на модели. Если необходимо постоянно проверять ответы модели, она просто теряет смысл. Она не должна бы ошибаться, а она ошибается и так редко.

Ее ошибки получили название «галлюцинаций». Можно ли избавиться, если от всех то большинства таких ошибок, или хотя уверенно их диагностировать.

Исследователи из Университета Иллинойса в Урбане-Шампейне представили систему для обнаружения галлюцинаций в тексте, генерируемом LLM. Система получила название KnowHalu. Она описана в статье, опубликованной на сервере препринтов arXiv.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему вино традиционно продается в бутылках объемом 750 мл, а не ровно литр? Почему вино традиционно продается в бутылках объемом 750 мл, а не ровно литр?

Почему винные бутылки объемом 0.75 литра стали мировым стандартом?

ТехИнсайдер
Язык цветов Язык цветов

Учимся выражать чувства с помощью правильно составленного букета

Лиза
ChatGPT превзошел врачей в оценке респираторных заболеваний у детей ChatGPT превзошел врачей в оценке респираторных заболеваний у детей

В оценке респираторных заболеваний ChatGPT показал лучшие результаты, чем врачи

ТехИнсайдер
Российские физики объединили флаксониумы и трансмон в трехкубитный вентиль Российские физики объединили флаксониумы и трансмон в трехкубитный вентиль

Ученые предложили новый способ реализации быстрой трехкубитной операции

N+1
Февральская революция: как искусственный интеллект может повысить производительность труда Февральская революция: как искусственный интеллект может повысить производительность труда

Русские ученые устроили шестую промышленную революцию!

ТехИнсайдер
Почему косатки атакуют лодки по всему миру — нашлось объяснение Почему косатки атакуют лодки по всему миру — нашлось объяснение

Оказалось, что юные косатки нападают на лодки просто ради забавы

Maxim
«Сейчас я буду изменять Джиму Керри». Актриса Даша Верещагина о «Сто лет тому вперед», «Красной Фурии», любимых фильмах и буллинге «Сейчас я буду изменять Джиму Керри». Актриса Даша Верещагина о «Сто лет тому вперед», «Красной Фурии», любимых фильмах и буллинге

Актрис Даша Верещагина о фильме «Сто лет тому вперед»

СНОБ
У Карлсона — нарциссизм, у Иа — депрессия: что не так с любимыми героями советских мультфильмов У Карлсона — нарциссизм, у Иа — депрессия: что не так с любимыми героями советских мультфильмов

Нет здоровых персонажей, есть недообследованные

Psychologies
Овца в волчьей шкуре. Комедийный детектив «Я не киллер» с Гленом Пауэллом в главной роли Овца в волчьей шкуре. Комедийный детектив «Я не киллер» с Гленом Пауэллом в главной роли

Как комедия «Я не киллер» взламывает клише фильмов о профессиональных убийцах

СНОБ
Как нейросети проваливаются в «долину разочарования» и почему это хорошо Как нейросети проваливаются в «долину разочарования» и почему это хорошо

Когда большие языковые модели займут уверенную позицию и достигнут пика?

Forbes
«Здоровые границы — это главное условие». О чем новая книга Анны Бабич «Здоровые границы — это главное условие». О чем новая книга Анны Бабич

Анны Бабич: почему самооценка — краеугольный камень благополучной жизни

РБК
СМС с денежным стимулированием помогли мужчинам сбросить лишний вес СМС с денежным стимулированием помогли мужчинам сбросить лишний вес

Врачи разрабатывают методы для повышения приверженности мужчин к снижению веса

N+1
Гений места Гений места

Настоящие фанаты своих городов, которые открывают их заново

Новый очаг
К тебе или ко мне? К тебе или ко мне?

Как перевести отношения из сети в офлайн

Новый очаг
Дэдпул, Росомаха и другие мутанты: 13 фильмов о Людях Икс от худшего к лучшему Дэдпул, Росомаха и другие мутанты: 13 фильмов о Людях Икс от худшего к лучшему

Вспоминаем фильмы о Людях Икс и выбираем лучший из них

Правила жизни
Супружеский «долг»: как на женщин влияет сексуализированное насилие в браке Супружеский «долг»: как на женщин влияет сексуализированное насилие в браке

Почему общество не замечает изнасилования в браке?

Forbes
Жизнь после: 6 фильмов о преодолении психологических травм Жизнь после: 6 фильмов о преодолении психологических травм

Фильмы о людях, которые смогли примириться со своими психологическими травмами

Psychologies
«Многие банки пытаются нас повторить» «Многие банки пытаются нас повторить»

Как меняются клиентские запросы на рынке premium-banking?

Деньги
6 книг, которые помогут «прокачать» мозг 6 книг, которые помогут «прокачать» мозг

Книги, которые помогут расширить представление о природе сознания

Psychologies
Отношения без драм: почему женщинам становится скучно Отношения без драм: почему женщинам становится скучно

Почему же некоторым  кажется, что они не могут обойтись без скандалов?

VOICE
Феноменальное открытие: как атомные часы с квантовой запутанностью изменили развитие науки в мире Феноменальное открытие: как атомные часы с квантовой запутанностью изменили развитие науки в мире

JILA создал часы, используя квантовую зависимость

Inc.
«Дожить до 80 в позе мумии мало кому интересно». Интервью с эндокринологом Александром Дзидзарией «Дожить до 80 в позе мумии мало кому интересно». Интервью с эндокринологом Александром Дзидзарией

Александр Дзидзария — о том, каким должен быть уровень тестостерона в 45 лет

СНОБ
Замечали цветные кружки на продуктовых упаковках? Узнайте, что это такое! Замечали цветные кружки на продуктовых упаковках? Узнайте, что это такое!

Что значит тайный язык из ярких кругов или квадратов на упаковках с едой?

ТехИнсайдер
Таблетки в сторону Таблетки в сторону

Как распознать аллергию на лекарства и снизить риск ее появления

Лиза
Смена образа Смена образа

TLC-диета — один из самых простых и гуманных способов похудеть

Лиза
Источники энергии Источники энергии

Почему кетодиета подходит не всем?

Лиза
Как правильно пить в одиночестве: 12 честных правил Как правильно пить в одиночестве: 12 честных правил

Как пить в одиночку осознанно и продуманно?

Maxim
Без бензина. Тест-драйв электромобиля Ora 03 Без бензина. Тест-драйв электромобиля Ora 03

Комфортно ли пользоваться электромобилем в городе в 2024 году?

СНОБ
Виртуальные дали Виртуальные дали

Нейросети врываются в мир кино для взрослых и позволяют нарисовать любой сюжет

Men Today
Проблемы первого мира: как Джефф Дэниелс спасает бизнес-империю от краха Проблемы первого мира: как Джефф Дэниелс спасает бизнес-империю от краха

«Мужчина в полный рост»: история о строительном магнате, который теряет империю

Forbes
Открыть в приложении