Способен ли искусственный интеллект писать тексты или даже мыслить как человек?

МонокльHi-Tech

Феномен текста: человек vs ИИ

При правильно написанном промпте рассказ, сгенерированный нейросетью последнего поколения, не отличить от человеческого. Но прежде чем доверить сочинение боту, разберемся в нюансах

Валерия Бунина

Все больше людей используют тексты, написанные искусственным интеллектом. Открытой статистики на этот счет не существует (данные засекречены разработчиками и операторами связи), но известно, что, например, в 2024 году мобильный трафик и аудитория сервисов ИИ в России выросли в пять раз. Прошлогоднее исследование компании «Яндекс» показало: к нейросетям для генерации текста обращается треть пользователей Рунета, причем доля аудитории от 45 до 54 лет и старше 55 лет растет.

Есть и яркий пример «генерационного бума»: в апреле этого года газета «Краснодарские известия» выпустила номер, полностью написанный ИИ. Перед началом работы нейросеть обучали на десятках журналистских материалов, чтобы адаптировать к стилю издания. В итоге в номере появились такие материалы, как статьи «Сгенерированный судья будущего» и «Они заменят вас на работе».

Давайте разберемся в этих предвестниках «креативной революции»: действительно ли искусственный интеллект способен писать тексты или даже мыслить как человек?

Банальность или странный креатив

Для начала стоит успокоиться: в отличие от людей ИИ не понимает слова, которые пишет, а просто отыскивает закономерности в миллионах текстов. В основе нейросети лежит языковая модель — алгоритм, обученный на большом количестве текстов. Опираясь на заданную фразу — контекст, — модель предсказывает наиболее логичную последовательность слов. Ключевая задача, которую при этом решают разработчики, — сделать результат максимально приближенным к написанному человеком.

Технически это называется авторегрессионной генерацией. Модель получает цепочку слов на вход и вычисляет, какое следующее слово наиболее релевантно. Например, фразу «Левитан был» можно продолжить так: «человеком», «художником», «подданным Российской империи». ИИ оценивает каждый вариант и выбирает лучший. Одни алгоритмы настроены так, что лучшим признается фраза с наиболее часто встречающимся продолжением для известного контекста (в этом случае возможности постоянной генерации новых тестов ограниченны, так как нейросеть движется по одной колее), другие ориентированы на случайный выбор наиболее популярных вариантов (тексты получаются более разнообразными).

После добавления каждого нового слова действие повторяется — и так до тех пор, пока не будет достигнут лимит длины или не будет сгенерирован специальный символ завершения. Иногда нейросеть выдает текст из 20 слов, иногда из 120 — все зависит от того, в какой последовательности расположатся слова-токены.

Описание заката на море. Два из этих текстов созданы чат-ботами — GPT-4 и Deepseek, а один — Константином Паустовским. Чувствуете разницу?

На созданный ИИ текст могут влиять параметры, которые задает пользователь, например уровень креативности. Чем он выше, тем чаще модель будет выбирать редкие токены, делая написанное менее предсказуемым, порой очень странным. В случае с Левитаном нейросеть при высоком уровне креативности выбрала бы не «художник», а «подданный».

Еще один параметр — повторяемость. Модели склонны повторять стилистические шаблоны: для имитации стиля определенного писателя применяются инструкции в промпте.

«Процесс генерации основан на статистических закономерностях: ИИ не понимает содержание, а угадывает, какое слово или фраза лучше всего подходят в данном контексте, опираясь на свои тренировочные данные, — рассказывает руководитель научной группы “Технологии персонализации” института AIRI Евгений Фролов. — За последние пять лет развитие ИИ в области написания текстов прошло колоссальный путь. Возьмем для примера GPT. В 2018 году модель GPT-2, обученная на 1,5 миллиарда параметров, могла генерировать связные, но часто бессмысленные или ограниченные тексты. GPT-3, появившийся в 2020 году, был обучен на 175 миллиардах — в 117 раз больше, чем у предыдущей модели. Его тексты стали более естественными, точными и разнообразными. Для GPT-4, по оценкам экспертов, использовалось от 500 миллиардов до двух триллионов параметров — теперь нейросеть пишет эссе, стихи и даже диалоги, которые порой сложно отличить от созданных человеком. Такой прорыв стал возможен по нескольким причинам: увеличение объема данных для обучения, совершенствование алгоритмов, например введение методов дообучения с подкреплением, рост вычислительных мощностей. Благодаря последним были внедрены и механизмы, позволяющие моделям учитывать обратную связь от пользователей для улучшения стиля и точности ответов. Так что сегодня ИИ не просто генерирует текст — он адаптируется к конкретным задачам».

Проверяй и проверяй

При этом эксперты признают, что все искусственно созданные тексты имеют общую уязвимость: их «гениальный автор» не понимает того, о чем пишет. Сочинения нейросети собраны как конструктор «Лего», а смысл им придает читающий. Именно поэтому ИИ иногда ошибается, или, как говорят специалисты, выдает галлюцинации.

«Например, вместо ожидаемого текста на русском модель может что-то написать на китайском. Частный пример галлюцинаций — ошибки в фактических данных, некорректные адреса, числовые идентификаторы, гиперссылки. Наиболее мощные модели допускают не так много ошибок, как нам кажется, — в основном они связаны с различными точными сведениями из узких областей. Да, откровенные галлюцинации иногда помогают идентифицировать ботов, но это не универсальный метод. Передовые модели пишут очень убедительные тексты, ошибки в них не очевидны и потому с большим трудом распознаются человеком», — поясняет сотрудник международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дешево и сердито Дешево и сердито

Дискаунтеры захватывают российский рынок

Агроинвестор
Реки крови и гречишный шоколад: как выигрывать конкурентную борьбу на «алых» рынках Реки крови и гречишный шоколад: как выигрывать конкурентную борьбу на «алых» рынках

Как российская компания может добавить значимых отличий своему ассортименту

Forbes
Защищать нельзя загорать Защищать нельзя загорать

Загорать или нет? Вот в чём вопрос

Здоровье
Сёстры красят Сёстры красят

Как обновить интерьер перекраской? Слово декораторам

Новый очаг
Мошенники делают ставки Мошенники делают ставки

Как мошенники используют аккаунты граждан в букмекерских конторах

Ведомости
Тело как история Тело как история

Героини нашего спецпроекта — об опыте травмы, исцеления и принятия

Новый очаг
Вяземские Вяземские

Происходивший от Рюрика княжеский род Вяземских известен ещё со Средневековья

Дилетант
Самые красивые заповедники России Самые красивые заповедники России

Российские заповедники, отличающиеся необычайной красотой

ТехИнсайдер
Накрутил €50 млн: как Тадей Погачар стал самым высокооплачиваемым велогонщиком мира Накрутил €50 млн: как Тадей Погачар стал самым высокооплачиваемым велогонщиком мира

Как Тадей Погачар стал самым высокооплачиваемым велогонщиком мира

Forbes
Лиза Шакира: «Умение признавать свой страх очень облегчает любую работу» Лиза Шакира: «Умение признавать свой страх очень облегчает любую работу»

Вдруг все мои достижения, все мои роли — это лишь случайность?

Коллекция. Караван историй
От Шагала до мурала От Шагала до мурала

Арт-маршрут от Ниццы до Перпиньяна, достойный целых каникул

Y Magazine
Инфляция в белых халатах Инфляция в белых халатах

Медицинская инфляция может ускориться до 14% к концу года

Ведомости
Новые преступные схемы с клиентами СТО. Как не лишиться денег и машины Новые преступные схемы с клиентами СТО. Как не лишиться денег и машины

Как мошенники маскируются под персонал СТО

РБК
Уйди, нечистая! Уйди, нечистая!

Домовые, кикиморы, лешии: откуда взялись и чему служили

Лиза
Блокировка расчетного счета: что это и почему так происходит Блокировка расчетного счета: что это и почему так происходит

Блокировка расчетного счета: как быстро решить проблему и снять блокировку?

Inc.
До чего доводят технологии: 5 романов о вызовах цифровой реальности До чего доводят технологии: 5 романов о вызовах цифровой реальности

Подборка фантастических романов о последствиях технического прогресса

ТехИнсайдер
Рыбный день Рыбный день

Рыба — один из древнейших символов в ювелирном искусстве...

Y Magazine
Colossal возродит новозеландских моа Colossal возродит новозеландских моа

Colossal Biosciences заявила о планах возродить новозеландских моа

N+1
Партнер по религиозным соображениям Партнер по религиозным соображениям

Как Россия создает базу для привлечения исламского капитала

Эксперт
Кутхины баты: удивительное место на Камчатке, в существование которого трудно поверить Кутхины баты: удивительное место на Камчатке, в существование которого трудно поверить

Один из самых потрясающих памятников природы — Кутхины баты

ТехИнсайдер
Беспроигрышное вложение Беспроигрышное вложение

Что может сработать на национальную идею о многодетности?

Ведомости
Главное – остаться незамеченным Главное – остаться незамеченным

В чем состоит военная (а возможно, и не только) хитрость стелс-технологии?

Наука и техника
Соучастники космоса Соучастники космоса

Как и зачем запускают совместные космические миссии? Рассказывает Натан Эйсмонт

Монокль
«Тратить — очень круто»: как зумеры ведут себя с деньгами «Тратить — очень круто»: как зумеры ведут себя с деньгами

Как молодые взрослые ищут баланс между тратами и накоплениями

РБК
Собрать всех друзей: хип-хоп-исполнитель Кассета о новом альбоме «Ателье» Собрать всех друзей: хип-хоп-исполнитель Кассета о новом альбоме «Ателье»

Музыкант Кассета — о специфике работы с другими испольнителями

Forbes
Эра литий-ионных аккумуляторов Эра литий-ионных аккумуляторов

Почему ученые трудятся над тем, чтобы повысить безопасность батареек

Наука и техника
Ответственность за три четверти ожидаемых случаев рака желудка возложили на хеликобактер Ответственность за три четверти ожидаемых случаев рака желудка возложили на хеликобактер

Хроническая инфекция хеликобактер служит основной причиной рака желудка

N+1
Как отличить борщевик от дудника и других зонтичных растений Как отличить борщевик от дудника и других зонтичных растений

Как не спутать борщевик его с безобидными товарищами

Maxim
Как откручивать шкив коленвала и в какую сторону Как откручивать шкив коленвала и в какую сторону

Все о снятии шкива коленвала: инструменты, последовательность, как крепится

РБК
Катапульта, побег в СССР и месть юнги: великая и странная история парохода Bremen Катапульта, побег в СССР и месть юнги: великая и странная история парохода Bremen

От металлургии до гидродинамики: история парохода Bremen

ТехИнсайдер
Открыть в приложении