Способен ли искусственный интеллект писать тексты или даже мыслить как человек?

МонокльHi-Tech

Феномен текста: человек vs ИИ

При правильно написанном промпте рассказ, сгенерированный нейросетью последнего поколения, не отличить от человеческого. Но прежде чем доверить сочинение боту, разберемся в нюансах

Валерия Бунина

Все больше людей используют тексты, написанные искусственным интеллектом. Открытой статистики на этот счет не существует (данные засекречены разработчиками и операторами связи), но известно, что, например, в 2024 году мобильный трафик и аудитория сервисов ИИ в России выросли в пять раз. Прошлогоднее исследование компании «Яндекс» показало: к нейросетям для генерации текста обращается треть пользователей Рунета, причем доля аудитории от 45 до 54 лет и старше 55 лет растет.

Есть и яркий пример «генерационного бума»: в апреле этого года газета «Краснодарские известия» выпустила номер, полностью написанный ИИ. Перед началом работы нейросеть обучали на десятках журналистских материалов, чтобы адаптировать к стилю издания. В итоге в номере появились такие материалы, как статьи «Сгенерированный судья будущего» и «Они заменят вас на работе».

Давайте разберемся в этих предвестниках «креативной революции»: действительно ли искусственный интеллект способен писать тексты или даже мыслить как человек?

Банальность или странный креатив

Для начала стоит успокоиться: в отличие от людей ИИ не понимает слова, которые пишет, а просто отыскивает закономерности в миллионах текстов. В основе нейросети лежит языковая модель — алгоритм, обученный на большом количестве текстов. Опираясь на заданную фразу — контекст, — модель предсказывает наиболее логичную последовательность слов. Ключевая задача, которую при этом решают разработчики, — сделать результат максимально приближенным к написанному человеком.

Технически это называется авторегрессионной генерацией. Модель получает цепочку слов на вход и вычисляет, какое следующее слово наиболее релевантно. Например, фразу «Левитан был» можно продолжить так: «человеком», «художником», «подданным Российской империи». ИИ оценивает каждый вариант и выбирает лучший. Одни алгоритмы настроены так, что лучшим признается фраза с наиболее часто встречающимся продолжением для известного контекста (в этом случае возможности постоянной генерации новых тестов ограниченны, так как нейросеть движется по одной колее), другие ориентированы на случайный выбор наиболее популярных вариантов (тексты получаются более разнообразными).

После добавления каждого нового слова действие повторяется — и так до тех пор, пока не будет достигнут лимит длины или не будет сгенерирован специальный символ завершения. Иногда нейросеть выдает текст из 20 слов, иногда из 120 — все зависит от того, в какой последовательности расположатся слова-токены.

Описание заката на море. Два из этих текстов созданы чат-ботами — GPT-4 и Deepseek, а один — Константином Паустовским. Чувствуете разницу?

На созданный ИИ текст могут влиять параметры, которые задает пользователь, например уровень креативности. Чем он выше, тем чаще модель будет выбирать редкие токены, делая написанное менее предсказуемым, порой очень странным. В случае с Левитаном нейросеть при высоком уровне креативности выбрала бы не «художник», а «подданный».

Еще один параметр — повторяемость. Модели склонны повторять стилистические шаблоны: для имитации стиля определенного писателя применяются инструкции в промпте.

«Процесс генерации основан на статистических закономерностях: ИИ не понимает содержание, а угадывает, какое слово или фраза лучше всего подходят в данном контексте, опираясь на свои тренировочные данные, — рассказывает руководитель научной группы “Технологии персонализации” института AIRI Евгений Фролов. — За последние пять лет развитие ИИ в области написания текстов прошло колоссальный путь. Возьмем для примера GPT. В 2018 году модель GPT-2, обученная на 1,5 миллиарда параметров, могла генерировать связные, но часто бессмысленные или ограниченные тексты. GPT-3, появившийся в 2020 году, был обучен на 175 миллиардах — в 117 раз больше, чем у предыдущей модели. Его тексты стали более естественными, точными и разнообразными. Для GPT-4, по оценкам экспертов, использовалось от 500 миллиардов до двух триллионов параметров — теперь нейросеть пишет эссе, стихи и даже диалоги, которые порой сложно отличить от созданных человеком. Такой прорыв стал возможен по нескольким причинам: увеличение объема данных для обучения, совершенствование алгоритмов, например введение методов дообучения с подкреплением, рост вычислительных мощностей. Благодаря последним были внедрены и механизмы, позволяющие моделям учитывать обратную связь от пользователей для улучшения стиля и точности ответов. Так что сегодня ИИ не просто генерирует текст — он адаптируется к конкретным задачам».

Проверяй и проверяй

При этом эксперты признают, что все искусственно созданные тексты имеют общую уязвимость: их «гениальный автор» не понимает того, о чем пишет. Сочинения нейросети собраны как конструктор «Лего», а смысл им придает читающий. Именно поэтому ИИ иногда ошибается, или, как говорят специалисты, выдает галлюцинации.

«Например, вместо ожидаемого текста на русском модель может что-то написать на китайском. Частный пример галлюцинаций — ошибки в фактических данных, некорректные адреса, числовые идентификаторы, гиперссылки. Наиболее мощные модели допускают не так много ошибок, как нам кажется, — в основном они связаны с различными точными сведениями из узких областей. Да, откровенные галлюцинации иногда помогают идентифицировать ботов, но это не универсальный метод. Передовые модели пишут очень убедительные тексты, ошибки в них не очевидны и потому с большим трудом распознаются человеком», — поясняет сотрудник международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Российский рынок перерос параллельный импорт Российский рынок перерос параллельный импорт

Минпромторг сокращает список товаров параллельного импорта

Монокль
Как откручивать шкив коленвала и в какую сторону Как откручивать шкив коленвала и в какую сторону

Все о снятии шкива коленвала: инструменты, последовательность, как крепится

РБК
Не вместо, а вместе Не вместо, а вместе

Как гаджеты трансформировали некоторые профессии и что ждет их в ближайшие годы

Правила жизни
Фактор, который может говорить о вашей ранней смерти Фактор, который может говорить о вашей ранней смерти

Наличие лишнего жира на животе может незаметно лишить вас здоровья

ТехИнсайдер
Взлёт и падение Селевкидов Взлёт и падение Селевкидов

Государство Селевкидов стало самым большим осколком империи Македонского

Дилетант
Установка для очистки отработанных масел УОМ-3М(100) Установка для очистки отработанных масел УОМ-3М(100)

Как установка УОМ-3М(100) очищает отработанное моторное масло

Наука и техника
Олимпиада, мать царя Олимпиада, мать царя

Почему античные историки так ненавидели мать Александра Великого — Олимпиаду?

Дилетант
От Шагала до мурала От Шагала до мурала

Арт-маршрут от Ниццы до Перпиньяна, достойный целых каникул

Y Magazine
Пифагор, или Теорема с одним неизвестным Пифагор, или Теорема с одним неизвестным

«Нет ни одной детали в жизни Пифагора, которая не была бы опровергнута»

Дилетант
Разблокировка на доверии Разблокировка на доверии

Как действует механизм разблокировки замороженных активов через траст

Ведомости
Стукнул чужое авто на парковке, оставил телефонный номер и уехал: можно ли так поступить Стукнул чужое авто на парковке, оставил телефонный номер и уехал: можно ли так поступить

Можно ли покинуть место ДТП, оставив записку с телефонным номером?

ТехИнсайдер
Палеогенетики уточили популяционную историю Таримской впадины Палеогенетики уточили популяционную историю Таримской впадины

Как ученые анализировали геномы древних людей из Таримской впадины

N+1
Что следует знать начинающему инвестору Что следует знать начинающему инвестору

Что надо знать, когда планируете начать инвестировать?

Наука и техника
Антон Яковлев: Нам удалось доказать, что мы не разрушители, а созидатели Антон Яковлев: Нам удалось доказать, что мы не разрушители, а созидатели

Антон Яковлев — о преемстве в Театре Гоголя, новых целях и усталости от иронии

Ведомости
Курс «Страны чистых»: стоит ли бояться ядерной дубинки Пакистана Курс «Страны чистых»: стоит ли бояться ядерной дубинки Пакистана

Исламабад выбрал гибкую внешнюю политику

Монокль
Холсты за миллионы долларов: самые дорогие картины отечественных художников Холсты за миллионы долларов: самые дорогие картины отечественных художников

О самых дорогих картинах, вышедших из под кистей российских мэтров живописи

ТехИнсайдер
Реки крови и гречишный шоколад: как выигрывать конкурентную борьбу на «алых» рынках Реки крови и гречишный шоколад: как выигрывать конкурентную борьбу на «алых» рынках

Как российская компания может добавить значимых отличий своему ассортименту

Forbes
Илья Перфильев: «Фокус на персонал – основа новой философии компании» Илья Перфильев: «Фокус на персонал – основа новой философии компании»

Об актуальных профессиях и работе с молодыми специалистами

Ведомости
CAR-T-клетки получили прямо в организме четырех пациентов CAR-T-клетки получили прямо в организме четырех пациентов

Результаты испытаний технологии для получения противоопухолевых Т-лимфоцитов

N+1
Правила порядка Правила порядка

Как научить детей поддерживать порядок в своей комнате, не тратя на это часы

Новый очаг
Колорирование волос: трендовые техники, идеи для разных типов Колорирование волос: трендовые техники, идеи для разных типов

Колорирование волос: какие техники существуют и как ухаживать за окрашиванием?

РБК
Okean в океане Okean в океане

Актуальная модельная линейка Okean интересного бренда Okean Yachts

Y Magazine
Ценить свой труд: как Шарлотта Гилман призывала женщин к экономической независимости Ценить свой труд: как Шарлотта Гилман призывала женщин к экономической независимости

Как Шарлота Гилман боролась за женскую свободу вне домашних стен

Forbes
«Если какие сложности, основной груз на мне»: как женщины воспитывают приемных детей «Если какие сложности, основной груз на мне»: как женщины воспитывают приемных детей

Forbes Woman исследовал гендерные аспекты приемного родительства

Forbes
Загадочная смерть Дороти Хант, жены одного из ключевых участников Уотергейтского скандала Загадочная смерть Дороти Хант, жены одного из ключевых участников Уотергейтского скандала

Трагедия Дороти Хант и ее связь с Уотергейтским скандалом

ТехИнсайдер
Вершины олимпиадников Вершины олимпиадников

Почему растет число абитуриентов, поступающих в упрощенном порядке

Ведомости
Водородное движение Водородное движение

Можно ли использовать водород как альтернативный и экологичный вид топлива?

Y Magazine
Стальной характер Стальной характер

Тандем камня, металла и искусства в невероятных апартаментах

RR Люкс.Личности.Бизнес.
Глубоководная добыча полезных ископаемых заглушит биологически важные звуки Глубоководная добыча полезных ископаемых заглушит биологически важные звуки

Как шум от разработки морского дна мешает коммуникации морских обитателей

N+1
«О, тепленькая пошла» «О, тепленькая пошла»

В какой части Арктики лед тает быстрее

Санкт-Петербургский университет
Открыть в приложении