Распознать обман: как искусственный интеллект и человек соперничают в хитрости
Программы научились создавать фото и видео, которые человек не в состоянии отличить от реальных. Как сохранить возможность различать правду и мистификацию?
Сейчас фото, а тем более видео воспринимаются как доказательство истинности произошедшего события. Но технологии манипуляции с изображениями и видео стремительно развиваются, меняя пользовательский контент и медиапространство в целом. С одной стороны, это открывает массу возможностей для искусства и индустрии развлечений. С другой, возникает опасность, что вскоре мы перестанем воспринимать фото- и видеоинформацию как априори отражающую реальность.
В середине февраля американская компания Amber презентовала новое программное обеспечение, которое гарантировано сможет противодействовать созданию deepfake (поддельного видео, которое имитирует реальное благодаря технологиям ИИ) на основе съемок с полицейских камер и камер наблюдения. Через интервалы, определенные пользователем, она создает «цифровые отпечатки» (хэши) данных. Затем эти хэши сохраняются в блокчейн-сеть. Если кто-то изменит файлы, программа сравнит их «отпечатки» с оригинальными и выдаст предупреждение. По словам генерального директора Amber Шамира Аллибхая (Shamir Allibhai), он ведет переговоры с производителями камер о том, чтобы те встраивали технологию в программное обеспечение своих устройств.
Обман во благо
Технология замены анимации лица начала применяться в Голливуде уже несколько десятилетий назад. Когда актер не мог участвовать в съемках, его образ накладывали на аниматора. Тогда это требовало много ручной работы. С развитием технологий большая часть процесса автоматизировалась.
Результат создания анимации становился все более правдоподобным. Благодаря этому, например, стало возможным воссоздать образ умершего Пола Уолкера в «Форсаж-7». В фильме он выглядит вполне реалистично.
Сейчас технологии сильно продвинулись. Они позволяют переносить анимацию лица заданного человека на другого с автоматически с помощью обученной нейронной сети без значительной ручной работы, которую выполняли в Голливуде при создании подобных эффектов в фильмах. Можно совместить части тела разных людей, добавить действие — например, человек хлопает в ладоши, достает оружие. Для этого чаще всего используется алгоритм GAN (генеративно-состязательная нейросеть). Он основан на работе двух нейросетей: одна обучается синтезировать изображения, а другая — отличать их от реальных. В процессе обучения эти сети как бы соревнуются друг с другом, тем самым становясь лучше.