Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Профессиональная переподготовка: как AR и VR могут решить проблему нехватки кадров Профессиональная переподготовка: как AR и VR могут решить проблему нехватки кадров

Технологии виртуальной реальности позволяют решать целый класс проблем

Forbes
Новая Москва Новая Москва

Мы давно хотели поговорить с главным архитектором столицы Сергеем Кузнецовым

ТехИнсайдер
Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов

Португальский консул Аристидеш де Соуза Мендеш оказался перед непростым выбором

Вокруг света
Строители невидимых путей Строители невидимых путей

Как устроен морской порт

Популярная механика
Уединение и сила: куда поехать, чтобы увидеть самую красивую природу в России Уединение и сила: куда поехать, чтобы увидеть самую красивую природу в России

Где увидеть самые красивые места России, чтобы уединиться на природе

Forbes
Спустить паруса: лучшие марины Средиземноморья Спустить паруса: лучшие марины Средиземноморья

Самые современные, комфортные и живописные стоянки для яхт в Средиземном море

Forbes
Гонконг, Казахстан или Грузия: куда лучше перевозить IT-компанию из России Гонконг, Казахстан или Грузия: куда лучше перевозить IT-компанию из России

Преимущества и недостатки оформления бизнеса в Армении, Грузии, Узбекистане

Forbes
Куда пропали воробьи? Куда пропали воробьи?

Что и кто угрожает воробьям?

Наука и жизнь
Удовольствие для себя или польза для других: что мотивирует нас работать? Удовольствие для себя или польза для других: что мотивирует нас работать?

Что придает нашей деятельности смысл

Psychologies
В балансе с природой В балансе с природой

Переосмысление традиций стародачной архитектуры

SALON-Interior
Пилюля свободы: как гормональная контрацепция связана с правами человека и экономикой Пилюля свободы: как гормональная контрацепция связана с правами человека и экономикой

Почему женщины вынуждены отказываться от гормональной контрацепции?

Forbes
Топ-3 фильмов про космос с самыми реалистичными законами физики Топ-3 фильмов про космос с самыми реалистичными законами физики

Любите фильмы про космос? А знаете про их "ляпы", противоречащие законам физики?

ТехИнсайдер
За бортом современности: 10 поселений-призраков России За бортом современности: 10 поселений-призраков России

Заброшенные поселения для любителей индустриального туризма

Вокруг света
Из-за сжатых сроков члены команды готовы были грызть друг другу глотки: как Ford создавала GT40 для гонки «Ле-Ман» Из-за сжатых сроков члены команды готовы были грызть друг другу глотки: как Ford создавала GT40 для гонки «Ле-Ман»

Отрывок из книги «Ford против Ferrari»

VC.RU
Как провести выходные или отпуск: Мурманск и окрестности Как провести выходные или отпуск: Мурманск и окрестности

Что посмотреть и попробовать в Мурманске

СНОБ
«Лаборатория химических историй. От электрона до молекулярных машин»: Рассказ о главных достижениях химии «Лаборатория химических историй. От электрона до молекулярных машин»: Рассказ о главных достижениях химии

Почему одни вещества становятся мягкими, а другие твердеют?

N+1
Доброжелательный сексизм: убеждения, которые мешают женщине испытать оргазм Доброжелательный сексизм: убеждения, которые мешают женщине испытать оргазм

Иногда получить удовольствие женщине мешают ее убеждения

Psychologies
5 душевных книг для чтения за чашечкой кофе 5 душевных книг для чтения за чашечкой кофе

Книги поднимут настроение, позволят расслабиться и переключить внимание

ТехИнсайдер
Древних римлян обвинили в падении численности тюленей-монахов Древних римлян обвинили в падении численности тюленей-монахов

Численность тюленей-монахов сократилась в античности из-за активного промысла

N+1
Какие витамины и продукты полезны для сердца и как их принимать Какие витамины и продукты полезны для сердца и как их принимать

Какие витамины и продукты подойдут для поддержания сердечно-сосудистой системы

РБК
Смешивание с электронами помогло приостановить вращение молекулярных ионов Смешивание с электронами помогло приостановить вращение молекулярных ионов

Смешивание катионов метилидина с электронами в криогенном накопительном кольце

N+1
Быть достаточно хорошим родителем: это как? Быть достаточно хорошим родителем: это как?

Что это значит, быть хорошими родителями?

Psychologies
Вести с полей Вести с полей

Как менялась форма игроков в гольф на протяжении XX века

Forbes Life
Как сохранить свои сбережения: учимся инвестировать в недвижимость Как сохранить свои сбережения: учимся инвестировать в недвижимость

Как сохранить и приумножить свои капиталы, покупая квартиры

Maxim
Вам письмо Вам письмо

В Антарктиде, на Эвересте, под водой – самые необычные почтовые отделения мира

Вокруг света
Мудрость психопатов: чему нам стоит у них поучиться? Мудрость психопатов: чему нам стоит у них поучиться?

Психопаты достигают успеха и признания именно благодаря своим уникальным чертам

Psychologies
«Люблю колоть морду»: как живет девушка с самыми большими скулами в мире «Люблю колоть морду»: как живет девушка с самыми большими скулами в мире

Главной фишкой Анастасии стало именно увеличение зоны скул

VOICE
Опра Уинфри: трагическая и невероятная история главной женщины Америки Опра Уинфри: трагическая и невероятная история главной женщины Америки

Если вы заглянете в прошлое Опры, у вас перехватит дыхание

VOICE
Как живет «просто Мария» — любимица граждан пост-СССР актриса Виктория Руффо Как живет «просто Мария» — любимица граждан пост-СССР актриса Виктория Руффо

Как живет и выглядит теперь актриса Виктория Руффо

Maxim
Открыть в приложении