Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Друг империи и враг декабристов: главный жандарм России Александр Бенкендорф Друг империи и враг декабристов: главный жандарм России Александр Бенкендорф

Граф Бенкендорф широко известен как «гонитель и душитель».

Вокруг света
7 советов, которые помогут вам справиться с волнением во время важного разговора 7 советов, которые помогут вам справиться с волнением во время важного разговора

Что делать, если никак не получается собраться с мыслями и перестать нервничать

GQ
Релокация менеджера: как эмигрировать и не навредить карьере Релокация менеджера: как эмигрировать и не навредить карьере

Советы, которые помогут избежать ошибок при релокации по работе

Forbes
Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко» Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко»

«Когда нам шагалось легко»: путевые заметки Ивлина Во 1929-1935 годов

Правила жизни
Как люди жили до изобретения электричества: не принимайте его как должное Как люди жили до изобретения электричества: не принимайте его как должное

Как люди жили без электрического освещения и холодильников?

Популярная механика
Изменщики! Все скандалы, связанные с неверностью членов королевской семьи Изменщики! Все скандалы, связанные с неверностью членов королевской семьи

И члены королевской семьи изменяют

VOICE
Мода и кино 1940-х: как в США зарождался жанр нуар Мода и кино 1940-х: как в США зарождался жанр нуар

40-е годы для киноиндустрии, как и для всего мира, выдались не самыми простыми

Вокруг света
«Не могу решиться на развод: боюсь, что жизнь с любовником меня тоже разочарует» «Не могу решиться на развод: боюсь, что жизнь с любовником меня тоже разочарует»

Как опыт неудачных отношения сказывается на нас? История читательницы

Psychologies
Как развить в себе тигриность: 3 идеи Как развить в себе тигриность: 3 идеи

Как часто не хватает нам тигриных качеств! Но может их можно в себе развить?

Psychologies
Есть такой синдром. 8 признаков, что у тебя дырявый кишечник Есть такой синдром. 8 признаков, что у тебя дырявый кишечник

В кишечнике правда может быть дыра и все содержимое идет не туда, куда положено?

Лиза
Как сейчас живет Бекхэм: ремонтирует дом за 37 млн и за день зарабатывает месячную зарплату футболиста Как сейчас живет Бекхэм: ремонтирует дом за 37 млн и за день зарабатывает месячную зарплату футболиста

Вначале мая Дэвиду Бекхэму исполнилось 47 лет. Но он в абсолютном порядке

Maxim
Почему мы «забываем» о сексе и как вернуть его в свою жизнь Почему мы «забываем» о сексе и как вернуть его в свою жизнь

Иногда супруги и забывают, как это — быть вместе

Psychologies
Лебединая верность: как живут кумандинцы Лебединая верность: как живут кумандинцы

Свободолюбивые и верные, как лебеди, коренные жители Алтая

Вокруг света
Верим в слово «спасибо» Верим в слово «спасибо»

Как научиться быть благодарным себе, окружающим и миру?

Psychologies
Секс и вырождение Секс и вырождение

Способно ли размножение замедлить накопление зловредных мутаций?

СНОБ
«Никогда и ничего не просите»: как научиться открыто говорить о своих потребностях «Никогда и ничего не просите»: как научиться открыто говорить о своих потребностях

Почему прямо говорить о своих желаниях — это нормально? И как этому научиться?

Psychologies
На распространение растительноядных динозавров на Аляске осадки повлияли сильнее температуры На распространение растительноядных динозавров на Аляске осадки повлияли сильнее температуры

Гадрозавриды предпочитали влажные условия, а цератописды — засушливые

N+1
Как однокурсник Марка Цукерберга строит глобальную фабрику стартапов Как однокурсник Марка Цукерберга строит глобальную фабрику стартапов

Antler — стартап-студия, инкубатор, акселератора и венчурной фирма

Forbes
Чуть-чуть не хватило до 10 кг: 5 самых тяжелых новорожденных в мире. Фото Чуть-чуть не хватило до 10 кг: 5 самых тяжелых новорожденных в мире. Фото

Представляем подборку самых внушительных младенцев в истории

VOICE
Действующий персонаж: как зарабатывать на героях метавселенной Действующий персонаж: как зарабатывать на героях метавселенной

Основатель Superplastic Пол Будниц создает персонажей в метавселенной

Forbes
Хотят, но боятся: что мешает фондам принимать пожертвования в криптовалюте Хотят, но боятся: что мешает фондам принимать пожертвования в криптовалюте

Что мешает фондам благотворительности эффективно использовать цифровую валюту

Forbes
Парфюм в бокале: зачем бары сотрудничают с косметическими брендами Парфюм в бокале: зачем бары сотрудничают с косметическими брендами

Синтез парфюмерии и косметики в напитках — тренд в барных столица мира

Forbes
Как долго мы перевариваем ту или иную пищу и почему так важно не смешивать продукты Как долго мы перевариваем ту или иную пищу и почему так важно не смешивать продукты

Как долго продукты проходят через пищеварительную систему.

ТехИнсайдер
Отсюда взошла Россия Отсюда взошла Россия

В Пскове молятся древним святыням и играют на коряге

Отдых в России
12 золотых правил роскошной женщины — их должна знать каждая! 12 золотых правил роскошной женщины — их должна знать каждая!

Как всегда оставаться ухоженной и привлекательной?

VOICE
Дети и супруги от первого брака: как найти общий язык? Дети и супруги от первого брака: как найти общий язык?

Как строить отношения между новыми женами или мужьями и «старыми» детьми?

Psychologies
Почему у нас возникают «спорные» сексуальные фантазии и что с ними делать Почему у нас возникают «спорные» сексуальные фантазии и что с ними делать

Как связаны удовольствие и здоровье, зачем женщине игрушки?

VOICE
Кровавые узы: судьбы жен и детей великих диктаторов Кровавые узы: судьбы жен и детей великих диктаторов

Имена диктаторов XX века вошли в историю, но судьбы их близких остаются в тени

Вокруг света
«О дружбе. Эволюция, биология и суперсила главных в жизни связей»: Как устроена дружба и почему она необходима всем нам «О дружбе. Эволюция, биология и суперсила главных в жизни связей»: Как устроена дружба и почему она необходима всем нам

Как устроена дружба, чем она отличается от семейных отношений и любви

N+1
Открыть в приложении