Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Дикие пионы Дикие пионы

Дикорастущие пионы в саду

Наука и жизнь
Гадание по первым морщинам: как научиться принимать свой возраст Гадание по первым морщинам: как научиться принимать свой возраст

Можно ли спрогнозировать, как именно мы будем стареть?

Psychologies
Стресс, гормоны и лекарства: 6 причин ранней седины Стресс, гормоны и лекарства: 6 причин ранней седины

Это может произойти в любом возрасте. Основные причины ранней седины

Psychologies
Виртуальный секс Виртуальный секс

«Популярная механика» протестировала первую в мире виртуальную любовницу

Популярная механика
Траурный культ: как и почему в викторианской Англии возникла мода на скорбь Траурный культ: как и почему в викторианской Англии возникла мода на скорбь

Как появилась мода на скорбь и почему женщины не имели права от нее отказаться

VOICE
Игорь Манн Игорь Манн

Как Игорь Манн ищет (и находит!) точки роста в кризисные времена?

Собака.ru
Седна, блуждающая во тьме Седна, блуждающая во тьме

Седна — карликовая планета, на которой царит вечная ночь

Наука и жизнь
В краю мамонтов и алмазов: как живут люди в одном из самых северных поселений России В краю мамонтов и алмазов: как живут люди в одном из самых северных поселений России

Как живет население Хатанги?

Вокруг света
Дочки советских актрис, которые не унаследовали красоту и талант матерей Дочки советских актрис, которые не унаследовали красоту и талант матерей

Иногда яблоко от яблони падает дальше обычного

VOICE
Гончары из Скопина Гончары из Скопина

Как зарождался и развивался знаменитый старинный промысел на рязанской земле

Отдых в России
Кровавые узы: судьбы жен и детей великих диктаторов Кровавые узы: судьбы жен и детей великих диктаторов

Имена диктаторов XX века вошли в историю, но судьбы их близких остаются в тени

Вокруг света
Как художник Винсент Ван Гог добился феноменального успеха: мнение ученых Как художник Винсент Ван Гог добился феноменального успеха: мнение ученых

Почему Винсент Ван Гог стал знаменитым только под конец своей жизни?

ТехИнсайдер
На распространение растительноядных динозавров на Аляске осадки повлияли сильнее температуры На распространение растительноядных динозавров на Аляске осадки повлияли сильнее температуры

Гадрозавриды предпочитали влажные условия, а цератописды — засушливые

N+1
Не только ценный мех: в России впервые в мире создали трехпородного кролика Не только ценный мех: в России впервые в мире создали трехпородного кролика

Первый в мире трехпородный кролик по имени Родник

Вокруг света
Что почитать в день «Звездных вoйн»: 3 отличных книги о далекой галактике Что почитать в день «Звездных вoйн»: 3 отличных книги о далекой галактике

Книги, которые помогут вспомнить вам, за что вы любите «Звездные вoйны»

Популярная механика
Банановая диета для похудения на 3 и 7 дней: меню и результаты Банановая диета для похудения на 3 и 7 дней: меню и результаты

Пробовали ли вы худеть на бананах?

VOICE
«Ну не меняться же мне из-за каждого идиота!»: крылатые фразы киногероев Олега Янковского, которые стыдно не знать «Ну не меняться же мне из-за каждого идиота!»: крылатые фразы киногероев Олега Янковского, которые стыдно не знать

Самые крылатые фразы киноперсонажей Олега Янковского

Maxim
Как наклеить защитное стекло на смартфон с первого раза: 6 простых шагов Как наклеить защитное стекло на смартфон с первого раза: 6 простых шагов

Лучше заранее позаботиться о защите своего гаджета и наклеить стекло. Но как?

ТехИнсайдер
«Стар, неинтересен и к тому же беден»: как сложилась судьба автора «Дон Кихота» «Стар, неинтересен и к тому же беден»: как сложилась судьба автора «Дон Кихота»

Жизнь Мигеля де Сервантеса до сих пор остается в определенном смысле загадкой

Вокруг света
Не все дома Не все дома

Где безопасно хранить коллекции произведений искусства

Forbes
Как стартап Mirvie научился предсказывать осложнения беременности и привлек $60 млн Как стартап Mirvie научился предсказывать осложнения беременности и привлек $60 млн

Как стартап Mirvie планирует вывести на рынок революционный тест на преэклампсию

Forbes
Безрукая красота Безрукая красота

Что могла держать в руках Венера Милосская?

Дилетант
Что упало — не пропало: правда ли быстро поднятое не считается упавшим? Отвечает наука Что упало — не пропало: правда ли быстро поднятое не считается упавшим? Отвечает наука

“Правило пяти секунд” работает не всегда и не с любой едой

ТехИнсайдер
Как не расклеиться после увольнения: 7 шагов Как не расклеиться после увольнения: 7 шагов

После увольнения предстоит внутренне собраться и сделать 6 шагов к новой жизни

Psychologies
Странный брак: что на самом деле произошло между Чайковским и его женой Странный брак: что на самом деле произошло между Чайковским и его женой

Брак Чайковского продлился всего несколько недель и одновременно — всю жизнь

VOICE
Келин освобожденная: как казахские женщины борются с дискриминирующими обычаями Келин освобожденная: как казахские женщины борются с дискриминирующими обычаями

Что происходит со статусом невестки – келин – в Казахстане

Forbes
«Победа, сынок! Война кончилась»: воспоминания детей войны «Победа, сынок! Война кончилась»: воспоминания детей войны

О Дне Победы — три монолога из сборника «Детство 45–53. А завтра будет счастье»

Psychologies
Вместе навсегда: сиамские близнецы, у которых хорошо сложилась жизнь Вместе навсегда: сиамские близнецы, у которых хорошо сложилась жизнь

Истории сиамских близнецов, которым повезло прожить счастливую жизнь

VOICE
Большое видится на расстоянии: 5 открытий, сделанных на Земле при помощи спутников Большое видится на расстоянии: 5 открытий, сделанных на Земле при помощи спутников

Запущенные на орбиту аппараты помогают находить неизвестные горы и города

Вокруг света
Открыть в приложении