Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Почему про детей говорят Почему про детей говорят

Раскрываем тайну капустных дел

ТехИнсайдер
«Я чувствовала себя неполноценной»: история женщины, родившейся без матки «Я чувствовала себя неполноценной»: история женщины, родившейся без матки

История женщины, которая живет с синдромом Майера-Рокитанского-Кустера-Хаузера

Cosmopolitan
Как собирать березовый сок, чем он полезен и что из него готовить Как собирать березовый сок, чем он полезен и что из него готовить

Гайд по одному из главных российских специалитетов — березовому соку

Maxim
Переменная величина Переменная величина

Насколько важен для нас секс

Psychologies
Философия безмятежности: каким был в жизни и чему учил Эпикур Философия безмятежности: каким был в жизни и чему учил Эпикур

История не была добра к древнегреческому философу Эпикуру

Вокруг света
Скелеты в шкафу: как и когда одежда выдает твою самооценку — разбор стилиста Скелеты в шкафу: как и когда одежда выдает твою самооценку — разбор стилиста

Можно ли по одному костюму определить, что о себе думает женщина?

VOICE
«О Великой Отечественной войне нужно рассказывать»: праздновать 9 Мая или нет? «О Великой Отечественной войне нужно рассказывать»: праздновать 9 Мая или нет?

Как мы отмечаем День Победы и почему делаем это именно так?

Psychologies
Стройный и злой: как быстро сжечь лишний жир, не навредив себе Стройный и злой: как быстро сжечь лишний жир, не навредив себе

Что влияет на потерю жира и как достичь топовой физической формы

ТехИнсайдер
Вместо смеси: как две американки изобретают синтетическое грудное молоко Вместо смеси: как две американки изобретают синтетическое грудное молоко

Две предпринимательницы независимо начали разработки синтетического молока

Forbes
«Мне грозит одиночество, и это ужасно» «Мне грозит одиночество, и это ужасно»

«Не вижу смысла в дальнейшей одинокой жизни»

Psychologies
Моя крепость Моя крепость

Интересный и масштабный проект — усадьба в стиле современного шале

SALON-Interior
Вода Сасси: все о легендарном напитке для похудения Вода Сасси: все о легендарном напитке для похудения

Может ли вода Сасси помочь избавиться от лишних килограммов?

РБК
Любимица ацтеков: названы 6 научных причин есть тыкву каждый день Любимица ацтеков: названы 6 научных причин есть тыкву каждый день

Рассказываем все о пользе тыквы, какие болезни она лечит и кому ее нельзя

Вокруг света
Государева дорога Государева дорога

«Государева дорога» — маршрут, связанный с историей царской России

Отдых в России
«Где они все?» Ученые объяснили, почему инопланетяне до сих пор не прилетели на Землю «Где они все?» Ученые объяснили, почему инопланетяне до сих пор не прилетели на Землю

Астробиологи попытались разрешить парадокс Ферми

Вокруг света
Орнитологи сфальсифицировали голосование галок за время вылета с ночевки Орнитологи сфальсифицировали голосование галок за время вылета с ночевки

Галки принимают решение покинуть место, основываясь на результатах голосования

N+1
Как защититься от укуса клеща на природе: самые важные лайфхаки Как защититься от укуса клеща на природе: самые важные лайфхаки

Заражения энцефалитом можно избежать, если знать несколько важных вещей

ТехИнсайдер
Миллиардер Уоррен Баффет: 10 советов, как экономить деньги Миллиардер Уоррен Баффет: 10 советов, как экономить деньги

Как правильно относиться к деньгам, чтобы не потерять, а приумножить

Psychologies
10 простых привычек, которые помогают поднять настроение 10 простых привычек, которые помогают поднять настроение

Настроение поднять очень просто — достаточно знать о том, как работает тело

Популярная механика
Высота сиденья, регулировка спинки и колёсики: как выбрать офисный стул домой Высота сиденья, регулировка спинки и колёсики: как выбрать офисный стул домой

Выбираем эргономичный офисный стул

VC.RU
«Загадка нестареющей медузы»: Как наука замедляет старение. Секреты природы и достижения науки, которые помогут приблизиться к вечной жизни «Загадка нестареющей медузы»: Как наука замедляет старение. Секреты природы и достижения науки, которые помогут приблизиться к вечной жизни

Как научные открытия приближают нас к вечной жизни? Отрывок из книги

N+1
Жуткие фото, сделанные при еще более жутких обстоятельствах Жуткие фото, сделанные при еще более жутких обстоятельствах

Не всегда понятно, чего же страшного в этих снимках, но они реально пугают

Maxim
Как распознавать чушь: проверенные техники не дать ввести себя в заблуждение Как распознавать чушь: проверенные техники не дать ввести себя в заблуждение

Что побуждает человека вводить других людей в заблуждение

Вокруг света
«Я не оставлю себя в беде» «Я не оставлю себя в беде»

Как поддержать себя, если силы на исходе?

Psychologies
Бей, беги, забудь: нейробиолог о том, как как стресс влияет на память Бей, беги, забудь: нейробиолог о том, как как стресс влияет на память

Отрывок из книги Лайзы Дженовы «Как работает память»

Forbes
«Не принимаю себя как женщину: не хочу быть нежной и нравиться мужчинам» «Не принимаю себя как женщину: не хочу быть нежной и нравиться мужчинам»

Что делать, если вы не принимаете себя?

Psychologies
Ночницы пожужжали как пчелы и шершни и отпугнули сов Ночницы пожужжали как пчелы и шершни и отпугнули сов

Пример бейтсовской мимикрии, при котором млекопитающее подражает насекомому

N+1
На двух колесах: сколько стоит аренда самоката в Москве На двух колесах: сколько стоит аренда самоката в Москве

Какой из множества сервисов поминутной аренды самокатов предпочесть

CHIP
Кого считать мертвым: как менялись представления о границе между жизнью и смертью Кого считать мертвым: как менялись представления о границе между жизнью и смертью

Современная медицина поставила под сомнение привычную черту смерти

Вокруг света
Открыть в приложении