Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Сцепились языками Сцепились языками

Александр Добровинский объясняет, как в юности накопил большой словарный запас

Tatler
Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа

Они сражались не ради славы и оваций, а за то, что любили — за Родину!

ТехИнсайдер
Строители невидимых путей Строители невидимых путей

Как устроен морской порт

Популярная механика
10 интересных фактов об Анне Павловой 10 интересных фактов об Анне Павловой

Мы собрали 10 фактов из жизни одной из самых известных балерин XX века

Культура.РФ
Как тренируется и как питается новый Бэтмен: секреты физической формы Роберта Паттинсона Как тренируется и как питается новый Бэтмен: секреты физической формы Роберта Паттинсона

Обзаводимся такими же мускулами как у Бэтмена

Maxim
«Тело помнит все эмоции»: как работает методика хакоми «Тело помнит все эмоции»: как работает методика хакоми

Методика «хакоми» — как понять, кто я?

Psychologies
Кровососущие твари: что делать, если вас укусил клещ Кровососущие твари: что делать, если вас укусил клещ

Какие бывают последствия от укуса клеща и как этого избежать?

Популярная механика
Чем полезны яблоки и сколько в них калорий Чем полезны яблоки и сколько в них калорий

Какие вещества содержатся в яблоках и почему их стоит включить в рацион

РБК
Лучшее средство от похмелья: рецепт мексиканской энчилады Лучшее средство от похмелья: рецепт мексиканской энчилады

Без этого блюда не обходится ни один мексиканский праздник

Вокруг света
Girl, Interrupted. Почему всем, кто молод, стоит смотреть «Нику» — драму о поэтессе, которая перестала писать Girl, Interrupted. Почему всем, кто молод, стоит смотреть «Нику» — драму о поэтессе, которая перестала писать

Печальная история о родительском насилии и синдроме самозванца

Правила жизни
Миллиардер Уоррен Баффет: 10 советов, как экономить деньги Миллиардер Уоррен Баффет: 10 советов, как экономить деньги

Как правильно относиться к деньгам, чтобы не потерять, а приумножить

Psychologies
«Видел все, кроме смертной казни»: путешествие Антона Чехова на «край географии» «Видел все, кроме смертной казни»: путешествие Антона Чехова на «край географии»

21 апреля 1890 Антон Чехов отправился на Сахалин и далее вокруг Азии

Вокруг света
Одиночество в кризис: как превратить изоляцию в преимущество для бизнеса Одиночество в кризис: как превратить изоляцию в преимущество для бизнеса

Одиночество может стать ресурсом для развития как личности, так и бизнеса

Forbes
Управлять можно каждым: как правильно манипулировать знаками зодиака Управлять можно каждым: как правильно манипулировать знаками зодиака

Наш Магический шар решил раскрыть самый главный секрет каждого знака зодиака

VOICE
«Стар, неинтересен и к тому же беден»: как сложилась судьба автора «Дон Кихота» «Стар, неинтересен и к тому же беден»: как сложилась судьба автора «Дон Кихота»

Жизнь Мигеля де Сервантеса до сих пор остается в определенном смысле загадкой

Вокруг света
Осторожно: цветы! Осторожно: цветы!

Цветы и возможные опасности, которые они могут таить в себе

Здоровье
База тренера База тренера

Как отличить коуча здорового человека от коуча курильщика?

Собака.ru
Лебединая верность: как живут кумандинцы Лебединая верность: как живут кумандинцы

Свободолюбивые и верные, как лебеди, коренные жители Алтая

Вокруг света
«Я живу в вымышленном мире, в котором встречаюсь со знаменитостью» «Я живу в вымышленном мире, в котором встречаюсь со знаменитостью»

Что делать, если хочется постоянно избегать реальности?

Psychologies
Физики намагнитили гелиевый газ с помощью света Физики намагнитили гелиевый газ с помощью света

Физики навели наносекундную намагниченность на газ атомов гелия с помощью света

N+1
7 колоссальных проектов, которые так и не были возведены 7 колоссальных проектов, которые так и не были возведены

Небоскребы, отели, башни и другие огромные постройки, которые не увидел свет

ТехИнсайдер
Эталонные блондинки, которые прославились благодаря своему интеллекту Эталонные блондинки, которые прославились благодаря своему интеллекту

Опровергаем популярное заблуждение насчет блондинок!

Maxim
7 и 1/2 страшных и неприятных фактов о космосе 7 и 1/2 страшных и неприятных фактов о космосе

Факты о космосе, после которых стать космонавтом уже совсем не хочется

Maxim
Виды приложений: какими бывают мобильные сервисы и как их использовать в бизнесе Виды приложений: какими бывают мобильные сервисы и как их использовать в бизнесе

Почему заказывают разработку приложений и какие виды используют в бизнесе

ТехИнсайдер
Как не расклеиться после увольнения: 7 шагов Как не расклеиться после увольнения: 7 шагов

После увольнения предстоит внутренне собраться и сделать 6 шагов к новой жизни

Psychologies
Ссоры с пожилыми родителями: как их избежать Ссоры с пожилыми родителями: как их избежать

Почему иногда мы с пожилыми родителями становимся словно чужими?

Psychologies
Арабская ночь Арабская ночь

Как устроена финансовая система ОАЭ

Forbes
Капкан ипотеки Капкан ипотеки

За что могут выселить из квартиры и как этого избежать

Лиза
Двойная мораль: как суд между Деппом и Херд вскрыл отношение общества к женщинам Двойная мораль: как суд между Деппом и Херд вскрыл отношение общества к женщинам

Почему общество все еще легко прощает мужчин и так яростно осуждает женщин?

VOICE
4 способа поддержать скорбящего человека 4 способа поддержать скорбящего человека

Четыре способа поддержать близкого человека в период его скорби

Psychologies
Открыть в приложении