Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дети, добро пожаловать в соцсети! Дети, добро пожаловать в соцсети!

Социальные сети стали безусловной частью жизни подростков

Psychologies
Орнитологи сфальсифицировали голосование галок за время вылета с ночевки Орнитологи сфальсифицировали голосование галок за время вылета с ночевки

Галки принимают решение покинуть место, основываясь на результатах голосования

N+1
Открыто соединение, способное «включаться» под действием лазера Открыто соединение, способное «включаться» под действием лазера

Созданный фосфонат позволит точнее и безопаснее воздействовать на организм

Популярная механика
Рисунок трехметровой змеи оказался крупнейшим наскальным изображением Северной Америки Рисунок трехметровой змеи оказался крупнейшим наскальным изображением Северной Америки

Американские ученые обнаружили в пещере многочисленные древние изображения

N+1
Физики поймали магноны за превращением в фононы Физики поймали магноны за превращением в фононы

Магноны превращаются в фононы за десятки наносекунд

N+1
«В этот момент я простил и принял свою маму»: как природа побеждает травму? «В этот момент я простил и принял свою маму»: как природа побеждает травму?

Выезд на природу — возможность разобраться в своих переживаниях

Psychologies
Шлейф больших амбиций: на Кипре выяснили, как частные ракеты могут навредить человечеству Шлейф больших амбиций: на Кипре выяснили, как частные ракеты могут навредить человечеству

Летательные аппараты отнюдь не безвредны для планеты

Вокруг света
Одна сгубила десятки женихов, другая — возглавила армию. Какими были воительницы из легенд викингов Одна сгубила десятки женихов, другая — возглавила армию. Какими были воительницы из легенд викингов

Знаменитые воительницы из Мидгарда

ТехИнсайдер
БАДы: польза и вред биологически активных добавок БАДы: польза и вред биологически активных добавок

Споры вокруг БАДов не утихают десятилетиями

Psychologies
Безрукая красота Безрукая красота

Что могла держать в руках Венера Милосская?

Дилетант
Не опустевшее гнездо: почему выросшие дети продолжают жить с родителями? Не опустевшее гнездо: почему выросшие дети продолжают жить с родителями?

Почему порой дети не могут сепарироваться от родителей?

Psychologies
8 отличных фильмов, если хочется погрустить 8 отличных фильмов, если хочется погрустить

Если хочется погрустить, то делайте это в компании трогательных историй

Правила жизни
«А взрослые дома есть?»: как понять свое психологическое состояние «А взрослые дома есть?»: как понять свое психологическое состояние

Как научиться понимать себя, стать более гибким и спокойным?

Psychologies
Как люди, сами того не замечая, массово уничтожают самых крупных рыб в мире Как люди, сами того не замечая, массово уничтожают самых крупных рыб в мире

Как морские магистрали нарушают среду обитания самых крупных рыб в мире

Популярная механика
Как продлить жизнь покрышкам: 5 простых советов, которые реально работают Как продлить жизнь покрышкам: 5 простых советов, которые реально работают

Как действовать, чтобы покрышки прослужили дольше

Вокруг света
Палеогенетики уточнили происхождение первых земледельцев Европы Палеогенетики уточнили происхождение первых земледельцев Европы

Палеогенетики уточнили происхождение неолитического населения Европы и Анатолии

N+1
Её совершенствовали и популяризировали больше 90 лет десятки изобретателей и предпринимателей: история застёжки-молнии Её совершенствовали и популяризировали больше 90 лет десятки изобретателей и предпринимателей: история застёжки-молнии

В начале 20 века она смотрелась легкомысленно на женской одежде

VC.RU
Коллективная победа Коллективная победа

Как заработать деньги на спортивном сообществе?

Forbes Life
От кисты до менструации: почему болит грудь и как облегчить симптомы От кисты до менструации: почему болит грудь и как облегчить симптомы

Почему временами болит грудь и как можно облегчить неприятные симптомы

VOICE
«Тщательно контролируемая галлюцинация: как ваш мозг предсказывает (почти) все» «Тщательно контролируемая галлюцинация: как ваш мозг предсказывает (почти) все»

Наша повседневная реальность — это тщательно контролируемая галлюцинация

Вокруг света
Дельфины узнали знакомых по вкусу мочи Дельфины узнали знакомых по вкусу мочи

Зоологи узнали, что афалины способны различать знакомых особей по вкусу их мочи

N+1
Человек, который сдвинул континенты: невероятные экспедиции Альфреда Вегенера Человек, который сдвинул континенты: невероятные экспедиции Альфреда Вегенера

Альфред Вегенер: «Полярный исследователь обязан быть героем»

Вокруг света
Без антибиотиков, по древнему рецепту монахов: как и где делают настоящий пармезан Без антибиотиков, по древнему рецепту монахов: как и где делают настоящий пармезан

Как в Эмилия-Романье варят пармиджано-реджано по древнему рецепту монахов

Вокруг света
Осознать себя как ценность Осознать себя как ценность

Как начать уважать и ценить себя?

Psychologies
Названы 5 тайн Вселенной, которые человечеству еще предстоит разгадать Названы 5 тайн Вселенной, которые человечеству еще предстоит разгадать

Ученые до сих пор не знают ответов на многие фундаментальные вопросы

Вокруг света
Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
На это может попасться каждый. Самые обидные случаи лишения прав На это может попасться каждый. Самые обидные случаи лишения прав

Неочевидные случаи, когда водитель надолго может превратиться в пешехода

РБК
«Где они все?» Ученые объяснили, почему инопланетяне до сих пор не прилетели на Землю «Где они все?» Ученые объяснили, почему инопланетяне до сих пор не прилетели на Землю

Астробиологи попытались разрешить парадокс Ферми

Вокруг света
Дом для двоих Дом для двоих

Основой интерьера стала современная классика, обогащённая винтажными деталями

SALON-Interior
«Комемадре» Роке Ларраки: сюрреалистичный роман о жестоком научном эксперименте, который на деле оказывается высказыванием о гуманизме «Комемадре» Роке Ларраки: сюрреалистичный роман о жестоком научном эксперименте, который на деле оказывается высказыванием о гуманизме

Отрывок из жутковатого философского романа «Комемадре» Роке Ларраки

Правила жизни
Открыть в приложении