Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
5 продуктов, которые улучшают циркуляцию крови: спасение для сердца и сосудов 5 продуктов, которые улучшают циркуляцию крови: спасение для сердца и сосудов

Что купить в магазине, чтобы улучшить циркуляцию крови?

ТехИнсайдер
Как воспитать ребенка с безопасным типом привязанности: 7 главных шагов — попробуйте на практике Как воспитать ребенка с безопасным типом привязанности: 7 главных шагов — попробуйте на практике

Как воспитать уверенного в себе человека? Начать с привязанности к родителям

Psychologies
Судьба палача: как сложилась жизнь Тоньки-пулеметчицы после Второй Мировой, и кто ее сдал Судьба палача: как сложилась жизнь Тоньки-пулеметчицы после Второй Мировой, и кто ее сдал

Антонина Макарова получила славу женщины-палача

ТехИнсайдер
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Отрывок из романа Янне Теллер «Ничто» Отрывок из романа Янне Теллер «Ничто»

Отрывок из книги «Ничто» датской писательницы Янне Теллер

СНОБ
Без Zombie и Ziggy: как «трагические оптимисты» из караоке-бара ведут бизнес во время нового кризиса Без Zombie и Ziggy: как «трагические оптимисты» из караоке-бара ведут бизнес во время нового кризиса

Что такое альтернативное караоке и может ли такой бизнес приносить прибыль?

VC.RU
Твоя мать! 5 ужасных поступков Иоланды Хадид, в которые сложно поверить Твоя мать! 5 ужасных поступков Иоланды Хадид, в которые сложно поверить

Почему Иоланда Хадид — настоящий антигерой?

VOICE
Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко» Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко»

«Когда нам шагалось легко»: путевые заметки Ивлина Во 1929-1935 годов

Правила жизни
Московский Нострадамус Московский Нострадамус

Это имя уже почти три столетия служит синонимом тайных знаний

Дилетант
Империя как святыня Империя как святыня

Оправдание утопии Цицерона: «Сон Сципиона»

Weekend
Почему в зеркале мы выглядим красивее, чем на фото, и чему надо верить Почему в зеркале мы выглядим красивее, чем на фото, и чему надо верить

Ты когда-нибудь смотрела на фотографию с мыслями: «Какой ужас! Неужели это я?!»

VOICE
Как пилотов защищают от серьезных аварий в «Формуле-1»? Как пилотов защищают от серьезных аварий в «Формуле-1»?

Как работает система защиты пилотов в «Формуле-1»?

Maxim
7 непростительных ошибок при нанесении консилера (ты тоже их делала!) 7 непростительных ошибок при нанесении консилера (ты тоже их делала!)

Консилер: как выбрать оттенок и как его наносить?

VOICE
Что такое война: лучшие снимки фронтовых репортеров СССР Что такое война: лучшие снимки фронтовых репортеров СССР

Некоторые лучшие снимки военных репортеров

Вокруг света
Белковое окрашивание волос: как получить стойкий и мягкий эффект от краски Белковое окрашивание волос: как получить стойкий и мягкий эффект от краски

Есть способ сделать окрашивание волос щадящим и лучше закрепить оттенок волос

VOICE
Искусство проливать кровь Искусство проливать кровь

Памяти Германа Нитча

Weekend
Спустить паруса: лучшие марины Средиземноморья Спустить паруса: лучшие марины Средиземноморья

Самые современные, комфортные и живописные стоянки для яхт в Средиземном море

Forbes
От них ждали «чудо-кнопку», с которой всё быстро учится, но так не бывает: как растёт приложение-школа китайского Laoshi От них ждали «чудо-кнопку», с которой всё быстро учится, но так не бывает: как растёт приложение-школа китайского Laoshi

Предприниматель Сергей Кондрашов учит россиян китайскому больше 10 лет

VC.RU
Целлюлит Целлюлит

Как справиться с целлюлитом?

Здоровье
«Москвич» возвращается. 8 самых культовых моделей марки «Москвич» возвращается. 8 самых культовых моделей марки

Культовые модели возрождающейся марки «Москвич»

РБК
Переливание спинномозговой жидкости от молодых мышей улучшило память у старых Переливание спинномозговой жидкости от молодых мышей улучшило память у старых

Переливать от молодых мышей старым можно не только кровь, но и ликвор

N+1
Отвращение к глюкозе заставило мутантных тараканих отвергнуть брачные подарки диких самцов Отвращение к глюкозе заставило мутантных тараканих отвергнуть брачные подарки диких самцов

Как мутации тараканов влияют на их брачные ритуалы

N+1
«Неплодородная почва»: как бесплодие стало поводом для стигматизации женщин «Неплодородная почва»: как бесплодие стало поводом для стигматизации женщин

Как на протяжении столетий женщины подвергались стигматизации из-за бесплодия

Forbes
Новые машины на старых платформах. Неожиданные примеры со всего мира Новые машины на старых платформах. Неожиданные примеры со всего мира

Какие современные автомобили построены на весьма пожилой технической базе

РБК
Инъекция надежды от психотерапевта Альфрида Лэнгле Инъекция надежды от психотерапевта Альфрида Лэнгле

Как организовать свою жизнь в новой реальности?

Psychologies
Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа

Они сражались не ради славы и оваций, а за то, что любили — за Родину!

ТехИнсайдер
Палеогенетики впервые прочитали полный геном помпейца Палеогенетики впервые прочитали полный геном помпейца

Палеогенетики и биоархеологи исследовали останки двух жителей Помпей

N+1
USS Vermont: Ноев ковчег на военной службе USS Vermont: Ноев ковчег на военной службе

Если вы не верите в Ноя и его ковчег, то прямо сейчас поверьте

Популярная механика
«Не ной»: помогают ли жесткие методики в российском спорте воспитывать чемпионов «Не ной»: помогают ли жесткие методики в российском спорте воспитывать чемпионов

О суровых методах воспитания чемпионов среди российских тренеров ходят легенды

Forbes
Открыть в приложении