Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Саша Стоун: «Мужчина — это гора» Саша Стоун: «Мужчина — это гора»

Саша Стоун об участии в шоу «Звезды в Африке» и отношениях с Валей Карнавал

ЖАРА Magazine
Ученые выяснили, почему молодым женщинам опасно смотреть реалити-шоу Ученые выяснили, почему молодым женщинам опасно смотреть реалити-шоу

Девушкам небезопасно смотреть реалити-шоу. Но почему?

Psychologies
Искусство проливать кровь Искусство проливать кровь

Памяти Германа Нитча

Weekend
Сексуальные привычки животных: 5 самых необычных способов оплодотворения в дикой природе Сексуальные привычки животных: 5 самых необычных способов оплодотворения в дикой природе

Самые странные способы оплодотворить свою вторую половинку в животном мире

Популярная механика
Два по цене одного: как халява заставляет человека совершать неразумные поступки и драться за товары Два по цене одного: как халява заставляет человека совершать неразумные поступки и драться за товары

Почему мы так бурно реагируем на бесплатные товары и услуги?

VC.RU
Почему в СССР тапочки прижились только после смерти Сталина Почему в СССР тапочки прижились только после смерти Сталина

Почему тапки прижились в СССР лишь в 60-х годах

Cosmopolitan
Нейросети и социальные проекты: чем занимаются девушки из рейтинга «30 до 30» Нейросети и социальные проекты: чем занимаются девушки из рейтинга «30 до 30»

Российский Forbes опубликовал четвертый ежегодный список «30 до 30»

Forbes
К лету точно похудею: какие гаджеты помогут стать настоящим boss of the gym К лету точно похудею: какие гаджеты помогут стать настоящим boss of the gym

Зачем нужна умная бутылка для воды и как подобрать подходящие наушники

Maxim
Опра Уинфри: трагическая и невероятная история главной женщины Америки Опра Уинфри: трагическая и невероятная история главной женщины Америки

Если вы заглянете в прошлое Опры, у вас перехватит дыхание

VOICE
10 мощных российских тракторов: отечественная техника, за которую не стыдно 10 мощных российских тракторов: отечественная техника, за которую не стыдно

В России делаются свои трактора, причём на мировом уровне

ТехИнсайдер
«Вернитесь к спонтанности» «Вернитесь к спонтанности»

Громко смеяться, играть взахлеб и даже хлопать в ладоши — зачем нам это?

Psychologies
Эти аномалии Эти аномалии

Данные о путешествии Voyager 2 в межзвездное пространство и выводы

ТехИнсайдер
Анна Ардова: Анна Ардова:

Эмоциональный разговор с Анной Ардовой

Караван историй
Капкан ипотеки Капкан ипотеки

За что могут выселить из квартиры и как этого избежать

Лиза
Истории трудностей и инноваций: что бизнесу стоит рассказать о себе Истории трудностей и инноваций: что бизнесу стоит рассказать о себе

Почему клиентов отталкивают цифры и привлекают истории

VC.RU
Философия безмятежности: каким был в жизни и чему учил Эпикур Философия безмятежности: каким был в жизни и чему учил Эпикур

История не была добра к древнегреческому философу Эпикуру

Вокруг света
Даешь четкий ритм! Даешь четкий ритм!

Аритмия — одна из самых частых проблем, с которой люди обращаются к кардиологу

Лиза
Приводим жизнь в равновесие: как правильно составлять «колесо баланса»? Приводим жизнь в равновесие: как правильно составлять «колесо баланса»?

Справиться с проблемой хаотичного «все и сразу» поможет техника «колесо баланса»

Psychologies
Мир во втором чтении Мир во втором чтении

Игорь Гулин об «Ангеле войны» Виктора Кривулина

Weekend
«Концепция боулинга с пивом и дешёвыми снеками больше не работает»: как устроен боулинг-ресторан Brooklyn Bowl «Концепция боулинга с пивом и дешёвыми снеками больше не работает»: как устроен боулинг-ресторан Brooklyn Bowl

Предприниматель Артём Рахмеев о боулинг-ресторане с выручкой 80 млн рублей в год

VC.RU
«Жена зависима от компьютерных игр и забывает о ребенке» «Жена зависима от компьютерных игр и забывает о ребенке»

Что делать, если у близкого человека игровая зависимость?

Psychologies
Польза и вред легкого голодания: может ли регулярное недоедание продлевать жизнь? Польза и вред легкого голодания: может ли регулярное недоедание продлевать жизнь?

Недоедание: уменьшения числа потребляемых калорий недостаточно

ТехИнсайдер
Курс на Север: 5 маршрутов выходного дня по Ленинградской области и Карелии Курс на Север: 5 маршрутов выходного дня по Ленинградской области и Карелии

Летние выходные — отличный повод полюбоваться суровыми северными красотами

Вокруг света
Демографический рост в Монголии бронзового века связали с молочным животноводством Демографический рост в Монголии бронзового века связали с молочным животноводством

Ученые исследовали зубной камень людей, живших в Алтае в 2900–240 годах до н.э.

N+1
Что делать, если у вас с девушкой или даже женой противоположные взгляды на политику? Что делать, если у вас с девушкой или даже женой противоположные взгляды на политику?

Как уживаться вместе, если ваши политические взгляды не совпадают?

Maxim
О сложных чувствах, повторном браке и потере ребенка: 7 психологических книг О сложных чувствах, повторном браке и потере ребенка: 7 психологических книг

Подборка книг, которая поможет справиться с трудностями бережнее и эффективнее

Psychologies
Сельский шик и гоночные рекорды: история мотоциклов Иж Сельский шик и гоночные рекорды: история мотоциклов Иж

Ижевск — город оружейников, неприхотливых автомобилей и, конечно, мотоциклов

Вокруг света
Внутри вас — множество субличностей. Кто они и чего хотят? Внутри вас — множество субличностей. Кто они и чего хотят?

Отрывок из книги Ричарда Шварца «Мои разные "я"» — о разных частях личности

Популярная механика
Борьба с самим собой. В прокат выходит «Клон» — хит фестиваля «Санденс» Борьба с самим собой. В прокат выходит «Клон» — хит фестиваля «Санденс»

«Клон» — триллер о ненависти к самому себе

СНОБ
Открыть в приложении