Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

7 фактов об автомобилях, которые стыдно не знать даже начинающему водителю. Проверим, разбираетесь ли вы в машинах! 7 фактов об автомобилях, которые стыдно не знать даже начинающему водителю. Проверим, разбираетесь ли вы в машинах!

5 вещей об автомобилях, которые должен знать даже «чайник»

ТехИнсайдер
«Я и четыре моих женщины»: так нас видит мужчина каждый месяц «Я и четыре моих женщины»: так нас видит мужчина каждый месяц

Еще вчера вы его страстно хотели, а сегодня он находит вас в углу с книгой?

Psychologies
USS Vermont: Ноев ковчег на военной службе USS Vermont: Ноев ковчег на военной службе

Если вы не верите в Ноя и его ковчег, то прямо сейчас поверьте

Популярная механика
Этот удивительный советский поезд на магнитной подушке четверть века провел Этот удивительный советский поезд на магнитной подушке четверть века провел

ТП-01 — первый советский маглев, поезд на магнитной подушке

ТехИнсайдер
Ученые выяснили, почему молодым женщинам опасно смотреть реалити-шоу Ученые выяснили, почему молодым женщинам опасно смотреть реалити-шоу

Девушкам небезопасно смотреть реалити-шоу. Но почему?

Psychologies
Персона Персона

О будущем B2B-сегмента в интернет-торговле

Robb Report
Модельные эксперименты подтвердили образование гидротриоксидов в атмосфере Модельные эксперименты подтвердили образование гидротриоксидов в атмосфере

Химики экспериментально подтвердили возможность образования гидротриоксидов

N+1
«Все врут»: кому выгодны фейковые новости? «Все врут»: кому выгодны фейковые новости?

Кому нужны фейковые новости?

Psychologies
Элитная подача Элитная подача

Почему большой теннис уже 20 лет считается в России элитарным спортом?

Forbes Life
Геохимики впервые нашли в метеорите вещество сверхновой типа Ia Геохимики впервые нашли в метеорите вещество сверхновой типа Ia

Гипатия была найдена в Египте в конце прошлого века

N+1
Секс и вырождение Секс и вырождение

Способно ли размножение замедлить накопление зловредных мутаций?

СНОБ
Неизвестный Макиавелли: как сложилась судьба автора знаменитого трактата о государственном управлении Неизвестный Макиавелли: как сложилась судьба автора знаменитого трактата о государственном управлении

Никколо Макиавелли отличался трудолюбием и умел радоваться жизни

Вокруг света
Останки из Суздальского Ополья указали на плохое здоровье средневековых жителей поселения Останки из Суздальского Ополья указали на плохое здоровье средневековых жителей поселения

Ученые исследовали останки 26 человек с памятника Михали-3

N+1
Диета при сахарном диабете: что важно знать Диета при сахарном диабете: что важно знать

Как питаться при диабете, чтобы держать его под контролем

РБК
Встать и идти Встать и идти

Как понять, куда и для чего двигаться?

Psychologies
Что лучше: контактные линзы или очки. Выбор неочевиден Что лучше: контактные линзы или очки. Выбор неочевиден

Вокруг использования очков и линз ходит множество мифов. Как определиться?

ТехИнсайдер
Точки матери: как наладить отношения с мамой Точки матери: как наладить отношения с мамой

Почему важно принять в себе материнскую часть и наладить с ней связь

Psychologies
Криштиану Роналду сделал нос, зубы и, возможно, пересадил волосы. Сколько он потратил на внешность? Криштиану Роналду сделал нос, зубы и, возможно, пересадил волосы. Сколько он потратил на внешность?

Криштиану Роналду потратил на внешность десятки тысяч фунтов

Maxim
Украшенный головной убор бронзового века назвали приданым и связали с охранной магией Украшенный головной убор бронзового века назвали приданым и связали с охранной магией

Археологи исследовали набор бронзовых украшений из погребения срубной культуры

N+1
Жоржу Браку — 130 лет. Как понимать работы одного из основоположников кубизма? Жоржу Браку — 130 лет. Как понимать работы одного из основоположников кубизма?

Жорж Брак — художник, который возглавил авангард в европейской живописи

Правила жизни
Спал на голом матрасе и мог не делать уроки: каким было детство Илона Маска Спал на голом матрасе и мог не делать уроки: каким было детство Илона Маска

Как Мэй Маск воспитывала своих детей?

VOICE

Что успел сделать за стремительную жизнь режиссер Евгений Вахтангов

Правила жизни
6 заболеваний кожи у собак, о которых должен знать каждый хозяин 6 заболеваний кожи у собак, о которых должен знать каждый хозяин

Какие проблемы с кожей встречаются у собак?

Популярная механика
Задача для инвестора: как правильно перенести производство в Китай Задача для инвестора: как правильно перенести производство в Китай

Многие компании обращают взгляды на Китай. Что при этом следует помнить?

Forbes
Хроники противоестественного Хроники противоестественного

Премьера новой работы Сергея Лозницы «Естественная история разрушения»

Weekend
Археологи обнаружили в Израиле 120-тысячелетнюю кость с гравировкой Археологи обнаружили в Израиле 120-тысячелетнюю кость с гравировкой

Во время раскопок памятника Нешер Рамла нашли фрагмент кости первобытного тура

N+1
Вся Земля стала полем сражения: что было после Великой Победы? Вся Земля стала полем сражения: что было после Великой Победы?

В 1945–1975 годы милитаризация распространилась на все уголки мира

Вокруг света
Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов

Португальский консул Аристидеш де Соуза Мендеш оказался перед непростым выбором

Вокруг света
Ким Кардашьян, Джессика Альба и другие звезды, которые делали липосакцию Ким Кардашьян, Джессика Альба и другие звезды, которые делали липосакцию

Звезды, обратившиеся за помощью к пластическим хирургам

VOICE
Общение с разведенными: 6 советов для друзей Общение с разведенными: 6 советов для друзей

Как сохранить дружбу, не обидев расставшихся партнеров?

Psychologies
Открыть в приложении