Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Генная терапия поставила на ноги мышей с миодистрофией Генная терапия поставила на ноги мышей с миодистрофией

Можно ли восстановить работу мышц у мышей на поздних стадиях миодистрофии

N+1
Глобальный сдвиг или глубочайший кризис: каким будет 2021 год Глобальный сдвиг или глубочайший кризис: каким будет 2021 год

Список главных трендов года

РБК
Кино эпохи замещения Кино эпохи замещения

«Святым тут не место»: версия Пола Шрейдера, которую мы заслужили

Weekend
Сменить колею: что не так с транспортной политикой в России Сменить колею: что не так с транспортной политикой в России

Почему транспортная политика в России не работает

Forbes
Как не пойти на дно и перезапустить бизнес в «новой реальности» Как не пойти на дно и перезапустить бизнес в «новой реальности»

О том, как обезопасить бизнес сегодня и переформатировать его под реалии завтра

Inc.
Внутри вас — множество субличностей. Кто они и чего хотят? Внутри вас — множество субличностей. Кто они и чего хотят?

Отрывок из книги Ричарда Шварца «Мои разные "я"» — о разных частях личности

Популярная механика
Элоди Харпер: «Дом волчиц». Исторический роман о судьбе женщины на фоне готовых к гибели Помпей Элоди Харпер: «Дом волчиц». Исторический роман о судьбе женщины на фоне готовых к гибели Помпей

До извержения Везувия Помпеи живут беззаботной жизнью. Отрывок из книги

СНОБ
Одна вокруг света: вулканическое озеро и обед на рыбацком пляже Одна вокруг света: вулканическое озеро и обед на рыбацком пляже

169-я серия о кругосветном путешествии Ирины Сидоренко: «изумрудное око Анд»

Forbes
Борьба с глобальным потеплением при помощи диеты: что такое редукторианство и с чем его едят Борьба с глобальным потеплением при помощи диеты: что такое редукторианство и с чем его едят

Ученые ищут все новые способы борьбы с изменениями климата

Вокруг света
Палеогенетики уточнили происхождение первых земледельцев Европы Палеогенетики уточнили происхождение первых земледельцев Европы

Палеогенетики уточнили происхождение неолитического населения Европы и Анатолии

N+1
Психолог, психотерапевт, психиатр, психоаналитик: в чем разница? Психолог, психотерапевт, психиатр, психоаналитик: в чем разница?

Попробуем разобраться, чем отличается психолог от психотерапевта и психиатра

Psychologies
Я не трус, но я боюсь: как отстаивать себя, не боясь конфликтов? Я не трус, но я боюсь: как отстаивать себя, не боясь конфликтов?

В каких случаях отстаивание себя и своих интересов перерастает в ссору?

Psychologies
Язык бога: лингвист расшифровал генетической код Язык бога: лингвист расшифровал генетической код

Язык бога: лингвист расшифровал генетической код

Вокруг света
«Заговор военных»: анатомия мифа «Заговор военных»: анатомия мифа

Как появилась легенда о некоем «заговоре военных» для свержения Сталина

Дилетант
Модестова ушла, умер в 40: трагическая судьба Модестова ушла, умер в 40: трагическая судьба

Как сложилась судьба звезды "Последнего героя" Сергея Сакина?

VOICE
Петербургский отельер — о том, как сделать премиум-отель из коммуналок Петербургский отельер — о том, как сделать премиум-отель из коммуналок

Отельер Юнис Теймурханлы — о потребности постоянно находиться в гостинице

РБК
На темную сторону: преимущества и стоимость атермальной тонировки На темную сторону: преимущества и стоимость атермальной тонировки

Что такое атермальная тонировка?

РБК
Королева пустыни: как Гертруда Белл стала одной из самых влиятельных женщин в Ираке Королева пустыни: как Гертруда Белл стала одной из самых влиятельных женщин в Ираке

Путешественница, писательница, шпионка, одна из первых женщин-археологов

Forbes
Орел и менора: почему россияне выбирают Израиль для второго гражданства Орел и менора: почему россияне выбирают Израиль для второго гражданства

Почему соотечественников тянет в Израиль и как получить второе гражданство?

Forbes

Две грозные бомбы, являющиеся самыми мощными на планете

ТехИнсайдер
Ткани со сверхвозможностями: материалы настоящего и будущего Ткани со сверхвозможностями: материалы настоящего и будущего

Культ тканей из природных волокон сменился восторгом от синтетических тканей

Популярная механика
Почему был убит Александр II и как он мог спастись после покушения Почему был убит Александр II и как он мог спастись после покушения

От судьбы не уйдешь, даже если ты император

ТехИнсайдер
Сын сварщика, первый муж Умы Турман: посмотри, каким стал красавец Гэри Олдмен Сын сварщика, первый муж Умы Турман: посмотри, каким стал красавец Гэри Олдмен

Каким был и каким стал сердцеед и сердцекрад Гэри Олдмен

VOICE
Любовь к Родине: что такое здоровый патриотизм? Любовь к Родине: что такое здоровый патриотизм?

Можно ли ощущать себя собой, отрицая свою принадлежность к родной стране?

Psychologies
Этот удивительный советский поезд на магнитной подушке четверть века провел Этот удивительный советский поезд на магнитной подушке четверть века провел

ТП-01 — первый советский маглев, поезд на магнитной подушке

ТехИнсайдер
Следы на воде Следы на воде

Проекты верфей, которым не помешал карантин

Robb Report
«Жена зависима от компьютерных игр и забывает о ребенке» «Жена зависима от компьютерных игр и забывает о ребенке»

Что делать, если у близкого человека игровая зависимость?

Psychologies
Приводим жизнь в равновесие: как правильно составлять «колесо баланса»? Приводим жизнь в равновесие: как правильно составлять «колесо баланса»?

Справиться с проблемой хаотичного «все и сразу» поможет техника «колесо баланса»

Psychologies
Маску на себя: почему не стоит забывать о собственных чувствах Маску на себя: почему не стоит забывать о собственных чувствах

Почему обращаться к помощи — не стыдно, а правильно

РБК
Открыть в приложении