Кажется, что у ИИ с лингвистикой не должно возникнуть проблем. Но так ли это?

Популярная механикаHi-Tech

Распознать любой ценой: как искусственный интеллект научился понимать арабский язык

Автор: Владимир Арлазаров, к.т.н., генеральный директор Smart Engines

Каждому из нас хотелось бы говорить на любом языке мира, не прилагая к этому никаких усилий. При этом мы примерно понимаем, что овладеть английским чуть легче, чем китайским, а испанским - легче, чем арабским. Кажется, что у искусственного интеллекта с лингвистикой вообще не должно возникнуть никаких проблем. Но так ли это на самом деле, расскажет Владимир Арлазаров, к.т.н., генеральный директор компании Smart Engines.

Самое интересное, что шкала сложности изучения языков действительного существует. Например, американский Институт зарубежной службы при Госдепе делит все языки на 4 категории в зависимости от того, сколько часов нужно носителям английского языка на их изучение до уровня свободного владения. Самые сложные языки — это арабский, китайский, корейский и японский, и на их изучение придется потратить не менее 2200 часов. Тогда как на испанский, к примеру, не более 600 часов.

В этой статье мы расскажем, допустимо ли считать арабский язык сложным для человека и искусственного интеллекта (спойлер — да), и почему распознавание арабской вязи — это отдельная ачивка для ИИ.

82100b993fd7d4121834fe92ff32874b.jpg

Что делает арабский таким сложным для человека?

Чтобы ответить на этот вопрос, достаточно вспомнить знаменитый анекдот:

— Ты француз?

— Да.

— О, а скажи что-нибудь на арабском?

Особенность номер один — это отсутствие единого арабского. Арабский язык является основным языком сразу во многих странах мира, что неизбежно ведет к возникновению различных местных диалектов, отличающихся друг от друга так же сильно, как русский от польского, и ни у одного из этих диалектов нет письменного варианта.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Доставка в космос: как на орбиту доставляют малые грузы и зачем там дата-центр Доставка в космос: как на орбиту доставляют малые грузы и зачем там дата-центр

Возможна ли доставка квадрокоптерами не на близлежащую улицу, а в космос?

Популярная механика
Гимнаст Никита Нагорный — Forbes: «Помню, как заработал первые 100 000 рублей» Гимнаст Никита Нагорный — Forbes: «Помню, как заработал первые 100 000 рублей»

Гимнаст Никита Нагорный — о том, как запускал стартапы в незнакомых сферах

Forbes
5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов 5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов

Какие «суперспособности» станут реальностью уже к 2030 году — и какой ценой?

Maxim
«Роскошные сапфиры с защитой»: раскрыта тайна любимых украшений принцессы Дианы «Роскошные сапфиры с защитой»: раскрыта тайна любимых украшений принцессы Дианы

Коллекцию принцессы Дианы с сапфирами оценивают в 20 миллионов фунтов стерлингов

Cosmopolitan
«Год Черной Обезьяны»: семейная сага о первых постсоветских десятилетиях «Год Черной Обезьяны»: семейная сага о первых постсоветских десятилетиях

Отрывок из романа-размышления о том, как прошлое определяет будущее

Forbes
Не могу стать матерью: 3 истории личного выбора Не могу стать матерью: 3 истории личного выбора

Есть разные способы стать родителями. Какой из них выбрать?

Psychologies
Укротительница тигров Маргарита Назарова: трагедия советской циркачки Укротительница тигров Маргарита Назарова: трагедия советской циркачки

Печальная история знаменитой дрессировщицы тигров

VOICE
Пошло все в баню Пошло все в баню

Банный комплекс, оформленный дизайнером Марией Водолацкой

AD
Диджитал-этикет для взрослых: журналисты WSJ составили ряд рекомендаций о цифровой этике и гигиене Диджитал-этикет для взрослых: журналисты WSJ составили ряд рекомендаций о цифровой этике и гигиене

Как выглядит цифровой этикет в современном мире?

Inc.
Марина Казанкова: Марина Казанкова:

Интервью с актрисой Мариной Казанковой

Караван историй
Почему лошади спят стоя Почему лошади спят стоя

Вас никогда не мучил вопрос, почему лошади не падают во сне?

Популярная механика
Энергетические вампиры внутри нас Энергетические вампиры внутри нас

Как поддерживать запасы сил и находить источники восполнения и вдохновения

Psychologies
Как построить телескоп Как построить телескоп

«Когда я заглянул в свой телескоп, я лишился дара речи»

Популярная механика
Продать нельзя уничтожить: почему модные бренды режут и сжигают нераспроданные товары Продать нельзя уничтожить: почему модные бренды режут и сжигают нераспроданные товары

Зачем компании уничтожают остатки одежды и аксессуаров

Esquire
Вызов разуму: Нобелевскую премию по физике присудили за изучение сложности Вызов разуму: Нобелевскую премию по физике присудили за изучение сложности

Нобелевская премия «за вклад в наше понимание сложных физических систем»

Forbes
Софья, Исанна Софья, Исанна

Психолог из Петербурга Исанна Аксютова придумала экобренд «ЛюбЛён»

Собака.ru
«Множественные святые Ньюарка» — приквел культового «Клана Сопрано». И лишний способ убедиться, что 20 лет назад все было лучше «Множественные святые Ньюарка» — приквел культового «Клана Сопрано». И лишний способ убедиться, что 20 лет назад все было лучше

Что не так с приквелом «Клана Сопрано»?

Esquire
Клуб кинопутешествий во времени Клуб кинопутешествий во времени

Машину времени давно изобрел кинематограф

Вокруг света
Я есть Грут: какой получилась игра Я есть Грут: какой получилась игра

Почему вам стоит поиграть в «Стражей Галактики»?

Esquire
К чему приведет одержимость соцсетями. Меган Анджело: Подписчики К чему приведет одержимость соцсетями. Меган Анджело: Подписчики

Отрывок из антиутопии «Подписчики» о разрушительном влиянии соцсетей

СНОБ
Счастье — есть: 6 групп продуктов, которые быстро поднимут тебе настроение Счастье — есть: 6 групп продуктов, которые быстро поднимут тебе настроение

Список полезных и при этом улучшающих самочувствие и тонус продуктов

Лиза
ПМС: болезнь или каприз ПМС: болезнь или каприз

Как бороться с проявлениями предменструального синдрома

Лиза
Кто изобрел аэрозольный баллончик? Кто изобрел аэрозольный баллончик?

Первый шаг к применению аэрозольных баллонов сделал изобретатель Эрик Ротхейм

Популярная механика
Вечно живые Вечно живые

Зинаида Пронченко не любит онлайн, но готова с ним примириться

GQ
Что произойдет с телом мертвого космонавта, если оставить его в космосе Что произойдет с телом мертвого космонавта, если оставить его в космосе

Космос, труп — что будет с телом в условиях космоса?

Популярная механика
Аномальный топологический изолятор защитил микроволновой сигнал от больших помех Аномальный топологический изолятор защитил микроволновой сигнал от больших помех

Физики объединили свойства изоляторов Черна со свойствами изоляторов Флоке

N+1
Философия вегетарианства: взгляд изнутри и снаружи Философия вегетарианства: взгляд изнутри и снаружи

История вегатарианки с 8-летним опытом и комментарий специалиста-диетолога

Playboy
Внутри таштыкской погребальной куклы обнаружили останки взрослого мужчины Внутри таштыкской погребальной куклы обнаружили останки взрослого мужчины

Археологи исследовали погребальную куклу таштыкской культуры

N+1
«‎Невозможно создавать микросхемы без машин ASML»‎: голландская компания, от которой зависят Apple, Samsung и Intel «‎Невозможно создавать микросхемы без машин ASML»‎: голландская компания, от которой зависят Apple, Samsung и Intel

ASML: монополист в области фотолитографии в глубоком ультрафиолете

VC.RU
Электрическое поле помогло исследовать высоколежащие ридберговские состояния атомов Электрическое поле помогло исследовать высоколежащие ридберговские состояния атомов

Китайские физики смогли измерить то, как распределяются главные квантовые числа

N+1
Открыть в приложении