Что предстоит сделать разработчикам, чтобы ИИ совершил рывок в развитии?

ForbesHi-Tech

Прогресс не остановить: почему важно развивать искусственный интеллект в смартфонах

Александр Безносиков

Фото Getty Images

В 2013 году герой Хоакина Феникса в фильме «Она» общался с голосовым помощником Самантой как с реальным человеком и даже влюблялся в нее. Спустя 10 с лишним лет в наших гаджетах живут помощники с приятными голосами и неплохо шутят, но в остальном все еще не могут приблизиться к Саманте. Что предстоит сделать ученым и разработчикам, чтобы ИИ совершил этот рывок? Или мы остановимся в этой точке? О прогрессе ИИ в мобильных устройствах рассуждает лауреат премии Yandex ML Prize, научный сотрудник МФТИ и Yandex Research ML Residency, математик Александр Безносиков.

Распознавание лиц и голоса

ИИ в смартфонах стали использовать уже в нулевых, когда появились камеры. Но вычислительных ресурсов для распознавания фотографий в компьютерах и смартфонах не хватало, поэтому алгоритмы работали не так точно, как хотелось бы. Например, объем оперативки Samsung X600 в 2003 году составлял несколько десятков Мб, а разрешение камер — всего 0,3 Мп. На таких скромных мощностях можно было зеркалить изображения, добавлять рамки и экспериментировать со снимками.

В начале 2010-х смартфоны стали мощнее. С развитием машинного обучения создавались более продвинутые алгоритмы обработки изображений — сверточные нейронные сети. Эти нейронки помогали компьютерам анализировать — то есть видеть и понимать — изображение и видео. Так, искусственный интеллект стал предлагать фотографу сделать удачный ракурс, размыть фон или увеличить резкость, устранить шумы или эффект красных глаз. А затем пришло время голосовых помощников.

  • 2011 год. Apple разработала Siri — голосового помощника, ставшего одной из первых массово применяемых систем ИИ в смартфонах.
  • 2012 год. Google выпустила персонализированный поисковый сервис Google Now. Вскоре к нему добавили функции шагомера, напоминаний, сервиса для покупки авиабилетов. Через пять лет его заменил Pixel Launcher.
  • 2016 год. Google разработала улучшенную версию голосового помощника Google Assistant и умную клавиатуру Gboard. Apple представила SiriKit — набор инструментов, позволяющий разработчикам встраивать Siri в приложения.

Генеративные модели

В то же время в смартфонах появились генеративные модели, алгоритмы которых могли в том числе создавать и изменять фото, видео и текст. Вы наверняка помните фильтры и эффекты в Instagram (принадлежит Meta, которая признана экстремистской организацией и запрещена в России) 2010 года. Другой пример использования генеративных моделей — фильтры на смартфонах HTC (2012 год), которые можно было применять прямо во время съемки, аватары-мультяшки в приложении Bitmoji (2014 год), а также функции AR в Snapchat (2015 год).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Быстрее, выше, дешевле: как Маск и Безос делят космос Быстрее, выше, дешевле: как Маск и Безос делят космос

Илон Маск против Джеффа Безоса: кто успешнее осваивает космос?

Forbes
Как поймать северное сияние и сфотографировать его: по этим 4 шагам даже школьник сделает классные снимки Как поймать северное сияние и сфотографировать его: по этим 4 шагам даже школьник сделает классные снимки

Как, наконец, увидеть это злосчастное сияние?!

ТехИнсайдер
Ветряки, солнечные панели и декарбонизация бизнеса: какой будет энергетика будущего Ветряки, солнечные панели и декарбонизация бизнеса: какой будет энергетика будущего

Есть ли у человечества возможность отказаться от грязных ресурсов?

Forbes
Рыбалка изменила поведение сендеронгов в период спаривания Рыбалка изменила поведение сендеронгов в период спаривания

Ученые наблюдали за поведением самцов сендеронгов в период спаривания

N+1
10 крупных секс-скандалов шоу-бизнеса, не считая Пи Дидди 10 крупных секс-скандалов шоу-бизнеса, не считая Пи Дидди

Как звезды теряли свой моральный облик и к чему это приводило

Maxim
Письмена доколумбовой Америки Письмена доколумбовой Америки

Системы письма у майя, ацтеков, мештеков и инков

Знание – сила
Как две ученые нашли месторождение алмазов, но их открытие присвоили себе другие люди Как две ученые нашли месторождение алмазов, но их открытие присвоили себе другие люди

Пример того, как тяжелый труд ученых был вознагражден подлостью

Forbes
Графомания или смерть Графомания или смерть

Что вынуждает ученых публиковать так много статей

N+1
Думать — больно? Западные эксперты рассказали, как сознательно снизить уровень стресса Думать — больно? Западные эксперты рассказали, как сознательно снизить уровень стресса

Мышление может причинять боль? Вот как это объясняют специалисты!

ТехИнсайдер
«Нимб и крест: как читать русские иконы» «Нимб и крест: как читать русские иконы»

Как хорошо средневековый человек ориентировался в иконографии

N+1
Жизнь моя — шарманка Жизнь моя — шарманка

«Планета Джанет»: образцовая мелодрама A24

Weekend
«Стихи Живаго и есть то, что нужно было сказать» «Стихи Живаго и есть то, что нужно было сказать»

Константин Поливанов о том, зачем Пастернаку понадобился доктор Живаго

Weekend
Виктор Ерофеев — про Экзюпери, Олимпиаду в Париже и русскую культуру с одышкой Виктор Ерофеев — про Экзюпери, Олимпиаду в Париже и русскую культуру с одышкой

Писатель Виктор Ерофеев — о жизни как служении

СНОБ
История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое

Кто и как изобрел первый компактный аналоговый информационный носитель

Правила жизни
Биоритмы: что это такое, на что влияют, как наладить Биоритмы: что это такое, на что влияют, как наладить

Учимся быть чуткими к биологическим часам и разбираемся, как наладить режим

РБК
Однажды работник Кока-колы хотел продать секрет напитка! Но представители Пепси позвали ФБР Однажды работник Кока-колы хотел продать секрет напитка! Но представители Пепси позвали ФБР

Как сотрудник Coca-Cola попытался продать коммерческие секреты Pepsi

ТехИнсайдер
«Не терпя лукавыя бесовские крамолы» «Не терпя лукавыя бесовские крамолы»

«И пришел из Орды, и сел на великокняжеском престоле»

Дилетант
Перерыв на обед Перерыв на обед

Несколько доступных вариантов легкого обеда и перекусов в офисе

Лиза
Урал, любовь моя Урал, любовь моя

5 абсолютно разных граней Большой уральской тропы

2Xplore
Главное — сохранять спокойствие: каковы действия пилота, если перед посадкой отказали шасси Главное — сохранять спокойствие: каковы действия пилота, если перед посадкой отказали шасси

Что может произойти в случае, если шасси перед посадкой самолета не выпускаются

ТехИнсайдер
Придумал ценники, скидки и супермаркеты: история «короля шоппинга» Фрэнка Вулворта Придумал ценники, скидки и супермаркеты: история «короля шоппинга» Фрэнка Вулворта

История человека, который подарил миру удобный и выгодный шоппинг

ТехИнсайдер
Он терял кожу от любого удара, а теперь жмет от груди 150 кг! История редкой болезни «детей-бабочек» Он терял кожу от любого удара, а теперь жмет от груди 150 кг! История редкой болезни «детей-бабочек»

Дин Клиффорд бросил вызов смерти и ведет активный образ жизни!

ТехИнсайдер
Правда ли, что волосы на самом деле мертвые: 11 любопытных фактов о нашей шевелюре Правда ли, что волосы на самом деле мертвые: 11 любопытных фактов о нашей шевелюре

Мы стараемся тщательно ухаживать за волосами, но так мало о них знаем

ТехИнсайдер
9 фраз, которые лучше никогда не произносить вслух 9 фраз, которые лучше никогда не произносить вслух

Чего не стоит говорить людям, чтобы не сделать им хуже?

Psychologies
Хроническая боль: психологические эффекты и способы лечения Хроническая боль: психологические эффекты и способы лечения

С какими переживаниями сталкиваются люди с хроническими болями

Psychologies
«В мире произошел переход от лечебных практик к профилактическим» «В мире произошел переход от лечебных практик к профилактическим»

О драйверах рынка БАДов рассказала Марина Камаева

РБК
Какие люди и почему чаще всего используют слова-паразиты: мнение лингвистов и психологов Какие люди и почему чаще всего используют слова-паразиты: мнение лингвистов и психологов

Почему мы на самом деле используем слова-паразиты?

Psychologies
Антидворянец: Нобели Антидворянец: Нобели

История одной семьи, повлиявшей на дизайн целых городских районов

Правила жизни
Почему люди из Азии пахнут иначе? Вот как мутация одного гена повлияла на их тела! Почему люди из Азии пахнут иначе? Вот как мутация одного гена повлияла на их тела!

Ген ABCC11 сильно влияет на запах тела у представителей разных этнических групп

ТехИнсайдер
Лайфстайл в локальном исполнении Лайфстайл в локальном исполнении

Lamoda делает акцент на уникальный ассортимент и строгий отбор брендов

Монокль
Открыть в приложении