Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Интенсивное лечение артериальной гипертензии снизило риск деменции Интенсивное лечение артериальной гипертензии снизило риск деменции

Интенсивное выявление артериальной гипертензии значительно снижает риск деменции

N+1
Дмитрий Брейтенбихер: «Сначала лучше, потом дешевле. Сначала доходы, потом расходы» Дмитрий Брейтенбихер: «Сначала лучше, потом дешевле. Сначала доходы, потом расходы»

ВТБ намерен развивать бизнес по работе с состоятельными клиентами

Forbes
Утерянный 5000 лет назад: ученые воскресили древнейший в мире синтетический краситель. Зачем он нужен? Утерянный 5000 лет назад: ученые воскресили древнейший в мире синтетический краситель. Зачем он нужен?

Откуда взялся яркий, насыщенный синий цвет в Древнем Египте

Inc.
15-минутный город будущего или как будут жить наши потомки 15-минутный город будущего или как будут жить наши потомки

По мнению ученых и экоактивистов, будущее за компактными локациями

Playboy
Когда медицина перестает быть бумажной: как Москва лечит людей и спасает деревья Когда медицина перестает быть бумажной: как Москва лечит людей и спасает деревья

Как электронная медицина спасает сотни деревьев?

Правила жизни
Найден способ превращать воду, солнечный свет и CO2 в чистый керосин Найден способ превращать воду, солнечный свет и CO2 в чистый керосин

Система, которая может производить топливо из солнечного света и воздуха

Популярная механика
Химики оценили эффективность переработки океанского пластикового мусора на борту корабля Химики оценили эффективность переработки океанского пластикового мусора на борту корабля

Работа кораблей-мусорщиков выгоднее, чем транспортировка мусора на берег

N+1
Миссионерская поза и 240 дней воздержания: как занимались сексом в Средневековье Миссионерская поза и 240 дней воздержания: как занимались сексом в Средневековье

Правда ли, что в Средневековье секс был под запретом почти 240 дней в году?

Psychologies
Как основатели фермерского проекта LavkaLavka похоронили бизнес и деньги инвесторов Как основатели фермерского проекта LavkaLavka похоронили бизнес и деньги инвесторов

Почему потухла звезда LavkaLavka и как Акимов намерен реабилитироваться

Forbes
10 страшных историй, которые случились наяву 10 страшных историй, которые случились наяву

От изгнания бесов до необъяснимых смертей: кошмары, в которые трудно поверить

Esquire
«Опыт предыдущих поколений новым уже не нужен»: Екатерина Шульман о воспитании детей «Опыт предыдущих поколений новым уже не нужен»: Екатерина Шульман о воспитании детей

Как воспитывать детей в постоянно изменяющемся мире?

Forbes
8 заикающихся знаменитостей 8 заикающихся знаменитостей

Узнай, как эти знаменитости справились с нарушениями речи и добились успеха

Maxim
Прощай, мой господин: как разводились в Османской империи Прощай, мой господин: как разводились в Османской империи

Почему мужчины искали «промежуточных» мужей бывшим женам?

Cosmopolitan
Наталья Андрейченко: как «Леди Совершенство» открыла духовный центр в Мексике Наталья Андрейченко: как «Леди Совершенство» открыла духовный центр в Мексике

Почему Наталье Андрейченко пришлось вернуться на родину и заново учиться жить?

Cosmopolitan
Тюнинг Тюнинг

Калаш хорош, но его можно сделать еще лучше

Популярная механика
Что нам делать с моногамией Что нам делать с моногамией

Почему иногда лучше попробовать, чем долго сомневаться

GQ
Евгения Кузнецова. Под «колпаком» Галины Волчек Евгения Кузнецова. Под «колпаком» Галины Волчек

Думалось, она будет всегда, но два года назад Галина Волчек покинула театр

Караван историй
Российские ученые создали ускоренный метод оценки деградации материала для авиации Российские ученые создали ускоренный метод оценки деградации материала для авиации

Ученые разработали метод, позволяющий бороться с усталостью материала в авиации

Популярная механика
Сбавить обороты: 8 способов справиться со своей раздражительностью без вреда для себя и партнера Сбавить обороты: 8 способов справиться со своей раздражительностью без вреда для себя и партнера

Даже в счастливых браках супругам бывает непросто сдержать свое негодование

Лиза
Ничего личного: что делать, если отношения с боссом вышли за грань деловых Ничего личного: что делать, если отношения с боссом вышли за грань деловых

Как напомнить боссу о личном пространстве, не лишившись должности

Cosmopolitan
Бегущий по лезвию Бегущий по лезвию

История уникального человека по имени Джон Макафи

Playboy
«Воздушные ворота Ленинграда»: как строился аэровокзал «Пулково» — модернистское здание 70-х, получившее в народе прозвище «пять стаканов» «Воздушные ворота Ленинграда»: как строился аэровокзал «Пулково» — модернистское здание 70-х, получившее в народе прозвище «пять стаканов»

Отрывок из книги «Ленинград: архитектура советского модернизма. 1955−1991»

Esquire
Крипто-арт: будущая реальность Крипто-арт: будущая реальность

Крипто-арт: его истоки, особенности и перспективы

СНОБ
Как устроен вертолет Ми-28НЭ — летучий антитанк Как устроен вертолет Ми-28НЭ — летучий антитанк

Ми-28НЭ — гроза любой ползучей техники

Maxim
Если пупок надоел Если пупок надоел

Места, которые мы постоянно видим и трогаем, а названий-то и не знаем

Maxim
Как ученые искали темную материю на Земле: пространственные искажения Как ученые искали темную материю на Земле: пространственные искажения

Ученые попробовали вычислить загадочное вещество с помощью атомных часов

Популярная механика
Спасти планету и жить счастливо: 7 книг об экологичном образе жизни, который можно начать уже сегодня Спасти планету и жить счастливо: 7 книг об экологичном образе жизни, который можно начать уже сегодня

Как помочь планете вернуть биоразнообразие и остановить глобальное потепление

Популярная механика
Ледянка VS снегокат: на чем лучше и безопаснее кататься с горки грядущей зимой Ледянка VS снегокат: на чем лучше и безопаснее кататься с горки грядущей зимой

Самые популярные варианты средств для катания с горки

Cosmopolitan
Та самая Мамушка: как Хэтти МакДэниел стала первой афроамериканкой с премией «Оскар» Та самая Мамушка: как Хэтти МакДэниел стала первой афроамериканкой с премией «Оскар»

История Хэтти МакДэниел, которая боролась с дискриминацией даже став звездой

Forbes
5 фильмов, где зло победило добро 5 фильмов, где зло победило добро

Смотрим фильмы, где злые силы восторжествовали. И сделали это с размахом

GQ
Открыть в приложении