Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Древнего дюгоня покусали акулы и крокодил Древнего дюгоня покусали акулы и крокодил

Палеонтологи описали остатки вымершего дюгоня из рода Culebratherium

N+1
Теория заговора: как Стэнли Кубрик в «Сиянии» намекал, что снимал полет американцев на Луну Теория заговора: как Стэнли Кубрик в «Сиянии» намекал, что снимал полет американцев на Луну

Как конспирологи расшифровали культовый фильм ужасов «Сияние»

Maxim
Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу

Энанциорнис Avisaurus darwini достигал размеров ястреба и хватал добычу лапами

N+1
«Счастье не за горами»: 7 шагов на пути к лучшей жизни «Счастье не за горами»: 7 шагов на пути к лучшей жизни

Чтобы стать счастливее, достаточно пары несложных действий

Psychologies
Первая минута Первая минута

Как заставить начало разговора работать на результат

kiozk originals
«Это самая феминистская картина, которую вообще можно себе представить, осанна женщине». Режиссер Александр Зельдович о фильме «Медея» «Это самая феминистская картина, которую вообще можно себе представить, осанна женщине». Режиссер Александр Зельдович о фильме «Медея»

Александр Зельдович — о своем новом фильме «Медея»

СНОБ
Скотленд-Ярд Скотленд-Ярд

Исторический дом в Лондоне с шотландскими и русскими мотивами в интерьере

AD
6 способов побороть осенне-зимнюю хандру 6 способов побороть осенне-зимнюю хандру

Как бороться с упадком сил зимой?

Playboy
5 фильмов, где зло победило добро 5 фильмов, где зло победило добро

Смотрим фильмы, где злые силы восторжествовали. И сделали это с размахом

GQ
Что позволено гению. Разговор Зауре Розмат с Исфаром Сарабским — о самодисциплине, плагиате и миксе культур Что позволено гению. Разговор Зауре Розмат с Исфаром Сарабским — о самодисциплине, плагиате и миксе культур

Бизнесвумен Зауре Розмат и музыкант Исфар Сарабский — о творчестве и бизнесе

Esquire
Кровавый долг и кровная месть. Отрывок из книги врача-гематолога Кровавый долг и кровная месть. Отрывок из книги врача-гематолога

Книга гематолога «История крови. От первобытных ритуалов к научным открытиям»

СНОБ
Дочери Газманова, Табакова, Крапивиной: как выглядят дебютантки бала Tatler-2021 Дочери Газманова, Табакова, Крапивиной: как выглядят дебютантки бала Tatler-2021

Посмотрим на девушек, которых скоро будет обсуждать вся страна!

Cosmopolitan
Как избавиться от запаха ног: 5 способов решения проблемы Как избавиться от запаха ног: 5 способов решения проблемы

Гипергидроз ног — как с ним справиться?

Playboy
Жесткая, но эффективная бессолевая диета: что говорят о ней отзывы Жесткая, но эффективная бессолевая диета: что говорят о ней отзывы

Кому отказ от соли поможет подтянуть здоровье и избавиться от лишних кило?

Cosmopolitan
Незаконнорожденный мой сын Незаконнорожденный мой сын

Дэмиен Херли строил планы на деньги своего отца, но тут в дело вмешался дедушка

Tatler
Почему трубы теплоэлектростанций красят в красно-белые полоски Почему трубы теплоэлектростанций красят в красно-белые полоски

Для чего нужен полосатый раскрас трубам ТЭЦ?

Популярная механика
Первая помощь при инсульте: что делать до приезда скорой Первая помощь при инсульте: что делать до приезда скорой

Подробный гид по оказанию первой помощи при инсульте

РБК
«Мы находимся внутри глобального инфляционного тренда» «Мы находимся внутри глобального инфляционного тренда»

Экономист Михаил Дмитриев — об инфляции и рабочей силе

Эксперт
Крайние меры: как выключить или перезагрузить iPhone 12, 11, X, 8, 7 Крайние меры: как выключить или перезагрузить iPhone 12, 11, X, 8, 7

Как выключить айфон – при зависании или отсутствии реакции на касания

CHIP
Опаснее, чем мы думали: 10 удивительных фактов о тираннозаврах Опаснее, чем мы думали: 10 удивительных фактов о тираннозаврах

Чего мы не знали о тираннозаврах?

Популярная механика
LinkedIn для медиков: как стартап Н1 привлек $100 млн и собрал онлайн-данные о врачах LinkedIn для медиков: как стартап Н1 привлек $100 млн и собрал онлайн-данные о врачах

Компания собрала информацию о 10 млн врачей по всему миру и заработала на этом

Forbes
Бюджет: каждому свое? Бюджет: каждому свое?

Следует ли нам обсуждать с партнером свои финансы?

Psychologies
10 фактов о космическом мусоре 10 фактов о космическом мусоре

Факты о космическом мусоре, которые всерьёз обсуждаются в космических кругах

Популярная механика
Самые большие статуи в мире: зачем их строят? Самые большие статуи в мире: зачем их строят?

Зачем строят гигантские статуи

Популярная механика
10 самых дорогих украшений, которые сейчас существуют 10 самых дорогих украшений, которые сейчас существуют

Эти бриллианты удивят вас своими размерами, цветами и стоимостью

GQ
Та самая Мамушка: как Хэтти МакДэниел стала первой афроамериканкой с премией «Оскар» Та самая Мамушка: как Хэтти МакДэниел стала первой афроамериканкой с премией «Оскар»

История Хэтти МакДэниел, которая боролась с дискриминацией даже став звездой

Forbes
Шимпанзе не понравился запах смерти Шимпанзе не понравился запах смерти

Шимпанзе продемонстрировали отвращение к путресцину

N+1
Нет неправильных эмоций: как поддержать человека, у которого рак Нет неправильных эмоций: как поддержать человека, у которого рак

С какими эмоциями сталкивается онкобольной и как его поддержать?

Cosmopolitan
Психотерапия: 10 важных уроков Психотерапия: 10 важных уроков

Клиенты психологов делятся самым важным, что они вынесли из терапии

Psychologies
Право не быть роботом. Что вы знаете о робоэтике Право не быть роботом. Что вы знаете о робоэтике

Что мы упускаем в «законах робототехники» Айзека Азимова?

Популярная механика
Открыть в приложении