Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Причиной гипонатриемии при приеме МДМА назвали выброс окситоцина Причиной гипонатриемии при приеме МДМА назвали выброс окситоцина

Гипонатриемия при приеме МДМА связана с повышением уровня окситоцина

N+1
Чилийская утка и филиппинский селезень вывели потомство с половым диморфизмом Чилийская утка и филиппинский селезень вывели потомство с половым диморфизмом

Орнитологи описали необычный случай гибридизации двух видов уток

N+1
Раскрыт нейронный механизм, который связывает рабочую и долговременную память Раскрыт нейронный механизм, который связывает рабочую и долговременную память

Ученые нашли нейроны гиппокампа, которые отвечают за рабочую и долгую память

ТехИнсайдер
5 фильмов, где зло победило добро 5 фильмов, где зло победило добро

Смотрим фильмы, где злые силы восторжествовали. И сделали это с размахом

GQ
Мы выбираем друг друга не случайно Мы выбираем друг друга не случайно

Выбор партнера предопределен всем предшествующим ходом нашей жизни

Psychologies
Как устроена японская демократия Как устроена японская демократия

Японовед Дмитрий Стрельцов рассказывает о политическом устройстве Японии

Эксперт
Жительница США заказала киллера для бывшего мужа на фейковом сайте Жительница США заказала киллера для бывшего мужа на фейковом сайте

Уроженка США решила, что можно заказать убийство человека на общедоступном сайте

Популярная механика
Евгения Кузнецова. Под «колпаком» Галины Волчек Евгения Кузнецова. Под «колпаком» Галины Волчек

Думалось, она будет всегда, но два года назад Галина Волчек покинула театр

Караван историй
Редкие фото и признания поклонников: что происходит в аккаунтах умерших звезд Редкие фото и признания поклонников: что происходит в аккаунтах умерших звезд

Самые интересные профили умерших звезд в «Инстаграме»

Cosmopolitan
Гендер делу не помеха: женщина, бывший топ-менеджер Google, о предрассудках на работе Гендер делу не помеха: женщина, бывший топ-менеджер Google, о предрассудках на работе

Различие гендеров у фаундеров приводит к улучшению бизнес-показателей

Inc.
Кривой мизинец и плохая память: как гаджеты меняют тело и организм человека Кривой мизинец и плохая память: как гаджеты меняют тело и организм человека

Гаджеты облегчили нашу жизнь, но ценой проблем со здоровьем

Playboy
5 самых кровавых революций в истории 5 самых кровавых революций в истории

Сколько стоит революция?

Maxim
Вырезал сцены с сигаретами и алкоголем и привёз сериал из Японии в США: история Альфреда Кана, популяризовавшего Pokémon Вырезал сцены с сигаретами и алкоголем и привёз сериал из Японии в США: история Альфреда Кана, популяризовавшего Pokémon

Альфред Кан покупал лицензии на игрушки и добивался их всемирной известности

VC.RU
Сериал «Уборщица»: тест на эмпатию или повод выгулять белое пальто? Сериал «Уборщица»: тест на эмпатию или повод выгулять белое пальто?

Что к чему и почему «сама виновата» опять не работает

Cosmopolitan
Лодырь, серый кардинал, манипулятор: как Оксимирон стал главным антагонистом русского рэпа и почему им остается Лодырь, серый кардинал, манипулятор: как Оксимирон стал главным антагонистом русского рэпа и почему им остается

О роли Оксимирона и значении его фигуры и творчества

Esquire
В Южной Германии впервые обнаружили захоронение культуры колоколовидных кубков В Южной Германии впервые обнаружили захоронение культуры колоколовидных кубков

Символическую могилу сделали во второй половине III тысячелетия до нашей эры

N+1
Елки-моталки Елки-моталки

Хорошая хозяйка знает, что Новый год – никакой не праздник

Cosmopolitan
Шумное наказание: почему приговор зависит от голодного судьи и футбольного матча Шумное наказание: почему приговор зависит от голодного судьи и футбольного матча

Может ли судья ошибаться? За одни преступления могут быть разные приговоры?

Forbes
«Больше хоббитов, хороших и разных». Отрывок из книги об эволюции человека «Больше хоббитов, хороших и разных». Отрывок из книги об эволюции человека

Отрывок из книги «Эволюция человека. Кости, гены и культура»

СНОБ
Самые необычные технологии в лифтах Самые необычные технологии в лифтах

В сфере подъема-спуска граждан и грузов внедряются разные интересные технологии

Популярная механика
Протеиновые коктейли: научные факты «за» и «против» Протеиновые коктейли: научные факты «за» и «против»

Протеиновые коктейли в целом безвредны, но нужны далеко не каждому

РБК
Русская музыка: подкаст о главных именах современной академической сцены Русская музыка: подкаст о главных именах современной академической сцены

Героями первого выпуска подкаста стали Марина Полеухина и Александр Чернышков

СНОБ
Самый дорогой орех: чем полезна макадамия Самый дорогой орех: чем полезна макадамия

Что известно о составе и пользе макадамии?

РБК
Как крупные компании поддерживают современное искусство Как крупные компании поддерживают современное искусство

Застройщик Hutton Development позволяет художникам украшать свои жилые комплексы

GQ
Как маме с новорожденным ребенком позаботиться о себе Как маме с новорожденным ребенком позаботиться о себе

Как найти время для себя родившей маме

Psychologies
«Это не конец света» и другие токсичные фразы, которые кажутся безобидными «Это не конец света» и другие токсичные фразы, которые кажутся безобидными

Возможно, и в вашем лексиконе есть фразы, от которых давно пора отказаться.

Psychologies
Жуткие факты о лучших странах мира Жуткие факты о лучших странах мира

Подумай дважды перед эмиграцией в бездуховную заграницу

Maxim
Зима близко! Очень смешные комиксы про жизнь девушек в холодный сезон Зима близко! Очень смешные комиксы про жизнь девушек в холодный сезон

Комиксы BlooMe точно поднимут тебе настроение в холодный сезон!

Cosmopolitan
Как вывести пятна от пота в домашних условиях Как вывести пятна от пота в домашних условиях

Как удалить пятна пота с одежды светлых и темных оттенков

VOICE
10 самых дорогих украшений, которые сейчас существуют 10 самых дорогих украшений, которые сейчас существуют

Эти бриллианты удивят вас своими размерами, цветами и стоимостью

GQ
Открыть в приложении