Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Масштабы загрязнения вод суши полифторалкильными соединениями назвали недооцененными Масштабы загрязнения вод суши полифторалкильными соединениями назвали недооцененными

Предельная допустимая концентрация загрязнения превышена в половине проб воды

N+1
Искусство жить красиво Искусство жить красиво

История у гостиницы «Метрополь» всегда была непростой

Караван историй
ПЭТ/МРТ помогла избежать ненужных биопсий при диагностике рака простаты ПЭТ/МРТ помогла избежать ненужных биопсий при диагностике рака простаты

ПЭТ/МРТ позволяет дифференцировать случаи подозрения на рак простаты

N+1
Как Чарльз Мэнсон повлиял на современную культуру: фильмы, сериалы, музыка о лидере смертоносного культа Как Чарльз Мэнсон повлиял на современную культуру: фильмы, сериалы, музыка о лидере смертоносного культа

Как Мэнсон повлиял на то, каким мы видим сегодняшний мир

Maxim
Как перестать тратить и начать зарабатывать: 3 совета Михаила Лабковского Как перестать тратить и начать зарабатывать: 3 совета Михаила Лабковского

Деньги — цель или средство? Источник удовольствия или тяжкое бремя?

Psychologies
Трехколесная мануфактура Трехколесная мануфактура

Ирбитский мотоциклетный завод сумел вывести свой бренд на мировой уровень

Эксперт
Разочаровали: звездные селфи без макияжа, которые никому не понравились Разочаровали: звездные селфи без макияжа, которые никому не понравились

Селфи звезд без макияжа, которые разочаровали подписчиков

Cosmopolitan
5 мест, куда можно с пользой сдать старые вещи 5 мест, куда можно с пользой сдать старые вещи

Куда сдать свою старую одежду с пользой для себя и других людей

GQ
8 заикающихся знаменитостей 8 заикающихся знаменитостей

Узнай, как эти знаменитости справились с нарушениями речи и добились успеха

Maxim
Неравный брак: звездные пары с огромной разницей в возрасте Неравный брак: звездные пары с огромной разницей в возрасте

Звездные пары с большой разницей в возрасте

VOICE
Скотленд-Ярд Скотленд-Ярд

Исторический дом в Лондоне с шотландскими и русскими мотивами в интерьере

AD
Почему измена не повод для развода Почему измена не повод для развода

Почему измена помогает обоим партнерам стать лучше?

Psychologies
Изменение океанических течений назвали основной причиной ордовикского вымирания Изменение океанических течений назвали основной причиной ордовикского вымирания

Ученые предложили новую интерпретацию первого из крупных массовых вымираний

N+1
В 1951 году власти Дании забрали детей у коренных жителей, чтобы воспитать из них «гренландскую элиту». Дети выросли и требуют компенсации В 1951 году власти Дании забрали детей у коренных жителей, чтобы воспитать из них «гренландскую элиту». Дети выросли и требуют компенсации

Когда нужного количества не набралось детей просто забрали из семей инуитов

Esquire
Кэрри-Энн Мосс. В тени Тринити Кэрри-Энн Мосс. В тени Тринити

Она не раз говорила, что с «Матрицей» покончено, и вот — на тебе!

Караван историй
Наши все дома Наши все дома

Как устроить в обычной квартире новогоднюю вечеринку, выгнав всех из смартфонов?

Cosmopolitan
Sorry, papasha: какой получилась Call of Duty: Vanguard Sorry, papasha: какой получилась Call of Duty: Vanguard

Почему CoD превратилась в Виктора Пелевина

Esquire
6 способов правильно высушить обувь осенью и зимой 6 способов правильно высушить обувь осенью и зимой

Правильные способы привести обувь в порядок в период слякоти

Cosmopolitan
Как «запрограммировать» себя на легкую беременность и роды Как «запрограммировать» себя на легкую беременность и роды

Как «настроить» мозг на идеальную беременность?

Psychologies
Гангстерский шик: как правильно носить культовую шляпу-федору борсалино Гангстерский шик: как правильно носить культовую шляпу-федору борсалино

Как насчет высококачественной и элегантной шляпы, прошедшей проверку временем?

Playboy
«Чудо-пластыри»: эксперт рассказал, как тейпы подтягивают лицо и тело «Чудо-пластыри»: эксперт рассказал, как тейпы подтягивают лицо и тело

Что нам известно о тейпах для лица и тела?

Cosmopolitan
Земля – Орбита. Как отправить свое имя в космос? Земля – Орбита. Как отправить свое имя в космос?

Пластина — 10 на 15 мм, а имен — 22 772. Как всё уместить, Карл?

Популярная механика
Жуткие факты о лучших странах мира Жуткие факты о лучших странах мира

Подумай дважды перед эмиграцией в бездуховную заграницу

Maxim
Как «рай для удаленщиков и стартаперов» стал проблемой для жителей Гондураса Как «рай для удаленщиков и стартаперов» стал проблемой для жителей Гондураса

Частный город Проспера столкнулся с протестами местных жителей

Forbes
Видеодрайвер перестал отвечать и был восстановлен: как исправить эту ошибку Видеодрайвер перестал отвечать и был восстановлен: как исправить эту ошибку

Почему возникает ошибка «Видеодрайвер перестал отвечать и был восстановлен»

CHIP
Как модель для сборки Как модель для сборки

Шварцвальд: времена меняются, но не все в мире спешит меняться вместе с ними

Вокруг света
Тезис фронтира Тезис фронтира

Спустя полтора века США по-прежнему на переднем рубеже фронтира

Вокруг света
Болельщик, управляющий командой: как звезда баскетбола стала венчурным инвестором Болельщик, управляющий командой: как звезда баскетбола стала венчурным инвестором

Рене Монтгомери завершила спортивную карьеру и переквалифицировалась в инвестора

Forbes
Лучшие квесты на ПК: топ-5 легендарных игр Лучшие квесты на ПК: топ-5 легендарных игр

5 игр-квестов, прохождение которых надолго отпечатается у вас в голове

CHIP
Режиссер года: Кира Коваленко Режиссер года: Кира Коваленко

Кинокритик объясняет, почему фильм «Разжимая кулаки» вызвал такой ажиотаж

Glamour
Открыть в приложении