Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

К концу века диких северных оленей станет на 27-58 процентов меньше К концу века диких северных оленей станет на 27-58 процентов меньше

Как антропогенное изменение климата влияет на численность северных оленей

N+1
Печальный замок на Тибре Печальный замок на Тибре

Один из главных памятников Вечного города

Дилетант
Что случилось с пауками, отправленными в космос в 1973 году — и как это помогло науке Что случилось с пауками, отправленными в космос в 1973 году — и как это помогло науке

Пауки все еще плетут паутину в условиях микрогравитации?

Inc.
Дрон с электронным хоботом унюхал запахи в труднодоступных местах Дрон с электронным хоботом унюхал запахи в труднодоступных местах

Электронный нос с десятиметровой трубкой позволит анализировать запах

N+1
Пластыри от прыщей: как они устроены и действительно ли помогают избавиться от высыпаний Пластыри от прыщей: как они устроены и действительно ли помогают избавиться от высыпаний

Работают ли патчи от прыщей или это просто маркетинг?

ТехИнсайдер
Детей в Древнем Перу отлучили от груди на третьем году жизни Детей в Древнем Перу отлучили от груди на третьем году жизни

Биоархеологи исследовали останки 48 детей, похороненных около 2500 лет назад

N+1
Сама себе режиссер Сама себе режиссер

Карина Нигай – о том, как блогеры поменяли правила fashion-индустрии

Harper's Bazaar
Как устроена машина для обработки самолётов антиобледенителем Как устроена машина для обработки самолётов антиобледенителем

Как управляют машинами, которые обрабатывают крылья авиалайнеров

Популярная механика
Деликатес из Африки: в чем польза кускуса и как его готовить Деликатес из Африки: в чем польза кускуса и как его готовить

Разбираемся, что такое кускус и чем он полезен для здоровья

РБК
10 знаменитых изобретений, пришедших из неожиданных мест 10 знаменитых изобретений, пришедших из неожиданных мест

В какой точке земного шара был открыт кинематограф, «флешки» и туалетная бумага?

Популярная механика
Задать жару Задать жару

Хого – горячее блюдо, которое подают на праздники для большой компании

Вокруг света
Лодырь, серый кардинал, манипулятор: как Оксимирон стал главным антагонистом русского рэпа и почему им остается Лодырь, серый кардинал, манипулятор: как Оксимирон стал главным антагонистом русского рэпа и почему им остается

О роли Оксимирона и значении его фигуры и творчества

Esquire
Периодическое падение яркости двойной звезды объяснили плотным облаком пыли Периодическое падение яркости двойной звезды объяснили плотным облаком пыли

Почему некоторые звезды могут тускнеть?

N+1
Истребители танков на Донбассе. Из Америки — с любовью Истребители танков на Донбассе. Из Америки — с любовью

Так ли страшен противотанковый ракетный комплекс FGM-148 Javelin?

Maxim
Вырывать ресницы и есть перед ТВ: вредные привычки знаменитостей Вырывать ресницы и есть перед ТВ: вредные привычки знаменитостей

Какие привычки можно считать странностями, а какие — красными флажками?

РБК
Секс или самовыражение? Что такое кинки-пати — разбираемся подробно Секс или самовыражение? Что такое кинки-пати — разбираемся подробно

Kinky party — что это такое, как и где происходит?

Cosmopolitan
Белковое окрашивание волос: как получить стойкий и мягкий эффект от краски Белковое окрашивание волос: как получить стойкий и мягкий эффект от краски

Способ сделать процедуру окрашивания щадящей и закрепить оттенок волос

Cosmopolitan
Свобода власти: почему за 30 лет в России так и не появилось политической конкуренции Свобода власти: почему за 30 лет в России так и не появилось политической конкуренции

Почему в стране не возникло движений, способных оказать давление на власть

Forbes
Настасья Самбурская: «Мечтаю сыграть барби» Настасья Самбурская: «Мечтаю сыграть барби»

Настасья Самбурская — о роли мечты, кино и музыке

Лиза
Алкогений: Анри де Тулуз-Лотрек Алкогений: Анри де Тулуз-Лотрек

Анри де Тулуз-Лотрек — один из ярких художников своего времени и певец порока!

Maxim
20 навыков продуктивного лентяя 20 навыков продуктивного лентяя

Если нельзя избежать работы, остается научиться делать ее быстро и хорошо!

Maxim
«Мы забираем документы»: когда пора менять школу? «Мы забираем документы»: когда пора менять школу?

Иногда родителям приходится задуматься: а комфортно ли ребенку на учебе?

Psychologies
Очень важные дела! 5 вопросов о месячных, которые ты боялась задать Очень важные дела! 5 вопросов о месячных, которые ты боялась задать

Волнующие вопросы о критических днях

Cosmopolitan
Трудности восприятия: что такое дислексия и как ее обнаружить Трудности восприятия: что такое дислексия и как ее обнаружить

О дислексии многие узнают, когда детство давно позади

РБК
10 самых опустошительных засух в истории 10 самых опустошительных засух в истории

Какие засухи в истории человечества считались наиболее ужасными

Популярная механика
5 странных поводов для ареста в Японии 5 странных поводов для ареста в Японии

В России на эти преступления не обратили бы внимания. Но не в Японии

Лиза
Гибель в 29 лет: ужасная судьба лучшей конькобежки СССР Инги Артамоновой Гибель в 29 лет: ужасная судьба лучшей конькобежки СССР Инги Артамоновой

Инга Артамонова была одной из самых красивых советских спортсменок СССР

Cosmopolitan
Как сформулировать запрос к психологу Как сформулировать запрос к психологу

Первый шаг в преодолении трудностей — формулировка психологического запроса

Psychologies
Сэр Энтони Блант, хранитель и агент Сэр Энтони Блант, хранитель и агент

Агент и обладатель рыцарского титула Энтони Блант

Дилетант
Как посмотреть температуру процессора: тестируем CPU и боремся с перегревом Как посмотреть температуру процессора: тестируем CPU и боремся с перегревом

Как контролировать и поддерживать нормальную температуру процессора

CHIP
Открыть в приложении