Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Генетики выявили старейшего известного домашнего кота Китая Генетики выявили старейшего известного домашнего кота Китая

Самая ранняя домашняя кошка жила в VIII или IX веках нашей эры

N+1
«Сом»: как русская подлодка затонула в Швеции «Сом»: как русская подлодка затонула в Швеции

На глубине действительно лежали останки российской подлодки «СОМЪ»

Популярная механика
Эволюция, создавая жабры рыб, по той же программе создала уши человека Эволюция, создавая жабры рыб, по той же программе создала уши человека

Формирование ушей у млекопитающих следует той же программе, что и у жабр рыб

ТехИнсайдер
Как IТ-директор NASA наводит порядок в агентстве с помощью квантовых компьютеров Как IТ-директор NASA наводит порядок в агентстве с помощью квантовых компьютеров

Как инженеры NASA планируют использовать квантовые компьютеры

Forbes
Кто особенно склонен к изменам: 3 ключевые психологические черты, подталкивающие к неверности Кто особенно склонен к изменам: 3 ключевые психологические черты, подталкивающие к неверности

Почему некоторые люди изменяют, а другие — нет?

Psychologies
Какие страны начнут третью мировую войну: 6 самых возможных сценариев Какие страны начнут третью мировую войну: 6 самых возможных сценариев

Любой, даже самый незначительный конфликт может перерасти в третью мировую войну

Maxim
Как продавцу обезопасить свой бренд при сотрудничестве с маркетплейсом Как продавцу обезопасить свой бренд при сотрудничестве с маркетплейсом

Плюсы и минусы работы с маркетплейсами для продавцов

Inc.
Как вывести пятна от пота в домашних условиях Как вывести пятна от пота в домашних условиях

Как удалить пятна пота с одежды светлых и темных оттенков

VOICE
Изменение океанических течений назвали основной причиной ордовикского вымирания Изменение океанических течений назвали основной причиной ордовикского вымирания

Ученые предложили новую интерпретацию первого из крупных массовых вымираний

N+1
Электрошок: прошлое и настоящее Электрошок: прошлое и настоящее

Так ли страшна процедура электрошока на самом деле?

Psychologies
Спектроскопия помогла недеструктивно измерить красноту мякоти яблок Спектроскопия помогла недеструктивно измерить красноту мякоти яблок

Спектроскопия поможет повысить эффективность их сортировки

N+1
Три лучших в мире фильма про автомобили, которые ты, скорее всего, не видел Три лучших в мире фильма про автомобили, которые ты, скорее всего, не видел

Современные фильмы про автомобили — как высокобюджетное порно

Maxim
Уйти и не сдаваться Уйти и не сдаваться

От чего и куда бежит Уэс Андерсон

Weekend
40 тонн пива и 20 тонн лимонада в месяц: основатель пивоварни из Челябинска рассказывает о своём производстве 40 тонн пива и 20 тонн лимонада в месяц: основатель пивоварни из Челябинска рассказывает о своём производстве

Антон Балыклов открыл пивоварню в 2014 году, сейчас у него два бренда напитков

VC.RU
Энергия для японского бизнеса Энергия для японского бизнеса

Наиболее перспективно сотрудничество Японии и РФ в сфере энергетики

Эксперт
Lovv66 комментирует свой новый альбом «БЭСТ ФРЭНДС» Lovv66 комментирует свой новый альбом «БЭСТ ФРЭНДС»

Самая основная метафора альбома «БЭСТ ФРЭНДС»

GQ
Вы задумывались о том, что доступ к общественным туалетам — благо, недоступное половине населения Земли? Вопрос дня Вы задумывались о том, что доступ к общественным туалетам — благо, недоступное половине населения Земли? Вопрос дня

Кого волнуют туалеты? Каждого второго жителя Земли, у которого нет к ним доступа

СНОБ
5 ошибок, за которые стоит себя простить 5 ошибок, за которые стоит себя простить

Важно признать свои ошибки и простить себя за них

Psychologies
Эксперимент COSINE-100 не увидел обнаруженной DAMA/LIBRE темной материи Эксперимент COSINE-100 не увидел обнаруженной DAMA/LIBRE темной материи

Источник сигнала в детекторе DAMA/LIBRE остается неизвестным

N+1
5 самых дорогих вещей из знаменитых научно-фантастических фильмов и сериалов 5 самых дорогих вещей из знаменитых научно-фантастических фильмов и сериалов

Самые дорогие кинематографические реликвии

Популярная механика
Скорпион или Дева: самый милый знак зодиака среди женщин Скорпион или Дева: самый милый знак зодиака среди женщин

Какой знак зодиака самый милый у женщин

Cosmopolitan
«Нечего надеть»: почему мы так часто недовольны своей одеждой «Нечего надеть»: почему мы так часто недовольны своей одеждой

Почему нам кажется, что надеть нечего, если каждая вешалка занята?

Psychologies
10 захватывающих фильмов и сериалов о  женщинах, перевернувших мир 10 захватывающих фильмов и сериалов о  женщинах, перевернувших мир

Фильмы и сериалы, которые лучше всего показывают женщин-лидеров

Cosmopolitan
Непутевые заметки: Уэс Андерсон от А до Я. Письма, сладости, Хичкок Непутевые заметки: Уэс Андерсон от А до Я. Письма, сладости, Хичкок

Путеводитель по мелочам из фильмов Уэса Андерсона

Esquire
10 самых необычных технологий современности 10 самых необычных технологий современности

Реальные технологии, способные удивить даже самого прихотливого критика

Популярная механика
Не просто упаковка для еды, но и предмет искусства: история коробок для пиццы, рынок которых оценивается в $2 млрд Не просто упаковка для еды, но и предмет искусства: история коробок для пиццы, рынок которых оценивается в $2 млрд

Как появились коробки для пиццы из гофрокартона

VC.RU
Деликатес из Африки: в чем польза кускуса и как его готовить Деликатес из Африки: в чем польза кускуса и как его готовить

Разбираемся, что такое кускус и чем он полезен для здоровья

РБК
«Советские хакеры». История отношений радиолюбителей с властями СССР «Советские хакеры». История отношений радиолюбителей с властями СССР

Книга о проектах и социокультурных явлениях, предшествовавших появлению рунета

СНОБ
Nissan: адаптация технологий к российским условиям Nissan: адаптация технологий к российским условиям

Nissan адаптирует свои технологии под специфику российского рынка

Эксперт
Поздравляю, коллеги! Поздравляю, коллеги!

Корпоратив – это отличная возможность весело провести время и… натворить дел

Cosmopolitan
Открыть в приложении