Алгоритмы распознавания лиц понемногу превращаются во всевидящее око

Популярная механикаHi-Tech

На лице написано

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Текст: Александр Ершов, Роман Фишман

0:00 /
786.027

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

Алгоритмы распознают образы

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ»). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Шаг 1. Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Моментальная угроза Моментальная угроза

Межконтинентальные баллистические ракеты

Популярная механика
Subaru XV Subaru XV

Сдобрен ли крепкий коктейль субариста банальным качеством

АвтоМир
Полет бумеранга Полет бумеранга

Гибрид самолета, вертолета, конвертоплана и автожира

Популярная механика
Ирина Антонова Ирина Антонова

Правила жизни искусствоведа Ирины Антоновой

Esquire
Лыжники с небес Лыжники с небес

Самолеты на лыжах, пожалуй, еще большая экзотика, чем гидросамолеты

Популярная механика
Со всей возможной любовью Со всей возможной любовью

Александр Цыпкин о письмах фанаток и планах на будущее

Glamour
Люди на пределе Люди на пределе

Возможности нашего собственного, среднестатистического тела

Вокруг света
Между нами тает лед Между нами тает лед

Евгения Медведева завоевала награды на всех российских и мировых первенствах

Glamour
Летающий автомобиль Атаманова Летающий автомобиль Атаманова

Пятиместный автомобиль, первый полет которого планируется уже в сентябре

Популярная механика
Nissan Juke – Renault Kaptur Nissan Juke – Renault Kaptur

Один из бестселлеров Renault и вернувшийся на российский рынок кроссовер Nissan

АвтоМир
Что делать, если бывшая продолжает тебе писать после расставания Что делать, если бывшая продолжает тебе писать после расставания

Почему тебе пишет бывшая и что делать в этой непростой ситуации

Playboy
Давай поговорим! Давай поговорим!

Объясни мастеру салона, что ты хочешь

Cosmopolitan
Имею скафандр, готов путешествовать Имею скафандр, готов путешествовать

Скафандров для других планет у человечества нет даже в перспективе

Популярная механика
Роберт Редфорд Роберт Редфорд

Как стать самым стильным мужчиной в Голливуде, не увлекаясь модой

Esquire
12 лучших авто года по версии GQ 12 лучших авто года по версии GQ

Дюжина лучших автомобилей года

GQ
Разговор с душой Разговор с душой

Что такое практика аффирмаций и как научиться договариваться с самим собой

Yoga Journal
Сельская аристократия Сельская аристократия

Оба участника не растеряли качеств, которые отличали премиальные универсалы

Quattroruote
Решение семейных конфликтов: методика «двух шагов» Решение семейных конфликтов: методика «двух шагов»

Что делать, когда в семье конфликт, кажущийся неразрешимым

СНОБ
Учиться радости у детей солнца Учиться радости у детей солнца

Как в службе «Милосердие» различают чудо и просто хорошую работу

Русский репортер
5 мужских заблуждений о йоге 5 мужских заблуждений о йоге

Глядя, как вы расстилаете коврик и «приветствуете солнце», ваш мужчина снисходительно посмеивается? Он уверен, что йога – «девочковое» занятие, а вот «тягать железо в зале» – занятие для настоящих мужчин? Теперь вы знаете, что ему ответить. Пять популярных среди мужчин мифов развенчивает инструктор по йоге Лилия Карцева.

Psychologies
Спорим, что вы никогда не ели сациви? Спорим, что вы никогда не ели сациви?

Почему грузинская еда — это не то, что вы думали

СНОБ
Письма счастья Письма счастья

Письменные медитации

Yoga Journal
Почтальоны c крыльями, копытами и лапами Почтальоны c крыльями, копытами и лапами

Для передачи сообщений и грузов люди с древнейших времен использовали животных

Дилетант
В погоне за брендом: недетские страсти В погоне за брендом: недетские страсти

Ребенок копирует любимого героя из известного мультика. Насколько это опасно?

Лиза
«Я прыгнул с восьмого этажа и выжил». Монологи несостоявшихся самоубийц «Я прыгнул с восьмого этажа и выжил». Монологи несостоявшихся самоубийц

Россия — на одном из первых мест по числу детских и подростковых самоубийств

СНОБ
Павленский не зажег Павленский не зажег

Зачем поджигать здание Банка Франции на площади Бастилии?

СНОБ
Мать в два хода Мать в два хода

Ученым удалось отредактировать геном человека

Vogue
Повернуть время вспять Повернуть время вспять

Морщинки – история нашей жизни. Но обязательно ли рассказывать ее окружающим? Любые признаки старения, будь то морщины, пигментация или дряблость кожи, говорят о пренебрежении. Как к окружающим, так и к достижениям науки. А значит, о нежелании работать над собой. Когда же нужно начинать бороться за свое лицо?

Psychologies
Че вам надо Че вам надо

Стивен Смит отправляется в Аргентину и находит родного брата Че Гевары

Esquire
Куда исчезла материя Куда исчезла материя

Астрофизикам вот уже сто лет не хватает материи во Вселенной

СНОБ
Открыть в приложении