Как устроено компьютерное зрение и насколько велики его возможности

N+1Hi-Tech

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Коучинг-лидерство Коучинг-лидерство

Говори меньше, спрашивай больше и навсегда измени свой стиль управления

kiozk originals
Эти 7 вещей нельзя обсуждать на первом свидании, если ты хочешь, чтобы было второе Эти 7 вещей нельзя обсуждать на первом свидании, если ты хочешь, чтобы было второе

На первом свидании лучше не поднимать темы, которые считают небезопасными

VOICE
Спутник каждый день: реалистичны ли новые планы «Роскосмоса» Спутник каждый день: реалистичны ли новые планы «Роскосмоса»

Для производства спутника в день потребуется ломка всех принципов космопрома

Forbes
Вариантов осталось немного: как защитить сбережения в финансовом шторме Вариантов осталось немного: как защитить сбережения в финансовом шторме

Самым надежным способом защиты сбережений сейчас можно считать долговые бумаги

Forbes
Как запустить безопасный режим Windows 10 и чем это может помочь Как запустить безопасный режим Windows 10 и чем это может помочь

Все возможности запуска безопасного режима на Windows 10

CHIP
Защита Балабанова Защита Балабанова

Главный российский режиссер глазами Любови Аркус

Weekend
Япония Япония

Угрожающая страна дешевых яблок, теплых домов и широко мыслящих красивых людей

Правила жизни
Кризис любого возраста: не преодолевать, а прожить Кризис любого возраста: не преодолевать, а прожить

Как не увязнуть в рутине из преодоления и борьбы?

Psychologies
Для чего современному человеку нужно знать историю? Для чего современному человеку нужно знать историю?

Чему и как нас учит история? И чем прямо сегодня нам помогают эти знания?

Psychologies
Тайны космоса: волновую рябь обнаружили на краю Солнечной системы Тайны космоса: волновую рябь обнаружили на краю Солнечной системы

Ученые обнаружили волновые структуры на границе ударной волны и гелиопаузе

ТехИнсайдер
Почему автомобили в жизни не взрываются, как в кино? Почему автомобили в жизни не взрываются, как в кино?

В боевиках автомобили взрывоопасны. Но почему в жизни такое происходит редко?

Maxim
В чём разница между психиатром, психологом и психотерапевтом? В чём разница между психиатром, психологом и психотерапевтом?

Всё ещё считаете, что эти профессии ничем не отличаются?

ТехИнсайдер
В ограбленном погребении знатной сакской женщины нашли бляшки из ископаемых моллюсков В ограбленном погребении знатной сакской женщины нашли бляшки из ископаемых моллюсков

Среди артефактов оказались и предметы из золота

N+1
Пурга на оба наши дома Пурга на оба наши дома

Самый несмешной смешной режиссер Франции и его «странная» война

Weekend
«Что пошло не так?» История матери, которая все делала по правилам «Что пошло не так?» История матери, которая все делала по правилам

Что будет, если воспитать ребенка по всем правилам?

СНОБ
Что нужно знать перед тем, как начать жить вместе: 8 финансовых правил — помните их Что нужно знать перед тем, как начать жить вместе: 8 финансовых правил — помните их

О чем стоит договориться заранее, чтобы уберечь совместный бюджет от форс-мажора

Psychologies
Когда жизнь — трагическая постановка: почему мы так любим драматизировать Когда жизнь — трагическая постановка: почему мы так любим драматизировать

Отрывок из книги Эми Джонсон «Токсичные мысли»

Psychologies
На золотой волне На золотой волне

По сути, это квартира с функционалом загородного дома

SALON-Interior
Боремся со стрессом: что такое медитация и как начать медитировать Боремся со стрессом: что такое медитация и как начать медитировать

Всего 20 минут медитации в день и вы снизите уровень стресса

ТехИнсайдер
4 волшебных правила домашней сушки волос феном, которые все почему-то нарушают 4 волшебных правила домашней сушки волос феном, которые все почему-то нарушают

Мечтаешь дома создавать укладки не хуже, чем в салоне красоты?

VOICE
Стертые имена: женщины, чью славу украли мужчины Стертые имена: женщины, чью славу украли мужчины

Нередко женщины оставались в тени, а их достижения присваивали мужчины

VOICE
«Скажи же мне, разве это можно видеть и не сойти с ума?» «Скажи же мне, разве это можно видеть и не сойти с ума?»

Солдаты «потерянного поколения» о том, что такое война

Weekend
7 фильмов, на съемках которых издевались над массовкой 7 фильмов, на съемках которых издевались над массовкой

Иногда статистам приходится проходить буквально через огонь и воду

Maxim
Лего из молекул для лечения рака: как женщина-химик получила Нобелевскую премию Лего из молекул для лечения рака: как женщина-химик получила Нобелевскую премию

Что такое лего из молекул и как эксперименты женщины-химика стали практикой

Forbes
С плацкартой, но без подушки. Как путешествовали на поездах в царской России С плацкартой, но без подушки. Как путешествовали на поездах в царской России

Что считалось комфортной поездкой на поезде во времена Российской империи?

СНОБ
Русские гены сахарной свеклы Русские гены сахарной свеклы

Без научного подхода завоевать рынок сахарной свеклы невозможно

Наука
Исполнительный директор Еврейского музея — о толерантности как искусстве Исполнительный директор Еврейского музея — о толерантности как искусстве

Для серьезной институции музейная лавка и кафе значат не меньше, чем фонды

РБК
Почему в XVII веке девушек на портретах писали с обнаженной грудью? Почему в XVII веке девушек на портретах писали с обнаженной грудью?

Что в XVII веке значила обнаженная женская грудь?

Maxim
Свободная ниша: что не так со складами light industrial Свободная ниша: что не так со складами light industrial

Почему девелоперы не строят объекты востребованного формата light industrial

Forbes
Хагрид, Джон Китинг и другие: редакция Psychologies — о лучших экранных учителях Хагрид, Джон Китинг и другие: редакция Psychologies — о лучших экранных учителях

Редакторы Psychologies рассказывают о своих любимых экранных педагогах

Psychologies
Открыть в приложении