Зачем нужно компьютерное зрение и какие задачи оно решает в разных сферах

Наука и техникаHi-Tech

Компьютерное зрение: когда роботы перестали тыкать пальцем в небо?

Степан Бурмистров

Представьте, что компьютер способен «смотреть» на мир почти как человек. Еще недавно это звучало как фантастика, а сегодня стало реальностью. Мы сталкиваемся с этим ежедневно: смартфон узнает лицо владельца, поиск в Интернете может по фотографии определить породу щенка, а современные автомобили с камерами видят пешеходов и дорожные знаки. Все это – проявления технологий компьютерного зрения. Компьютерное зрение (CV, от англ. computer vision) – это область искусственного интеллекта, позволяющая машинам анализировать изображения и видео и «понимать» их содержание. Давайте разберемся, зачем нужно компьютерное зрение, какие задачи оно решает в разных сферах и как оно работает под капотом.

Зачем нужно компьютерное зрение?

Наш мир наполнен визуальной информацией. Камеры установлены повсюду – от смартфонов и ноутбуков до уличных видеосистем и спутников. Объем визуальных данных растет лавинообразно, и обрабатывать их вручную становится невозможно.

Компьютерное зрение необходимо, чтобы автоматизировать и ускорить работу с визуальной информацией там, где человеку не хватает времени, возможностей или точности.

Алгоритмы CV способны моментально выделять важные детали на изображениях, замечать тонкие особенности и анализировать миллионы снимков куда быстрее, чем это сделал бы человек. В результате компьютеры со «зрением» помогают людям принимать решения более эффективно – от постановки диагноза по рентгеновскому снимку до управления беспилотным автомобилем.

Компьютерное зрение как научная дисциплина берет свое начало примерно с 1960-х годов. Тогда ученые только начинали экспериментировать с алгоритмами, которые могли бы автоматически интерпретировать изображения. Первыми успехами в этой области были примитивные программы, которые распознавали простые формы, контуры объектов и базовые паттерны. Настоящий прорыв случился после 2010-х годов с распространением глубокого обучения (deep learning) и появления архитектур сверточных нейронных сетей (Convolutional Neural Networks, CNN). Задачи, которые до этого казались почти нерешаемыми (например, точное распознавание десятков и сотен различных объектов на фотографиях), начали решаться с высокой точностью.

Области применения компьютерного зрения

Компьютерное зрение уже работает во многих сферах нашей жизни. Рассмотрим несколько ярких примеров, как компьютерное зрение помогает людям – от здравоохранения до сельского хозяйства.

Медицина и здравоохранение

Одной из самых полезных областей применения CV стала медицина. Алгоритмы компьютерного зрения помогают врачам анализировать медицинские изображения: рентгеновские снимки, КТ, МРТ, ультразвуковые сканы. Например, система может распознать опухоль на рентгене легких. Современные модели на основе нейросетей уже достигают точности выявления рака, сопоставимой с уровнем опытного рентгенолога и даже выше. При этом лучше всего врач и алгоритм работают в паре: исследование показало, что радиологи точнее обнаруживают опухоли с помощью ИИ, чем без него, и на это не тратится дополнительное время. Компьютерное зрение способно уловить в снимках такие слабовыраженные признаки заболеваний, которые человеческий глаз может просто не заметить.

Транспорт и автомобили

Автомобили без водителя невозможно представить без компьютерного зрения. Бортовые камеры беспилотника являются «глазами», которые непрестанно следят за дорогой. Алгоритмы в реальном времени распознают разметку, различают цвета сигналов светофора, читают дорожные знаки и, конечно, обнаруживают препятствия – других машин, велосипедистов, пешеходов.

Благодаря этому автомобиль может принимать решения о торможении или повороте не хуже (а в некоторых ситуациях и лучше) человека. Но и обычные водители уже пользуются плодами CV: система экстренного торможения сама заметит внезапно выбежавшего пешехода, а камера с распознаванием дорожных знаков подскажет, что сейчас ограничение скорости 50 км/ч.

Компьютерное зрение применяется не только внутри машин, но и в инфраструктуре. Умные дорожные камеры анализируют потоки транспорта на перекрестках и магистралях. Специальные алгоритмы считают количество автомобилей, определяют их скорость, фиксируют нарушителей. На основе этих данных городские службы могут в динамическом режиме регулировать светофоры, чтобы уменьшить пробки и повысить безопасность на дорогах.

Автоматические системы оплаты проезда (например, на платных трассах) с помощью CV сканируют номерные знаки машин и взимают плату без остановки транспорта – все происходит мгновенно, «на лету». Таким образом, транспортная отрасль становится более интеллектуальной благодаря зрению машин.

Сельское хозяйство

Даже в такой традиционной сфере, как сельское хозяйство, компьютерное зрение произвело маленькую революцию. Умные фермы используют камеры и дроны для наблюдения за посевами и скотом. С высоты птичьего полета дрон, оснащенный CV-системой, сканирует поля и оценивает состояние растений. Алгоритмы по цвету и структуре посевов могут выявить участки, где растения испытывают стресс, например, из-за нехватки влаги, вредителей или болезней. Фермер получает точную «карту» проблемных зон и может точечно полить или обработать нужные сегменты поля, вместо того чтобы действовать вслепую. Это экономит воду, удобрения и пестициды, повышает урожай и бережет почву.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Скелетные мышцы самолета – система управления Скелетные мышцы самолета – система управления

Зачем самолетам демпферы, гидроусилители, закрылки и предкрылки?

Наука и техника
Почему нам хочется есть: как нейрофизиология объясняет переедание и импульсивные перекусы Почему нам хочется есть: как нейрофизиология объясняет переедание и импульсивные перекусы

Каков ключ к решению проблемы переедания и импульсивных перекусов?

ТехИнсайдер
Что у Intel инсайд? Что у Intel инсайд?

В надежде спасти Intel Трамп покупает пакет компании. Кажется, это жест отчаяния

Монокль
Андрей Могучий Андрей Могучий

Режиссер главного спектакля десятилетия, Андрей Могучий

Собака.ru
Братские портреты Братские портреты

Братские портреты навсегда остались бы неизвестными, если бы не парное сочетание

Дилетант
Усадьбы Москвы Усадьбы Москвы

Русские имения хранят множество историй, повлиявших на судьбу страны

Вокруг света
Письмо гонителю генетики Письмо гонителю генетики

Это письмо можно считать одним из живых документов «оттепели»

Дилетант
Петрикирхе: почему молчат колокола Петрикирхе: почему молчат колокола

Петрикирхе напоминает айсберг, немалая часть которого скрыта в катакомбах

Дилетант
Наши на Западе: как Америка влюбилась в венгерские «Икарусы» Наши на Западе: как Америка влюбилась в венгерские «Икарусы»

Ikarus – история автобусов, которые лидировали одновременно и в СССР, и в США

ТехИнсайдер
Архитектор — это сценарист жизни Архитектор — это сценарист жизни

Можно ли совместить агрессивную урбанизацию с комфортом городской среды?

Монокль
Финкульт-привет Финкульт-привет

Низкая финграмотность — вызов не только для клиентов, но и для банков

Ведомости
«Дневник невидимки»: история необычной старшеклассницы с обычными проблемами «Дневник невидимки»: история необычной старшеклассницы с обычными проблемами

Отрывок из «Дневника невидимки» — романа о том, как оставаться собой

Forbes
Клан Сгарсгардов: что нужно знать об одной из самых известных актерских династий Клан Сгарсгардов: что нужно знать об одной из самых известных актерских династий

С чего, а вернее, с кого началась династия Сгарсгардов

Правила жизни
Бросок «Кобры» Бросок «Кобры»

История американца Кэрролла Шелби, который на «Форде» обыграл «Феррари»

Ведомости
Выход за рамки Выход за рамки

Изысканная интерпретация классики с элементами ар-деко и минимализма

SALON-Interior
Удивительный трубкозуб Удивительный трубкозуб

Ожившей химерой с прошедших веков трубкозуба, шутя, обзывают

Знание – сила
Пища для глаз: что такое визуальный голод и как фотографии еды воздействуют на мозг Пища для глаз: что такое визуальный голод и как фотографии еды воздействуют на мозг

Как наш мозг реагирует на виртуальное питание

Forbes
Почему мы тянем время, даже когда знаем, что надо уйти? О токсичных отношениях и ловушках сознания Почему мы тянем время, даже когда знаем, что надо уйти? О токсичных отношениях и ловушках сознания

Почему же так сложно выйти из замкнутого круга токсичных отношений?

VOICE
Земля Султана Земля Султана

Путешествие с певцом Султаном Лагучевым по его родине — Карачаево-Черкесии

ЖАРА Magazine
Ольга Таратынова Ольга Таратынова

Как Ольга Таратынова возвращает памятники архитектуры из послевоенных руин

Собака.ru
Сменила балет на «Игрушки»: как Агния Барто стала одной из главных детских поэтесс Сменила балет на «Игрушки»: как Агния Барто стала одной из главных детских поэтесс

История Агнии Барто, одной из главных детских поэтесс в России

Forbes
Всегда время фото и десертов Всегда время фото и десертов

Бизнес-хроника старейших предприятий Санкт-Петербурга

Weekend
Криптозавод зовет Криптозавод зовет

Как устроен первый в России инвестфонд для промышленного майнинга

Ведомости
Кризис нэпа Кризис нэпа

100 лет тому назад страна жила в атмосфере «правого коммунизма»

Дилетант
Мир экзопланет: как на орбитах у других солнц были открыты «непланеты» Мир экзопланет: как на орбитах у других солнц были открыты «непланеты»

О том, как обнаруживаются экзопланеты и какими они бывают

Наука и техника
Банки из доставки Банки из доставки

Маркетплейсы бросают вызов традиционным кредитным организациям

Деньги
Попасть в настоящее кино Попасть в настоящее кино

Новый кинопарк «Москино» — центр съемок и место притяжения туристов

Отдых в России
Анна Якунина: «Я кайфую от своего возраста» Анна Якунина: «Я кайфую от своего возраста»

Как Анна Якунина полюбила морщины и научилась принимать свой возраст

Караван историй
CAR-T-терапия поставила на ноги двух пациентов с тяжелой аутоиммунной нейропатией CAR-T-терапия поставила на ноги двух пациентов с тяжелой аутоиммунной нейропатией

Частично обездвиженные заболеванием люди начали ходить с помощью CAR-T-терапии

N+1
Фильму «Бэтмен. Начало» — 20. Как Нолан перепридумал комикс, сделал экранную супергероику серьезной Фильму «Бэтмен. Начало» — 20. Как Нолан перепридумал комикс, сделал экранную супергероику серьезной

«Бэтмен. Начало»: масштаб фильма и его влияние на массовую культуру

Правила жизни
Открыть в приложении