Зачем нужно компьютерное зрение и какие задачи оно решает в разных сферах

Наука и техникаHi-Tech

Компьютерное зрение: когда роботы перестали тыкать пальцем в небо?

Степан Бурмистров

Представьте, что компьютер способен «смотреть» на мир почти как человек. Еще недавно это звучало как фантастика, а сегодня стало реальностью. Мы сталкиваемся с этим ежедневно: смартфон узнает лицо владельца, поиск в Интернете может по фотографии определить породу щенка, а современные автомобили с камерами видят пешеходов и дорожные знаки. Все это – проявления технологий компьютерного зрения. Компьютерное зрение (CV, от англ. computer vision) – это область искусственного интеллекта, позволяющая машинам анализировать изображения и видео и «понимать» их содержание. Давайте разберемся, зачем нужно компьютерное зрение, какие задачи оно решает в разных сферах и как оно работает под капотом.

Зачем нужно компьютерное зрение?

Наш мир наполнен визуальной информацией. Камеры установлены повсюду – от смартфонов и ноутбуков до уличных видеосистем и спутников. Объем визуальных данных растет лавинообразно, и обрабатывать их вручную становится невозможно.

Компьютерное зрение необходимо, чтобы автоматизировать и ускорить работу с визуальной информацией там, где человеку не хватает времени, возможностей или точности.

Алгоритмы CV способны моментально выделять важные детали на изображениях, замечать тонкие особенности и анализировать миллионы снимков куда быстрее, чем это сделал бы человек. В результате компьютеры со «зрением» помогают людям принимать решения более эффективно – от постановки диагноза по рентгеновскому снимку до управления беспилотным автомобилем.

Компьютерное зрение как научная дисциплина берет свое начало примерно с 1960-х годов. Тогда ученые только начинали экспериментировать с алгоритмами, которые могли бы автоматически интерпретировать изображения. Первыми успехами в этой области были примитивные программы, которые распознавали простые формы, контуры объектов и базовые паттерны. Настоящий прорыв случился после 2010-х годов с распространением глубокого обучения (deep learning) и появления архитектур сверточных нейронных сетей (Convolutional Neural Networks, CNN). Задачи, которые до этого казались почти нерешаемыми (например, точное распознавание десятков и сотен различных объектов на фотографиях), начали решаться с высокой точностью.

Области применения компьютерного зрения

Компьютерное зрение уже работает во многих сферах нашей жизни. Рассмотрим несколько ярких примеров, как компьютерное зрение помогает людям – от здравоохранения до сельского хозяйства.

Медицина и здравоохранение

Одной из самых полезных областей применения CV стала медицина. Алгоритмы компьютерного зрения помогают врачам анализировать медицинские изображения: рентгеновские снимки, КТ, МРТ, ультразвуковые сканы. Например, система может распознать опухоль на рентгене легких. Современные модели на основе нейросетей уже достигают точности выявления рака, сопоставимой с уровнем опытного рентгенолога и даже выше. При этом лучше всего врач и алгоритм работают в паре: исследование показало, что радиологи точнее обнаруживают опухоли с помощью ИИ, чем без него, и на это не тратится дополнительное время. Компьютерное зрение способно уловить в снимках такие слабовыраженные признаки заболеваний, которые человеческий глаз может просто не заметить.

Транспорт и автомобили

Автомобили без водителя невозможно представить без компьютерного зрения. Бортовые камеры беспилотника являются «глазами», которые непрестанно следят за дорогой. Алгоритмы в реальном времени распознают разметку, различают цвета сигналов светофора, читают дорожные знаки и, конечно, обнаруживают препятствия – других машин, велосипедистов, пешеходов.

Благодаря этому автомобиль может принимать решения о торможении или повороте не хуже (а в некоторых ситуациях и лучше) человека. Но и обычные водители уже пользуются плодами CV: система экстренного торможения сама заметит внезапно выбежавшего пешехода, а камера с распознаванием дорожных знаков подскажет, что сейчас ограничение скорости 50 км/ч.

Компьютерное зрение применяется не только внутри машин, но и в инфраструктуре. Умные дорожные камеры анализируют потоки транспорта на перекрестках и магистралях. Специальные алгоритмы считают количество автомобилей, определяют их скорость, фиксируют нарушителей. На основе этих данных городские службы могут в динамическом режиме регулировать светофоры, чтобы уменьшить пробки и повысить безопасность на дорогах.

Автоматические системы оплаты проезда (например, на платных трассах) с помощью CV сканируют номерные знаки машин и взимают плату без остановки транспорта – все происходит мгновенно, «на лету». Таким образом, транспортная отрасль становится более интеллектуальной благодаря зрению машин.

Сельское хозяйство

Даже в такой традиционной сфере, как сельское хозяйство, компьютерное зрение произвело маленькую революцию. Умные фермы используют камеры и дроны для наблюдения за посевами и скотом. С высоты птичьего полета дрон, оснащенный CV-системой, сканирует поля и оценивает состояние растений. Алгоритмы по цвету и структуре посевов могут выявить участки, где растения испытывают стресс, например, из-за нехватки влаги, вредителей или болезней. Фермер получает точную «карту» проблемных зон и может точечно полить или обработать нужные сегменты поля, вместо того чтобы действовать вслепую. Это экономит воду, удобрения и пестициды, повышает урожай и бережет почву.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Принципы рационального кредитного поведения Принципы рационального кредитного поведения

Практические рекомендации потенциальным заемщикам

Наука и техника
Типы старения лица и кожи: какие бывают и как их определить Типы старения лица и кожи: какие бывают и как их определить

Какие типы старения лица и организма существуют?

РБК
«Суперапп» национального масштаба «Суперапп» национального масштаба

В России приступили к созданию национального мессенджера

Монокль
Карина Разумовская Карина Разумовская

Актриса БДТ Карина Разумовская выкрутила тумблер нашей эмпатии на максимум

Собака.ru
Олимпиада, мать царя Олимпиада, мать царя

Почему античные историки так ненавидели мать Александра Великого — Олимпиаду?

Дилетант
Каким ты будешь, городской бус? Каким ты будешь, городской бус?

Ждать ли нам завтра электробусов в каждом городе?

Наука и жизнь
Китайская оценка Китайская оценка

«Русал» получил третий китайский рейтинг в этом году

Ведомости
Объединяя народы Объединяя народы

Летний уикенд в Казани — что посмотреть в столице Татарстана?

Отдых в России
Художники Художники

Рассказ Александра Маркова «Художники»

Знание – сила
Испанские авианосцы на мировом рынке Испанские авианосцы на мировом рынке

Что помогло определиться с основными требованиями к универсальному авианосцу

Наука и техника
Как заработать на будущее Как заработать на будущее

Актуальные инструменты пенсионных накоплений

Деньги
Смелая палитра Смелая палитра

Эта небольшая квартира не производит впечатления маленького пространства

Идеи Вашего Дома
Гастрономическая пара Гастрономическая пара

Сытно или изысканно? «Вдова Клико» или «Западный склон»?

СНОБ
FORTUNA 812 FORTUNA 812

SoundCloud-рэп снова в топе благодаря FORTUNA 812

Собака.ru
Отец телевидения Владимир Зворыкин: история изобретения, изменившего мир Отец телевидения Владимир Зворыкин: история изобретения, изменившего мир

Почему отец телевидения Владимир Зворыкин возненавидел свое творение

ТехИнсайдер
Глеб Костин Глеб Костин

Глеб Костин — фаундер бренда “.solutions” и главный петербургский визионер

Собака.ru
50 лет исследований показали: эти 4 ошибки разрушают брак 50 лет исследований показали: эти 4 ошибки разрушают брак

Четыре стратегии общения, которые могут привести к расставаниям и разводам

Inc.
Мария Лисовая: «Работоспособность — мой основной инструмент» Мария Лисовая: «Работоспособность — мой основной инструмент»

Актерская профессия — это сплошные вопросы

Коллекция. Караван историй
Волнительный момент Волнительный момент

Как хронический стресс сказывается на коже?

Лиза
Палеонтологи впервые идентифицировали череп древнего человека-денисовца Палеонтологи впервые идентифицировали череп древнего человека-денисовца

Как ученые выделили генетический материал из черепа «человека-дракона»

ТехИнсайдер
Мы смотрим на рынок Китая Мы смотрим на рынок Китая

Что становится драйверами роста для цифровых платформ

Эксперт
Мужчина мечты Мужчина мечты

Кем хотел быть актер Макар Хлебников и кем он стал?

VOICE
Аркадий Водахов Аркадий Водахов

Как технарь с филфака Аркадий Водахов оказался в кресле генпродюсера ТНТ

Собака.ru
Нежаркие тропики Нежаркие тропики

Визуальным кодом квартиры стали зелёные оттенки и тропические принты

Идеи Вашего Дома
«Мы даем удочку и показываем, где ловить рыбу»: как бывший менеджер Яндекса построил рекламного гиганта в Telegram «Мы даем удочку и показываем, где ловить рыбу»: как бывший менеджер Яндекса построил рекламного гиганта в Telegram

Как создать рекламного гиганта там, где крупные игроки еще не появились?

Inc.
Без церемоний Без церемоний

Актриса Саша Бортич – о безумстве ради искусства и всепоглощающей силе любви

VOICE
Машина времени Машина времени

Петербургские места, где можно попасть в начало XX века, не покидая XXI

СНОБ
Алексей Конаков Алексей Конаков

Алексей Конаков о своем романе Петербурга 2080-х

Собака.ru
Дар моря Дар моря

Креветки в панцире, похожем на черепицу, у рыбы корвины русалочий хвост

Seasons of life
Хорошая попытка Хорошая попытка

Из чего рождается «петербургский эффект»?

СНОБ
Открыть в приложении