Зачем нужно компьютерное зрение и какие задачи оно решает в разных сферах

Наука и техникаHi-Tech

Компьютерное зрение: когда роботы перестали тыкать пальцем в небо?

Степан Бурмистров

Представьте, что компьютер способен «смотреть» на мир почти как человек. Еще недавно это звучало как фантастика, а сегодня стало реальностью. Мы сталкиваемся с этим ежедневно: смартфон узнает лицо владельца, поиск в Интернете может по фотографии определить породу щенка, а современные автомобили с камерами видят пешеходов и дорожные знаки. Все это – проявления технологий компьютерного зрения. Компьютерное зрение (CV, от англ. computer vision) – это область искусственного интеллекта, позволяющая машинам анализировать изображения и видео и «понимать» их содержание. Давайте разберемся, зачем нужно компьютерное зрение, какие задачи оно решает в разных сферах и как оно работает под капотом.

Зачем нужно компьютерное зрение?

Наш мир наполнен визуальной информацией. Камеры установлены повсюду – от смартфонов и ноутбуков до уличных видеосистем и спутников. Объем визуальных данных растет лавинообразно, и обрабатывать их вручную становится невозможно.

Компьютерное зрение необходимо, чтобы автоматизировать и ускорить работу с визуальной информацией там, где человеку не хватает времени, возможностей или точности.

Алгоритмы CV способны моментально выделять важные детали на изображениях, замечать тонкие особенности и анализировать миллионы снимков куда быстрее, чем это сделал бы человек. В результате компьютеры со «зрением» помогают людям принимать решения более эффективно – от постановки диагноза по рентгеновскому снимку до управления беспилотным автомобилем.

Компьютерное зрение как научная дисциплина берет свое начало примерно с 1960-х годов. Тогда ученые только начинали экспериментировать с алгоритмами, которые могли бы автоматически интерпретировать изображения. Первыми успехами в этой области были примитивные программы, которые распознавали простые формы, контуры объектов и базовые паттерны. Настоящий прорыв случился после 2010-х годов с распространением глубокого обучения (deep learning) и появления архитектур сверточных нейронных сетей (Convolutional Neural Networks, CNN). Задачи, которые до этого казались почти нерешаемыми (например, точное распознавание десятков и сотен различных объектов на фотографиях), начали решаться с высокой точностью.

Области применения компьютерного зрения

Компьютерное зрение уже работает во многих сферах нашей жизни. Рассмотрим несколько ярких примеров, как компьютерное зрение помогает людям – от здравоохранения до сельского хозяйства.

Медицина и здравоохранение

Одной из самых полезных областей применения CV стала медицина. Алгоритмы компьютерного зрения помогают врачам анализировать медицинские изображения: рентгеновские снимки, КТ, МРТ, ультразвуковые сканы. Например, система может распознать опухоль на рентгене легких. Современные модели на основе нейросетей уже достигают точности выявления рака, сопоставимой с уровнем опытного рентгенолога и даже выше. При этом лучше всего врач и алгоритм работают в паре: исследование показало, что радиологи точнее обнаруживают опухоли с помощью ИИ, чем без него, и на это не тратится дополнительное время. Компьютерное зрение способно уловить в снимках такие слабовыраженные признаки заболеваний, которые человеческий глаз может просто не заметить.

Транспорт и автомобили

Автомобили без водителя невозможно представить без компьютерного зрения. Бортовые камеры беспилотника являются «глазами», которые непрестанно следят за дорогой. Алгоритмы в реальном времени распознают разметку, различают цвета сигналов светофора, читают дорожные знаки и, конечно, обнаруживают препятствия – других машин, велосипедистов, пешеходов.

Благодаря этому автомобиль может принимать решения о торможении или повороте не хуже (а в некоторых ситуациях и лучше) человека. Но и обычные водители уже пользуются плодами CV: система экстренного торможения сама заметит внезапно выбежавшего пешехода, а камера с распознаванием дорожных знаков подскажет, что сейчас ограничение скорости 50 км/ч.

Компьютерное зрение применяется не только внутри машин, но и в инфраструктуре. Умные дорожные камеры анализируют потоки транспорта на перекрестках и магистралях. Специальные алгоритмы считают количество автомобилей, определяют их скорость, фиксируют нарушителей. На основе этих данных городские службы могут в динамическом режиме регулировать светофоры, чтобы уменьшить пробки и повысить безопасность на дорогах.

Автоматические системы оплаты проезда (например, на платных трассах) с помощью CV сканируют номерные знаки машин и взимают плату без остановки транспорта – все происходит мгновенно, «на лету». Таким образом, транспортная отрасль становится более интеллектуальной благодаря зрению машин.

Сельское хозяйство

Даже в такой традиционной сфере, как сельское хозяйство, компьютерное зрение произвело маленькую революцию. Умные фермы используют камеры и дроны для наблюдения за посевами и скотом. С высоты птичьего полета дрон, оснащенный CV-системой, сканирует поля и оценивает состояние растений. Алгоритмы по цвету и структуре посевов могут выявить участки, где растения испытывают стресс, например, из-за нехватки влаги, вредителей или болезней. Фермер получает точную «карту» проблемных зон и может точечно полить или обработать нужные сегменты поля, вместо того чтобы действовать вслепую. Это экономит воду, удобрения и пестициды, повышает урожай и бережет почву.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Откуда что пошло на флоте. Рождение парового судна Откуда что пошло на флоте. Рождение парового судна

Как и с чего начиналась «пароходная лихорадка»?

Наука и техника
Самоубийство семьи бургомистра Самоубийство семьи бургомистра

«Кризис закончен. Орудия затихли. Кто знал, как нам стоит поступить?»

Дилетант
Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих

Почему из-за развития цифровых технологий снижаются когнитивные функции человека

Монокль
Почему машина заводится и глохнет и что с этим делать Почему машина заводится и глохнет и что с этим делать

Что делать, если машина глохнет: причины, диагностика, куда смотреть

РБК
Александр Чулок: «Мы не стараемся угадать будущее, мы хотим его создать» Александр Чулок: «Мы не стараемся угадать будущее, мы хотим его создать»

Прогнозист Александр Чулок — о том, чем станет ИИ для общества в будущем

РБК
Группы, в которых не менялся состав. Никогда Группы, в которых не менялся состав. Никогда

Группы, в которых состав отличается своей стабильностью

Maxim
Борьба за госбезопасность во всём мире Борьба за госбезопасность во всём мире

Юрий Андропов вошел в историю как реформатор, хотя и потенциальный

Дилетант
Хакеры пошли на завод Хакеры пошли на завод

Хакеры продолжают атаки на промышленные предприятия, их цель — шпионаж

Ведомости
Горят ли окна в министерстве обороны? Горят ли окна в министерстве обороны?

Чем так напугали Кремль «американские военные планы»?

Дилетант
Нефтяная кубышка: за и против Нефтяная кубышка: за и против

Нужен ли России стратегический запас нефти?

Монокль
Ну и дела… Ну и дела…

Считается, что нашумевшее в свое время «рыбное дело» началось с казуса...

Дилетант
«В России гость за 150 рублей ждет вкус, как в Мельбурне, и сервис, как в Токио. И получает это» «В России гость за 150 рублей ждет вкус, как в Мельбурне, и сервис, как в Токио. И получает это»

Легко ли миллениалу делать кофейный бизнес в России

Монокль
Перелет–2023 «Байкальская кругосветка» Перелет–2023 «Байкальская кругосветка»

«Байкальская кругосветка» – воздушное путешествие вокруг знаменитого озера

Наука и техника
Без диплома, но с работой Без диплома, но с работой

Почему студенты колледжей бросают учебу?

Ведомости
Запах города Запах города

Аромастилист о том, как не ошибиться в выборе парфюмерного гардероба

ЖАРА Magazine
«Почему вы хотите завоевать весь мир?» «Почему вы хотите завоевать весь мир?»

Страх ядерной войны между США и СССР был настолько высок, что передался детям

Дилетант
«Послы Ермака у Красного крыльца перед царём Иоанном Грозным» «Послы Ермака у Красного крыльца перед царём Иоанном Грозным»

Настоящее покорение земель Сибири началось в 1580-х годах

Дилетант
Короткая ответственность Короткая ответственность

Почему короткие страховки ОСАГО остаются непопулярными?

Ведомости
Композиты в судостроении Композиты в судостроении

Что же такое композиционные материалы (композиты)?

Наука и техника
Переславская флотилия Переславская флотилия

Переславль-Залесский: город на Золотом кольце, где хочется остановиться

Отдых в России
Советский Дэн Сяопин? Советский Дэн Сяопин?

Именно Андропов смог нарисовать траекторию экономических реформ. Так ли это?

Дилетант
Сбежать от рутины Сбежать от рутины

С потеплением всё больше людей сбегают от забот — в прямом и переносном смысле

Отдых в России
«Любая цифровизация должна сопровождаться стратегией по кибербезопасности» «Любая цифровизация должна сопровождаться стратегией по кибербезопасности»

Почему одни компании видят отдачу от внедрения цифровых решений, а другие нет?

Ведомости
Жизнь за стеной Жизнь за стеной

Фильм про страну, в которой тотальный контроль стал религией

Дилетант
В нескольких минутах от третьей мировой В нескольких минутах от третьей мировой

Сбои в работе СПРН случались, но всегда вовремя вмешивался человеческий фактор

Дилетант
Он лгал и учил лгать Он лгал и учил лгать

«Мы не знаем страны, в которой живем». А знаем ли мы Юрия Андропова?

Дилетант
«Меняются материалы, а круг образов всегда один» «Меняются материалы, а круг образов всегда один»

Художник Борис Кочейшвили — о том, что рай — это состояние

Weekend
Хирургия без шрамов: как появилась лапароскопия Хирургия без шрамов: как появилась лапароскопия

Как и когда хирургия стала щадящей?

ТехИнсайдер
На «зеленой» волне На «зеленой» волне

Какие экологические технологии внедряют отечественные аграрии

Агроинвестор
Седан XPeng P7 сжег мосты консервативного дизайна: самый смелый рестайлинг в истории китайского автопрома Седан XPeng P7 сжег мосты консервативного дизайна: самый смелый рестайлинг в истории китайского автопрома

Готов ли рынок к седану, который выглядит как артефакт из будущего?

ТехИнсайдер
Открыть в приложении