Как устроено компьютерное зрение и насколько велики его возможности

N+1Hi-Tech

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Жажда успеха: как выжить на пути к поставленным целям Жажда успеха: как выжить на пути к поставленным целям

Как достигнуть цели и при этом не выгореть?

Psychologies
Шок! Оказывается, ты всю жизнь пользовался попой неправильно Шок! Оказывается, ты всю жизнь пользовался попой неправильно

Прочитай наш гайд, и твоя попа будет тебе благодарна

Maxim
Что будет с кожей, если отказаться от сахара, соли и алкоголя Что будет с кожей, если отказаться от сахара, соли и алкоголя

Стоит ли забыть про привычное питание ради красоты?

Лиза
Русские гены сахарной свеклы Русские гены сахарной свеклы

Без научного подхода завоевать рынок сахарной свеклы невозможно

Наука
Кому и зачем сейчас нужно бизнес-образование в России Кому и зачем сейчас нужно бизнес-образование в России

О важности сохранения бизнес-образования в стране рассуждает Александр Ким

Forbes
5 исчезнувших этнических групп, которые когда-то жили в России 5 исчезнувших этнических групп, которые когда-то жили в России

Котты, гоайе и другие вымершие этнические группы России

ТехИнсайдер
Колесо фортуны Колесо фортуны

Как продать автомобиль и законно не платить налог

Лиза
«52 упрямые женщины»: вдохновляющие истории об ученых, которые изменили мир «52 упрямые женщины»: вдохновляющие истории об ученых, которые изменили мир

Книга об ученых, которые совершили важнейшие открытия и чьи имена забыты

СНОБ
Кушать подано! Кушать подано!

Чем же побаловать себя в разных регионах России?

Добрые советы
Травмы чувственности: как сексуальные потрясения детства влияют на нас сейчас Травмы чувственности: как сексуальные потрясения детства влияют на нас сейчас

Что делать, если эмоциональный взрыв случился в раннем детстве?

Psychologies
Георгий Эфрон. «Ни к городу и ни к селу — езжай, мой сын, в свою страну» Георгий Эфрон. «Ни к городу и ни к селу — езжай, мой сын, в свою страну»

Дневники Георгия Эфрона как отражение непростой жизни сына Марины Цветаевой

Караван историй
Как после 50 лет оставаться в хорошей форме Как после 50 лет оставаться в хорошей форме

Неужели после 50 нельзя быть подтянутым и спортивным?

ТехИнсайдер
Как научиться у ребенка тайм-менеджменту Как научиться у ребенка тайм-менеджменту

Могут ли дети научить нас все успевать?

Psychologies
Время сильных женщин: как Теруань де Мерикур боролась за равноправие в XVIII веке Время сильных женщин: как Теруань де Мерикур боролась за равноправие в XVIII веке

Теруань де Мерикур разрушала гендерные стереотипы еще в XVIII веке

Forbes
Вино для друзей Вино для друзей

Российские виноделы меняют вектор экспортных поставок

Агроинвестор
Тихоходки могут переживать экстремально низкие температуры, ставя свои биологические часы на паузу Тихоходки могут переживать экстремально низкие температуры, ставя свои биологические часы на паузу

Тихоходки похожи на главного героя классической сказки «Спящая красавица»

ТехИнсайдер
На подходе — искусственный разум На подходе — искусственный разум

Смогут ли физики приблизить будущее?

Наука
Ника Гаркалина: Ника Гаркалина:

Дочь Валерия Гаркалина вспоминает об отце

Караван историй
Самые красивые грузинки — артистки, модели, телеведущие, которых ты точно знаешь! Самые красивые грузинки — артистки, модели, телеведущие, которых ты точно знаешь!

Грузинки славятся своей красотой, стилем, характером и утонченными манерами

VOICE
Сбитый «Боинг» Сбитый «Боинг»

Ранним утром 1 сентября 1983 года истребитель СУ-15 был поднят по тревоге

Дилетант
5 продуктов, которые сделают ваши нервы крепче 5 продуктов, которые сделают ваши нервы крепче

Как помочь организму справиться со стрессом и сезонными переменами?

Psychologies
Найдены причины аномальных отклонений орбиты Урана Найдены причины аномальных отклонений орбиты Урана

Модель, которая объясняет многочисленные аномалии и странности в поведении Урана

ТехИнсайдер
Детская урбанистика: как бизнес может создавать комфортную городскую среду Детская урбанистика: как бизнес может создавать комфортную городскую среду

Дети становятся важным ориентиром для развития городских проектов будущего

Forbes
Основатель спа-клиники «Восточный Экспресс» — о бьюти-потенциале Дубая Основатель спа-клиники «Восточный Экспресс» — о бьюти-потенциале Дубая

В каком направлении движется мировая индустрия велнес-услуг

РБК
Крёстная мать перестройки Крёстная мать перестройки

Маргарет Тэтчер лучше всех почувствовала возможность перелома в Советском Союзе

Дилетант
Женская лига: как самые богатые владелицы команд меняют американский футбол Женская лига: как самые богатые владелицы команд меняют американский футбол

Как женский взгляд меняет американскую футбольную лигу

Forbes
Футбол – больше, чем все Футбол – больше, чем все

В футбол играют ногами и головой. Разве не странно?

Вокруг света
Как устроен венчурный рынок Армении и к чему готовиться российским предпринимателям Как устроен венчурный рынок Армении и к чему готовиться российским предпринимателям

Об особенностях армянского венчурного рынка, а также перспективах на нем

Forbes
С помощью линейки: как Ивонн Брилл отправляла космические аппараты к Луне и Марсу С помощью линейки: как Ивонн Брилл отправляла космические аппараты к Луне и Марсу

Отрывок из книги Рэйчел Свейби «52 упрямые женщины»

Forbes
Новая страсть миллиардеров: что такое эффективный альтруизм Новая страсть миллиардеров: что такое эффективный альтруизм

Эффективный альтруизм: истоки этого движения, его критика и причины популярности

Forbes
Открыть в приложении