Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

10 продуктов, которые не стоит готовить в аэрогриле 10 продуктов, которые не стоит готовить в аэрогриле

Все еще есть несколько видов продуктов, с которыми не справляются аэрогрили

ТехИнсайдер
Билайн взялся за трубку: зачем оператор купил сервис коллтрекинга Билайн взялся за трубку: зачем оператор купил сервис коллтрекинга

«Вымпелком» купил контрольный пакет в компании «Колибри»,

Forbes
Читалка для компьютера: выбираем лучшую из бесплатных Читалка для компьютера: выбираем лучшую из бесплатных

Лучшие читалки для компьютера из бесплатных программ

CHIP
6 правил, которые помогут безопасно знакомиться в интернете 6 правил, которые помогут безопасно знакомиться в интернете

Пытаясь найти свое счастье в Сети, важно помнить о правилах безопасности

Psychologies
Пять языков любви Пять языков любви

Секрет прочных отношений

kiozk originals
Стройными рядами Стройными рядами

Как девушки в СССР следили за фигурой

Лиза
Размер имеет значение Размер имеет значение

Алексей Екимов, Луис Брюс и Мунги Бавенди обеспечили людей смартфонами

Наука
Чем известен новый президент Аргентины Хавьер Милей и чего от него ждать Чем известен новый президент Аргентины Хавьер Милей и чего от него ждать

Чем прославился новый президент латиноамериканской страны с непростой судьбой

Forbes
5 технологий, которые появятся к 2100 году 5 технологий, которые появятся к 2100 году

В 2100 году наша жизнь будет не просто переплетена с технологиями

ТехИнсайдер
Что будет, если питаться фастфудом каждый день Что будет, если питаться фастфудом каждый день

Как фастфуд влияет на физическое и психическое здоровье?

РБК
Круто ты пропал: что стало с участниками «Фабрики звезд» разных сезонов Круто ты пропал: что стало с участниками «Фабрики звезд» разных сезонов

Кто из «фабрикантов» стал звездой, а чья карьера пошла по другому сценарию

Правила жизни
Идущие за лучом Идущие за лучом

Управление мозгом с помощью света порождает много надежд и столько же опасений

Вокруг света
Как уроженец Арзамаса-16 основал сеть Poison Drop и привлек деньги миллиардера Как уроженец Арзамаса-16 основал сеть Poison Drop и привлек деньги миллиардера

Последние два года стали судьбоносными для продавца бижутерии Poison Drop

Forbes
Дорога к свету Дорога к свету

QLED: в этих плоских панелях «упакованы» сразу две Нобелевские премии

ТехИнсайдер
Гонимая и ненагражденная Гонимая и ненагражденная

Почему Лиза Мейтнер так и не получила Нобелевскую премию

Знание – сила
Не устал, но ухожу Не устал, но ухожу

«Дворец»: Роман Полански встречает конец света и прощается

Weekend
Между бегством и свободой Между бегством и свободой

Как Саша Соколов соединил многие противоположности — и отменил их

Weekend
Действительно ли медитации работают: 11 научных фактов Действительно ли медитации работают: 11 научных фактов

Что наука думает о медитациях? Имеют ли такие практики доказанную эффективность?

ТехИнсайдер
Писатель Леонид Юзефович — Forbes: «В истории нас утешает повторение» Писатель Леонид Юзефович — Forbes: «В истории нас утешает повторение»

Леонид Юзефович — почему история нас как будто бы ничему не учит?

Forbes
Проповедники убийств Проповедники убийств

Жан-Поль Марат, Максимилиан Робеспьер и Жорж Дантон — идеологи террора

Дилетант
Продакт-плейсмент: что дает модным брендам появление в кино Продакт-плейсмент: что дает модным брендам появление в кино

Как модные бренды появляются в фильмах и сериалах, сколько на этом зарабатывают?

РБК
Дело не в мышцах, а в мозге: Янник Синнер тренируется по уникальной методике Дело не в мышцах, а в мозге: Янник Синнер тренируется по уникальной методике

Кто такой доктор Чеккарелли и в чем суть его волшебной методики

Forbes
Пухлая девочка в уродливых очках: как Билли Джин Кинг изменила себя, спорт и женщин Пухлая девочка в уродливых очках: как Билли Джин Кинг изменила себя, спорт и женщин

Как девочка из Калифорнии стала иконой для нескольких поколений женщин

Forbes
«Полезное прошлое: История в сталинском СССР» «Полезное прошлое: История в сталинском СССР»

Почему историки перестали называть Ивана Грозного тираном

N+1
«Наши мастера не уступают мировым производителям»: Олег Клодт о рынке архитектуры «Наши мастера не уступают мировым производителям»: Олег Клодт о рынке архитектуры

Архитектор Олег Клодт — о том, чем отличается девелопмент в России и на Западе?

Forbes
Я в отношениях, но не чувствую любви: как ее вернуть? Я в отношениях, но не чувствую любви: как ее вернуть?

Почему возникает чувство нелюбви в отношениях и как это корректировать

Psychologies
Странствие по странностям Странствие по странностям

Все ли со мной в порядке? Почему мои близкие так странно себя ведут?

Psychologies
Проверим щитовидку Проверим щитовидку

5 незаметных симптомов, которые сигнализируют о проблемах щитовидной железы

Лиза
Три самых известных российских киллера 90-х Три самых известных российских киллера 90-х

Наемные убийцы, делавшие свою работу с артистизмом, достойным Голливуда

Maxim
Новый «зеркальный ящик» для доктора Хауса: виртуальная реальность создает реальные ощущения Новый «зеркальный ящик» для доктора Хауса: виртуальная реальность создает реальные ощущения

Может ли рука чувствовать виртуальный предмет?

ТехИнсайдер
Открыть в приложении