Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Издержки профессии: почему у гонщиков Формулы-1 такие большие шеи Издержки профессии: почему у гонщиков Формулы-1 такие большие шеи

Гонщик Формулы-1 — не просто водитель, он настоящий спортсмен

ТехИнсайдер
Роза севера Роза севера

Самые могущественные во Франции «спонсоры» подарили Шартрскому собору розу

Вокруг света
Нейросети в поисках персонала: как компании используют искусственный интеллект в рекрутинге уже сейчас Нейросети в поисках персонала: как компании используют искусственный интеллект в рекрутинге уже сейчас

Как рекрутеры используют нейросети — кейсы из России

ТехИнсайдер
Девочка на шаре Девочка на шаре

Самые эффективные упражнения на фитболе: топ-6 для прокачки всего тела

Лиза
Что скрывает от нас подземка: 10 интересных фактов о московском метро Что скрывает от нас подземка: 10 интересных фактов о московском метро

Московское метро — незаменимый транспорт, про который мы не все знаем

ТехИнсайдер
Через иронию к звездам Через иронию к звездам

Как Ричард Викторов пытался оживить оттепельный пафос в эпоху застоя

Weekend
Восточный ветер Восточный ветер

Dongfeng – это вам не какой-то стартап, а компания более чем заслуженная

Автопилот
Новый папа Новый папа

Как наладить отношения между ребенком и твоим новым мужчиной

Лиза
Передел Европы. Часть I. Игры дипломатов Передел Европы. Часть I. Игры дипломатов

В отношениях Италии и Франции в 1919 году возникла трещина

Знание – сила
Управляемая мутация против продовольственного кризиса Управляемая мутация против продовольственного кризиса

«Геномный прыжок» и с чем его едят

Наука
6 автомобилей, которые производятся не там, где вы думали 6 автомобилей, которые производятся не там, где вы думали

Американский BMW, итальянский Jeep и индийский AUDI — что? Да!

4x4 Club
Мария Лотта Мария Лотта

Модель-сенсация Мария Лотта смотрит на вас отовсюду

Собака.ru
Чужая девочка Чужая девочка

Возможно ли полюбить чужого ребенка как своего

СНОБ
Как разбудить любовь к себе? Советы астролога Как разбудить любовь к себе? Советы астролога

Все аспекты, связанные с любовью и деньгами, находятся под управлением Венеры

VOICE
Что делать, если партнер не хочет секса: 7 шагов Что делать, если партнер не хочет секса: 7 шагов

Как быть, если ваши сексуальные потребности с партнером не совпадают?

Psychologies
Лицом к салату: 6 способов обезвредить продукты, которые притворяются диетическими Лицом к салату: 6 способов обезвредить продукты, которые притворяются диетическими

Ингредиенты для салатов, которые не такие диетические, как кажутся

VOICE
Темперамент имеет значение: сильные и слабые стороны холерика Темперамент имеет значение: сильные и слабые стороны холерика

Какая работа подходит холерикам и как воспитывать ребенка-холерика

Psychologies
Компания Figure показала рабочий прототип человекоподобного робота Компания Figure показала рабочий прототип человекоподобного робота

На разработку человекоподобного робота с нуля потребовалось лишь 12 месяцев

N+1
Как извержение вулканов влияет на атмосферу Как извержение вулканов влияет на атмосферу

Как извержение вулканов меняет состояние земной атмосферы и климат

СНОБ
Как Binance взлетела на неудачном запуске фирменного токена Как Binance взлетела на неудачном запуске фирменного токена

Как Binance обернула крупнейший провал себе на пользу

Forbes
Хлеб всему голова: 10 гениальных советов, как использовать хлеб в быту Хлеб всему голова: 10 гениальных советов, как использовать хлеб в быту

Как может пригодиться в быту испорченный хлеб

ТехИнсайдер
Как решиться на смену профессии после 30: личный опыт и рекомендации Как решиться на смену профессии после 30: личный опыт и рекомендации

Как переступить через страх и заняться новым любимым делом после 30 лет?

Psychologies
Suzuki показала четвероногий электрический квадроцикл Suzuki показала четвероногий электрический квадроцикл

Электрический квадроцикл может ездить по дорогам и ходить по лестницам

N+1
Интимная гимнастика: 3 повода начать выполнять упражнения Кегеля Интимная гимнастика: 3 повода начать выполнять упражнения Кегеля

Как состояние интимных мышц влияет на здоровье и личную жизнь?

Psychologies
«Вернуть жену Ивану Лапикову помог Олег Ефремов» «Вернуть жену Ивану Лапикову помог Олег Ефремов»

Образы, созданные Иваном Лапиковым в кино стали народными, любимыми

Караван историй
Плохая несчастная мать: роман о домашнем насилии и тех, кто позволяет ему случиться Плохая несчастная мать: роман о домашнем насилии и тех, кто позволяет ему случиться

Отрывок из романа «Ветер уносит мертвые листья»

Forbes
Феминизм, неприятный запах и бывшие: что пугает россиян на первом свидании Феминизм, неприятный запах и бывшие: что пугает россиян на первом свидании

Что раздражает или пугает россиян в партнере на первом свидании

Psychologies
Дорогое имя: как и зачем клубы продают названия своих стадионов Дорогое имя: как и зачем клубы продают названия своих стадионов

Почему практика продажи названий стадионов нужна клубам и спонсорам?

Forbes
Флуоресценция оказалась широко распространена среди млекопитающих Флуоресценция оказалась широко распространена среди млекопитающих

Какие животные способны к флуоресценции?

N+1
Однополое сексуальное поведение млекопитающих связали с развитием социальности Однополое сексуальное поведение млекопитающих связали с развитием социальности

Однополое сексуальное поведение помогает животным поддерживать сплоченность

N+1
Открыть в приложении