Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Печальная история Бланш Бэрроу: «вынужденной» сообщницы Бонни и Клайда Печальная история Бланш Бэрроу: «вынужденной» сообщницы Бонни и Клайда

Бланш Бэрроу: кто она такая и как познакомилась с Бонни и Клайдом?

ТехИнсайдер
Пережить шторм: 12 вопросов, чтобы понять, можно ли спасти отношения Пережить шторм: 12 вопросов, чтобы понять, можно ли спасти отношения

Как узнать, утонет ли любовь в море спокойствия?

Psychologies
Запуск 6G возможен к 2030 году: эксперт назвал время появления связи шестого поколения Запуск 6G возможен к 2030 году: эксперт назвал время появления связи шестого поколения

Готов ли мир к переходу на связь шестого поколения?

ТехИнсайдер
Безумные новогодние блюда прошлого, от которых люди решили отказаться Безумные новогодние блюда прошлого, от которых люди решили отказаться

Блюда, которые сегодня показались бы неуместными на праздничном застолье

ТехИнсайдер
8 самых интересных фильмов и сериалов с Любовью Аксеновой 8 самых интересных фильмов и сериалов с Любовью Аксеновой

Самые запоминающиеся роли Любови Аксеновой

Maxim
Новогодняя революция Новогодняя революция

Кубинская революция произошла в очень удобное время для последующих торжеств

Дилетант
«Как заниматься сексом»: фильм о том, почему первый опыт часто оказывается травмой «Как заниматься сексом»: фильм о том, почему первый опыт часто оказывается травмой

«Как заниматься сексом»: фильм о подростках, исследующих свою сексуальность

Forbes
Как зимой выглядеть «дорого», не потратив много денег: 5 советов Как зимой выглядеть «дорого», не потратив много денег: 5 советов

Идеальные зимние наряды, которые будут смотреться дорого при небольших затратах

VOICE
Через апокалипсис революции к тысячелетнему царству Через апокалипсис революции к тысячелетнему царству

Как возникла коммунистическая утопия

Weekend
Русская красавица Русская красавица

Как выглядела и что носила стереотипная русская красавица

Дилетант
Банальность против зла Банальность против зла

Как Терренс Малик превратил пафос в киноязык

Weekend
«Тренировка волос»: что надо делать, чтобы мыть голову реже «Тренировка волос»: что надо делать, чтобы мыть голову реже

С какой частотой правильно мыть голову?

VOICE
Стоякам тут не место: почему не стоит заводить отношения на работе Стоякам тут не место: почему не стоит заводить отношения на работе

К чему приводят романтические отношения на работе?

Правила жизни
Эволюция биосферы: архейская нищета и панспермия Эволюция биосферы: архейская нищета и панспермия

Зачем изучать эволюцию биосферы?

Наука и техника
Каракары справились с решением головоломок не хуже какаду Каракары справились с решением головоломок не хуже какаду

Птицы из отряда соколообразных доказали свой высокий интеллект

N+1
Бежать бояться Бежать бояться

«Слово пацана. Кровь на асфальте»: наши «Банды Нью-Йорка»

Weekend
Илья Любимов: «Я долгое время проверял мир на прочность» Илья Любимов: «Я долгое время проверял мир на прочность»

Илья Любимов рассказал о своей семье и о том, как начиналась его карьера

Коллекция. Караван историй
Ночная тревожность: как вернуть здоровый сон Ночная тревожность: как вернуть здоровый сон

Если переживания накапливаются и мешают сну, то это уже плохо. Как быть?

Здоровье
Почему так дорого? Почему так дорого?

Как узнать, сколько стоит handmade-изделие: подсказки самозанятому

Лиза
Передача семьи Романовых Уралсовету Передача семьи Романовых Уралсовету

Картина Владимира Пчёлина, изображающая передачу Николая II Уралсовету

Дилетант
Чем закусывали пиво в СССР? Чем закусывали пиво в СССР?

Сушки — одна из самых популярных закусок в советское время

Maxim
Как лингвисты пытаются разбудить «спящие» языки Как лингвисты пытаются разбудить «спящие» языки

Когда язык умирает, а когда просто спит? Можно ли его разбудить?

ТехИнсайдер
«Полезное прошлое: История в сталинском СССР» «Полезное прошлое: История в сталинском СССР»

Почему историки перестали называть Ивана Грозного тираном

N+1
Я в отношениях, но не чувствую любви: как ее вернуть? Я в отношениях, но не чувствую любви: как ее вернуть?

Почему возникает чувство нелюбви в отношениях и как это корректировать

Psychologies
«Это я, внучка твоя»: история о том, как угасает пожилой человек «Это я, внучка твоя»: история о том, как угасает пожилой человек

Трогательный, глубокий рассказ «Лес памяти» — о том, как угасает человек

Psychologies
Три самых известных российских киллера 90-х Три самых известных российских киллера 90-х

Наемные убийцы, делавшие свою работу с артистизмом, достойным Голливуда

Maxim
Спасение утонувшего Спасение утонувшего

«Как заниматься сексом»: дежурная тинейджерская агитка

Weekend
Зачем человеку две ноздри? Чтобы чувствовать «стереозапахи» Зачем человеку две ноздри? Чтобы чувствовать «стереозапахи»

Как мозг обрабатывает запахи?

ТехИнсайдер
Круто ты пропал: что стало с участниками «Фабрики звезд» разных сезонов Круто ты пропал: что стало с участниками «Фабрики звезд» разных сезонов

Кто из «фабрикантов» стал звездой, а чья карьера пошла по другому сценарию

Правила жизни
В постели с врагом: как после войн женщин преследовали за отношения с противниками В постели с врагом: как после войн женщин преследовали за отношения с противниками

Как шовинизм и мизогиния притворялись жаждой справедливости

Forbes
Открыть в приложении