Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Между прошлым и будущим: 5 научных теорий о путешествиях во времени Между прошлым и будущим: 5 научных теорий о путешествиях во времени

Несколько научных гипотез о том, как перенестись в «прекрасное далеко»

ТехИнсайдер
«Экстраверт, холерик, грейсексуал»: вред и польза психологических ярлыков «Экстраверт, холерик, грейсексуал»: вред и польза психологических ярлыков

Что нам мешает название, которым мы пытаемся обозначить свое «Я»

Psychologies
Каким мог стать Ту-204: как советские конструкторы искали идеальный авиалайнер Каким мог стать Ту-204: как советские конструкторы искали идеальный авиалайнер

За 15 лет видение о том, каким должен быть Ту-204, несколько раз менялось

ТехИнсайдер
10 цитат Оливера Сакса, которые изменят ваше представление о сознании человека 10 цитат Оливера Сакса, которые изменят ваше представление о сознании человека

Как опыт общения с людьми меняет представление о сознании человека

Psychologies
Кто такая пикми: разбираем феномен пикми-герл с психологами Кто такая пикми: разбираем феномен пикми-герл с психологами

Что стоит за пикми-поведением?

РБК
Когда возникает «наука», или История понятия «science» Когда возникает «наука», или История понятия «science»

Развитие научного знания в Англии в XVII веке

Знание – сила
Философия на грани безумия: чем болел Фридрих Ницше Философия на грани безумия: чем болел Фридрих Ницше

Фридрих Ницше: жизненный путь психически нездорового философа

Psychologies
IPS или VA: какая матрица монитора лучше? IPS или VA: какая матрица монитора лучше?

Что лучше: IPS или VA матрица?

CHIP
Мир сходит с ума от сериала «Удивительный цифровой цирк»: чем он покоряет зрителей Мир сходит с ума от сериала «Удивительный цифровой цирк»: чем он покоряет зрителей

В чем феномен моментального успеха «Удивительного цифрового цирка»

Psychologies
Бескорыстно преданный: как миллионер и меценат Савва Морозов создал МХТ Бескорыстно преданный: как миллионер и меценат Савва Морозов создал МХТ

Как создавался и менялся МХТ

Forbes
Колумбия будет стерилизовать «кокаиновых» бегемотов Колумбия будет стерилизовать «кокаиновых» бегемотов

Когда Пабло Эскобар завел бегемотов, он не ожидал, что им понравится Колумбия

ТехИнсайдер
Доступность термитов для шимпанзе долины Исса связали с сезонностью и расселением Доступность термитов для шимпанзе долины Исса связали с сезонностью и расселением

Антропологи несколько лет пробовали ловить термитов в долине Исса

N+1
Тонкая допросная линия Тонкая допросная линия

«Голубиный туннель»: фильм Эррола Морриса о Джоне Ле Карре

Weekend
Канцерогенный фактор: можно ли заболеть раком, если работать по ночам Канцерогенный фактор: можно ли заболеть раком, если работать по ночам

Как нарушения сна связаны с онкогенными факторами?

Psychologies
13 психологических приемов, которые помогают расшатать укоренившуюся вредную мысль 13 психологических приемов, которые помогают расшатать укоренившуюся вредную мысль

Как убеждения мешают вашей самооценке или не дают строить счастливые отношения?

Psychologies
Каракары справились с решением головоломок не хуже какаду Каракары справились с решением головоломок не хуже какаду

Птицы из отряда соколообразных доказали свой высокий интеллект

N+1
Автор в голове у героя: 5 выдающихся фантастических циклов с повествованием от первого лица Автор в голове у героя: 5 выдающихся фантастических циклов с повествованием от первого лица

Книги, которые создают у читателя эмоциональную связь с героем-рассказчиком

ТехИнсайдер
Вся наша жизнь — театр Вся наша жизнь — театр

Мода, как и театр, отражает действительность

OK!
Свобода в союзе с гильотиной Свобода в союзе с гильотиной

Начиналась революция во Франции красиво — с Декларации прав человека

Дилетант
«Мышь»: роман о том, как зомби-апокалипсис уничтожает Москву и ее жителей «Мышь»: роман о том, как зомби-апокалипсис уничтожает Москву и ее жителей

Отрывок из романа «Мышь»: про апокалипсис ходячих мертвецов в России

Forbes
Увидеть Эверест и не умереть Увидеть Эверест и не умереть

Комфорт, отличная еда и суперсервис в Гималаях

Robb Report
Дисней. Уолт Дисней Дисней. Уолт Дисней

Как появились мышонок, утенок, олененок и другие животные-миллиардеры

Наука
Сомнительная изнанка «Основного инстинкта»: как создавался один из самых популярных фильмов 1990-х Сомнительная изнанка «Основного инстинкта»: как создавался один из самых популярных фильмов 1990-х

На съемках «Основного инстинкта» не обошлось без скандалов и предательств

Правила жизни
Аспирин в тарелке Аспирин в тарелке

Оказывается, многие продукты содержат аспирин. И добавляет его туда сама природа

Здоровье
Как избавиться от головной боли без лекарств: 10 рабочих способов Как избавиться от головной боли без лекарств: 10 рабочих способов

На работе застала головная боль, а таблетки нет ни у вас, ни у коллег?

ТехИнсайдер
Пивные миллионы: сколько в мире зарабатывают клубы и стадионы на кейтеринге Пивные миллионы: сколько в мире зарабатывают клубы и стадионы на кейтеринге

Сколько приносит продажа пенного напитка на стадионах?

Forbes
Разморозить Голливуд: чем завершилась массовая забастовка актеров и сценаристов Разморозить Голливуд: чем завершилась массовая забастовка актеров и сценаристов

Чем завершилось противостояние студий и сенаристов в Голливуде

Forbes
Солнце Тосканы Солнце Тосканы

«Темное прошлое» солнечного напитка вин санто, тосканского вина

Вокруг света
Какие здания нравятся россиянам: ученые выяснили, что предпочтения людей не соответствуют реальному виду новостроек Какие здания нравятся россиянам: ученые выяснили, что предпочтения людей не соответствуют реальному виду новостроек

Создается ли архитектура для удовлетворения эстетических потребностей?

ТехИнсайдер
Через иронию к звездам Через иронию к звездам

Как Ричард Викторов пытался оживить оттепельный пафос в эпоху застоя

Weekend
Открыть в приложении