Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как научиться довольствоваться тем, что есть, и перестать сравнивать свою жизнь с чужими Как научиться довольствоваться тем, что есть, и перестать сравнивать свою жизнь с чужими

Как перестать вечно гнаться за идеалом?

ТехИнсайдер
Путеводитель по винному миру. Как правильно читать и понимать «географические указания» на этикетках вин Путеводитель по винному миру. Как правильно читать и понимать «географические указания» на этикетках вин

Что такое «географические указания» на этикетках вин

СНОБ
Эксперт Фомин рассказал, как предотвратить слежку за переписками на Android Эксперт Фомин рассказал, как предотвратить слежку за переписками на Android

Способы защиты переписок для пользователей Android-устройств

ТехИнсайдер
Только я! Только я!

Что такое эгоцентризм и как его распознать

Лиза
Это не лень, а депрессия: 5 сигналов, что тебе нужна помощь Это не лень, а депрессия: 5 сигналов, что тебе нужна помощь

Как отличить депрессию от усталости или лени

VOICE
Big Data под угрозой: почему бизнес больше не стремится узнать все о своих клиентах Big Data под угрозой: почему бизнес больше не стремится узнать все о своих клиентах

Почему гонка за клиентскими данными у крупного бизнеса замедлилась

Forbes
Бежать бояться Бежать бояться

«Слово пацана. Кровь на асфальте»: наши «Банды Нью-Йорка»

Weekend
Через апокалипсис революции к тысячелетнему царству Через апокалипсис революции к тысячелетнему царству

Как возникла коммунистическая утопия

Weekend
Быстрее, выше, сильнее: как связаны спорт и либидо Быстрее, выше, сильнее: как связаны спорт и либидо

Можно ли повысить либидо, занимаясь спортом?

Правила жизни
Совместно нажитые проблемы: пять главных мифов о разводах Совместно нажитые проблемы: пять главных мифов о разводах

Пять популярных, но ошибочных убеждений о разводах

Forbes
«Готов снять за любой сомнительный спектакль»: история театральной цензуры в России «Готов снять за любой сомнительный спектакль»: история театральной цензуры в России

Как власти пытались контролировать театральное искусство

Forbes
Червь сомнения: что рекордный экспорт муки говорит о проблемах аграриев Червь сомнения: что рекордный экспорт муки говорит о проблемах аграриев

У дальнейшего роста экспорта зерновой отрасли есть серьезные препятствия

Forbes
Вне времени Вне времени

Элегантное современное пространство, соответствующее премиальному уровню

SALON-Interior
Ребенок начинает учить язык еще в утробе матери Ребенок начинает учить язык еще в утробе матери

Будущий ребенок начинают изучать язык, на котором вы говорите, еще до рождения!

ТехИнсайдер
«Экстраверт, холерик, грейсексуал»: вред и польза психологических ярлыков «Экстраверт, холерик, грейсексуал»: вред и польза психологических ярлыков

Что нам мешает название, которым мы пытаемся обозначить свое «Я»

Psychologies
Отступление россиян поставило жирный крест на надеждах врага: европейцы вовсю кусали локти Отступление россиян поставило жирный крест на надеждах врага: европейцы вовсю кусали локти

Какой была битва под Витебском 1812 года

ТехИнсайдер
Проповедники убийств Проповедники убийств

Жан-Поль Марат, Максимилиан Робеспьер и Жорж Дантон — идеологи террора

Дилетант
Суммарная выручка 20 крупнейших медицинских компаний выросла до 208 млрд рублей Суммарная выручка 20 крупнейших медицинских компаний выросла до 208 млрд рублей

Рынок платных медицинских услуг продолжает расти в цене

Forbes
Брожение умов в поисках силы всемирного тяготения, или Как рождался жанр «Анти-Ньютон» Брожение умов в поисках силы всемирного тяготения, или Как рождался жанр «Анти-Ньютон»

Глубокие научные концепции как триггер психологических эпидемий в обществе

Знание – сила
Ошибочка вышла Ошибочка вышла

6 промахов в макияже, которые делают весь образ безвкусным

Лиза
Славный город Славный город

Все годы жизни Севастополь подтверждал правильный выбор своего имени

Отдых в России
Домик на крыше Домик на крыше

Сколько стоит пентхаус

Деньги
Сервер научных статей bioRxiv поручил ИИ писать резюме. Пока не все хорошо Сервер научных статей bioRxiv поручил ИИ писать резюме. Пока не все хорошо

В bioRxiv стартовала в пилотном режиме ИИ-модель, которая может писать резюме

ТехИнсайдер
Как похудеть на... 10 лет Как похудеть на... 10 лет

Как распрощаться не только с лишним весом, но и с «лишним» возрастом?

Лиза
Облигации станут лесопарком Облигации станут лесопарком

Как банки расширяют практики устойчивого развития

Деньги
Как это развидеть Как это развидеть

Что мешает нам стирать воспоминания

N+1
Мини-скот: когда россияне начнут есть мух и кого ими уже кормят Мини-скот: когда россияне начнут есть мух и кого ими уже кормят

Где уже используется продукция из мух и будем ли мы с вами их есть?

Forbes
Как в детстве, но лучше. Топ игр для автомобилистов на VK Play Как в детстве, но лучше. Топ игр для автомобилистов на VK Play

Игры для автолюбителей: от гоночных аркад до симулятора водителя автобуса

РБК
При большом количестве помощниц ткачиковые воробьи отложили яйца покрупнее При большом количестве помощниц ткачиковые воробьи отложили яйца покрупнее

Самки ткачикового воробья откладывают более крупные яйца с помощнцами

N+1
Моя золотая долина… Моя золотая долина…

Интервью с академиком Анатолием Деревянко

Наука и жизнь
Открыть в приложении