Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пугающая ошибка на Windows: что такое синий экран смерти и как его исправить Пугающая ошибка на Windows: что такое синий экран смерти и как его исправить

Расшифровка кодов ошибок синего экрана Windows и способы их быстрого устранения

ТехИнсайдер
Порнозависимость: что это и как с ней бороться Порнозависимость: что это и как с ней бороться

Когда просмотр порно становится зависимостью?

РБК
ИИ на страже безопасности: смогут ли нейросети бороться с хакерами ИИ на страже безопасности: смогут ли нейросети бороться с хакерами

Кто победит в этой схватке алгоритмов — защитники или взломщики?

ТехИнсайдер
«Как заниматься сексом»: фильм о том, почему первый опыт часто оказывается травмой «Как заниматься сексом»: фильм о том, почему первый опыт часто оказывается травмой

«Как заниматься сексом»: фильм о подростках, исследующих свою сексуальность

Forbes
«Тест на старика»: а вы сможете его пройти? «Тест на старика»: а вы сможете его пройти?

Если у вас есть пять минут, предлагаем испытать свои силы в тесте на старика

Maxim
12 интересных фактов об Ан-2 — самолете, попавшем в книгу рекордов Гиннесса 12 интересных фактов об Ан-2 — самолете, попавшем в книгу рекордов Гиннесса

Биплан Ан-2 был принят в эксплуатацию 75 лет назад — и до сих пор востребован

Maxim
10 самых лучших и горячих азиатских порноактрис в 2023 году 10 самых лучших и горячих азиатских порноактрис в 2023 году

Самые зажигательные девушки Азии

Maxim
Всем по собаке Всем по собаке

Как помогать бездомным животным и на какие фонды стоит обратить внимание

Grazia
Солнечный закат в цветке Солнечный закат в цветке

Может ли цветок передать всё великолепие африканского заката?

Наука и жизнь
Призрак изобилия Призрак изобилия

Как на ВДНХ вернулся пафос

Weekend
Как зимой выглядеть «дорого», не потратив много денег: 5 советов Как зимой выглядеть «дорого», не потратив много денег: 5 советов

Идеальные зимние наряды, которые будут смотреться дорого при небольших затратах

VOICE
Проверка связи: почему так важно регулярно проходить полные медицинские обследования Проверка связи: почему так важно регулярно проходить полные медицинские обследования

Как остановить время с помощью простых — и не очень — обследований

Forbes
В России выходит автобиография Энцо Феррари «Мои ужасные радости». MAXIM публикует эксклюзивный отрывок В России выходит автобиография Энцо Феррари «Мои ужасные радости». MAXIM публикует эксклюзивный отрывок

Самая важная глава из книги великого конструктора и автогонщика.

Maxim
Кто такие токсичные родители и как с ними правильно общаться Кто такие токсичные родители и как с ними правильно общаться

Что значит быть токсичными родителями и как взаимодействовать с такими близкими

РБК
Искусство оживлять: эволюция палеоарта. Часть 1 Искусство оживлять: эволюция палеоарта. Часть 1

Что такое палеоарт, молодой жанр на стыке науки и искусства?

Наука и техника
Загадка Офира: как редкую коллекцию драгоценных камней продали без ведома ее хозяина Загадка Офира: как редкую коллекцию драгоценных камней продали без ведома ее хозяина

Как коллекция драгоценных камней оказалась у человека, который её не покупал

Forbes
10 красивых пород кошек черно-белого окраса 10 красивых пород кошек черно-белого окраса

Хотите себе «смокинговую» кошку? Обратите внимание на эти породы

VOICE
Выйти из тени Выйти из тени

В некоторых местах планеты бороться с нехваткой света приходится уже сейчас

Вокруг света
Почему термос перестал держать тепло: 3 житейских способа восстановить изоляцию Почему термос перестал держать тепло: 3 житейских способа восстановить изоляцию

Как починить термос, чтобы он снова радовал горячими напитками

ТехИнсайдер
Африка и мир: музыка нас связала Африка и мир: музыка нас связала

Банджо, маримба, сенсерро и другие инструменты, без которых невозможно обойтись

Наука
Суперкомпьютер отделившегося от «Яндекса» проекта Nebius вошел в мировой топ-500 Суперкомпьютер отделившегося от «Яндекса» проекта Nebius вошел в мировой топ-500

Компания Nebius N.V. дебютировала в мировом рейтинге суперкомпьютеров Tор500

Forbes
Редкий гривистый голубь долетел до восточного побережья Австралии Редкий гривистый голубь долетел до восточного побережья Австралии

Редкий гривистый голубь гнездится на островах от Юго-Восточной Азии до Меланезии

N+1
Робот-химик, вооруженный ИИ, может добыть кислород на Марсе Робот-химик, вооруженный ИИ, может добыть кислород на Марсе

Исследователи разработали робота-химика, который может добыть кислород на Марсе

ТехИнсайдер
За счастьем и зубами древней акулы За счастьем и зубами древней акулы

5 причин съездить в Тюменскую область

Лиза
Этот «вампир» убивал своих жертв «любовным укусом»! История Фрица Хаарманна из Ганновера Этот «вампир» убивал своих жертв «любовным укусом»! История Фрица Хаарманна из Ганновера

Вот пугающий пример «реального вампира» из XX века

ТехИнсайдер
Время перемен Время перемен

Признаки и профилактика ранней менопаузы

Лиза
В одну черную, черную пятницу… В одну черную, черную пятницу…

Что такое синдром упущенной выгоды и как нас заставляют покупать ненужное

Лиза
У биологов не получилась мышь с крысиным сердцем и сосудами У биологов не получилась мышь с крысиным сердцем и сосудами

Испанские исследователи отработали методику создания химерных мышей

N+1
Пивные миллионы: сколько в мире зарабатывают клубы и стадионы на кейтеринге Пивные миллионы: сколько в мире зарабатывают клубы и стадионы на кейтеринге

Сколько приносит продажа пенного напитка на стадионах?

Forbes
Красная курица, или Парижские жители Красная курица, или Парижские жители

«Цыпленок для Линды»: нарисованная история про память

Weekend
Открыть в приложении