Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как путешествия меняют нас: 5 не заметных глазу трансформаций Как путешествия меняют нас: 5 не заметных глазу трансформаций

Как путешествия влияют на наше ментальное и физическое здоровье?

ТехИнсайдер
Правильный счет: можно ли доверять скидкам в «черную пятницу»? Правильный счет: можно ли доверять скидкам в «черную пятницу»?

Какие маркетинговые приемы работают в «черную пятницу»

Правила жизни
Что такое «зима искусственного интеллекта» и когда ее ждать Что такое «зима искусственного интеллекта» и когда ее ждать

Что происходит во время «зимы искусственного интеллекта»?

ТехИнсайдер
Российские компании переписывают утиную историю Российские компании переписывают утиную историю

В чем причина резкого роста производства утки

Агроинвестор
Млечный Путь и Андромеда прямо сейчас мчатся навстречу друг другу — космический апокалипсис или слияние галактик? Млечный Путь и Андромеда прямо сейчас мчатся навстречу друг другу — космический апокалипсис или слияние галактик?

Млечный Путь и Андромеда сейчас стремительно движутся навстречу друг другу

Inc.
Астрономы наблюдают за «Тасманским дьяволом» — таинственной периодической вспышкой Астрономы наблюдают за «Тасманским дьяволом» — таинственной периодической вспышкой

Астрономы под руководством Университета Корнелла наблюдают мощный взрыв

ТехИнсайдер
Быстрее, выше, сильнее: как связаны спорт и либидо Быстрее, выше, сильнее: как связаны спорт и либидо

Можно ли повысить либидо, занимаясь спортом?

Правила жизни
Остаться с носом. Как выбрать капли в нос: инструкция от ЛОРа Остаться с носом. Как выбрать капли в нос: инструкция от ЛОРа

Когда нос заложен и нарушено дыхание, это влияет на качество жизнинос

Лиза
«Останавливаться я не собираюсь» «Останавливаться я не собираюсь»

Екатерина Молоховская на сцене — артистка, а в жизни — психолог

OK!
Секреты профессии. Мастер перманентного макияжа Секреты профессии. Мастер перманентного макияжа

Кому подойдет профессия мастера перманентного макияжа, как в ней добиться успеха

Лиза
В контакте с собой В контакте с собой

Как добиться гармонии чувств, разума и тела

Новый очаг
«Если бы не жена, я был бы другим человеком» «Если бы не жена, я был бы другим человеком»

Александр Степанов – о метаморфозах рэпа и песнях для Бузовой

VOICE
Смотрибельные и классные российские фильмы 90-х Смотрибельные и классные российские фильмы 90-х

Какие российские фильмы 90-х стоит посмотреть?

Maxim
Александр Олешко: «Гурченко этой фразой давала мне шанс исправить ситуацию...» Александр Олешко: «Гурченко этой фразой давала мне шанс исправить ситуацию...»

Александр Олешко — о Валентине Леонтьевой, любви к дикторам и телевидении

Коллекция. Караван историй
Затерянная Берингия Затерянная Берингия

Добираться в национальный парк «Берингия» долго и дорого, но оно того стоит

Отдых в России
Хватит кашлять! Хватит кашлять!

Натуральные средства от сухого кашля

Лиза
Эксперименты и смекалка. Как инженеры создают суперстекла для гражданской авиации и транспорта Эксперименты и смекалка. Как инженеры создают суперстекла для гражданской авиации и транспорта

Как создаются сверхпрочные стекла из уникального материала для самолетов

СНОБ
Движения людей выдали их намерение найти информацию Движения людей выдали их намерение найти информацию

Характер движений подсказал другим, что этот человек занят поиском информации

N+1
Правила игры: как и зачем внедрять геймификацию в работу сотрудников Правила игры: как и зачем внедрять геймификацию в работу сотрудников

Как грамотно встроить элементы геймификации в систему мотивации персонала

Forbes
Ментальный словарь: как наш мозг запоминает и использует слова Ментальный словарь: как наш мозг запоминает и использует слова

Все люди используют один и тот же язык совершенно по-разному

ТехИнсайдер
Круто ты пропал: что стало с участниками «Фабрики звезд» разных сезонов Круто ты пропал: что стало с участниками «Фабрики звезд» разных сезонов

Кто из «фабрикантов» стал звездой, а чья карьера пошла по другому сценарию

Правила жизни
Суммарная выручка 20 крупнейших медицинских компаний выросла до 208 млрд рублей Суммарная выручка 20 крупнейших медицинских компаний выросла до 208 млрд рублей

Рынок платных медицинских услуг продолжает расти в цене

Forbes
Мини-скот: когда россияне начнут есть мух и кого ими уже кормят Мини-скот: когда россияне начнут есть мух и кого ими уже кормят

Где уже используется продукция из мух и будем ли мы с вами их есть?

Forbes
Благородные, но такие разные Благородные, но такие разные

Почему цены на драгметаллы разнонаправлены

Деньги
Дом среди сосен Дом среди сосен

Архитектор Елена Андреева и ее партнеры с нуля построили загородный дом мечты

SALON-Interior
Пойми меня, дорогой Пойми меня, дорогой

Главные правила, как общаться с мужчиной

Лиза
Немного о жизни звезд Немного о жизни звезд

Как ведется классификация звезд

Наука и техника
Археолог изготовила минеральные краски палеолитическими методами Археолог изготовила минеральные краски палеолитическими методами

Археолог Ксения Степанова провела несколько полезных экспериментов

N+1
«Спасти мир за 24 ч аса — это про меня!» «Спасти мир за 24 ч аса — это про меня!»

Мы встретились с Мариной Ермошкиной и оказались... на чужой свадьбе!

OK!
«Наследие»: отрывок из нового романа Владимира Сорокина о докторе Гарине «Наследие»: отрывок из нового романа Владимира Сорокина о докторе Гарине

Глава из книги Владимира Сорокина «Наследие»

Forbes
Открыть в приложении