Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США

Архив Мэрион Стокс — это уникальная хроника истории

ТехИнсайдер
«Спасти мир за 24 ч аса — это про меня!» «Спасти мир за 24 ч аса — это про меня!»

Мы встретились с Мариной Ермошкиной и оказались... на чужой свадьбе!

OK!
Февральская революция: как искусственный интеллект может повысить производительность труда Февральская революция: как искусственный интеллект может повысить производительность труда

Русские ученые устроили шестую промышленную революцию!

ТехИнсайдер
«Повезло этой беженке найти такой славный дом»: как жили спасенные от Холокоста дети «Повезло этой беженке найти такой славный дом»: как жили спасенные от Холокоста дети

Глава из книги Веры Гиссинг «Жемчужины детства»

Forbes
«Королева небес»: Что известно о самолете за $400 миллионов, который Катар подарил Трампу «Королева небес»: Что известно о самолете за $400 миллионов, который Катар подарил Трампу

Как Америке катарцы подарили самолет.

Maxim
Из спортивной журналистки в предпринимательницы Из спортивной журналистки в предпринимательницы

Как Мария Командная сменила футбол на косметику

Inc.
На прежние рельсы На прежние рельсы

Путешествие на поезде как способ перенестись в другую эпоху

Robb Report
Уют-компания Уют-компания

Превращаем холодное «место жительства» в настоящее место силы

VOICE
Жизнь в недостатке: каких кадров не хватает российскому онлайн-ретейлу Жизнь в недостатке: каких кадров не хватает российскому онлайн-ретейлу

Каких специалистов недостает в российском онлайн-ретейле и что с этим делать

Forbes
«Это все из-за меня!»: почему мы считаем, что ответственны за чувства других людей «Это все из-за меня!»: почему мы считаем, что ответственны за чувства других людей

Как перестать винить себя во всех проблемах

Psychologies
Эксперименты и смекалка. Как инженеры создают суперстекла для гражданской авиации и транспорта Эксперименты и смекалка. Как инженеры создают суперстекла для гражданской авиации и транспорта

Как создаются сверхпрочные стекла из уникального материала для самолетов

СНОБ
«Тренировка волос»: что надо делать, чтобы мыть голову реже «Тренировка волос»: что надо делать, чтобы мыть голову реже

С какой частотой правильно мыть голову?

VOICE
Семь достоинств кофе Семь достоинств кофе

Научные исследования в корне меняют наши представления о кофе

Здоровье
Происхождение совершенства Происхождение совершенства

Когда и почему растения свернулись в идеальную спираль

N+1
Лучшие финансовые результаты венчурных фондов достигаются, когда руководящие позиции занимают женщины Лучшие финансовые результаты венчурных фондов достигаются, когда руководящие позиции занимают женщины

Отсутствие женщин в венчурных фондах лишает индустрию стартапов талантов

Inc.
Марина Кравец: «Никогда не пыталась стать частью тусовки» Марина Кравец: «Никогда не пыталась стать частью тусовки»

Марина Кравец – об учебе на филфаке, тревогах материнства и строптивых женщинах

VOICE
Почему вы привлекаете недоброжелателей: 4 способа изменить расклад сил Почему вы привлекаете недоброжелателей: 4 способа изменить расклад сил

Как выстраивать барьеры в сложных отношениях и отстаивать свою точку зрения?

Psychologies
Тайная жизнь академизма Тайная жизнь академизма

Леонид Цхэ: рисование как перформанс

Weekend
Продолжение аудиосериала «Двоедушник» Саши Степановой Продолжение аудиосериала «Двоедушник» Саши Степановой

Отрывок из романа о двух мирах и душах, живущих в них

СНОБ
Этапы роста: как распознать аномалию Этапы роста: как распознать аномалию

Как понять, нормально ли развивается ваш ребенок?

Psychologies
Пивные миллионы: сколько в мире зарабатывают клубы и стадионы на кейтеринге Пивные миллионы: сколько в мире зарабатывают клубы и стадионы на кейтеринге

Сколько приносит продажа пенного напитка на стадионах?

Forbes
Туризм, каким мы его знаем: кто открыл отдых для людей? Туризм, каким мы его знаем: кто открыл отдых для людей?

Кто же поставил туризм на промышленные рельсы?

Maxim
«Насильно мил не будешь»: почему не стоит добиваться другого человека «Насильно мил не будешь»: почему не стоит добиваться другого человека

Стоит ли пытаться «завоевать», «покорить», «добиться» потенциального партнера?

Psychologies
Личные и общие границы в отношениях: как защитить свою территорию и перестать нападать на чужую Личные и общие границы в отношениях: как защитить свою территорию и перестать нападать на чужую

Как понять, кто и где вторгается в наше пространство, а где вы делаете это сами

Psychologies
6 простых способов взбодриться без кофе и таблеток 6 простых способов взбодриться без кофе и таблеток

Как справиться с сонливостью и отсутствием сил?

Psychologies
Билли Айлиш и Билл Гейтс: главные герои борьбы с изменением климата по версии Time Билли Айлиш и Билл Гейтс: главные герои борьбы с изменением климата по версии Time

Яркие и знаменитые личности, борющиеся с изменением климата

Forbes
Идти навстречу светилу! Идти навстречу светилу!

История института солнечно-земной физики уходит корнями в докосмическую эру

Наука и жизнь
От безработицы к дефициту кадров: как сломалась российская модель рынка труда От безработицы к дефициту кадров: как сломалась российская модель рынка труда

Что привело к нехватке рабочих рук и почему так сложно решить проблему вакансий

Forbes
Big Data под угрозой: почему бизнес больше не стремится узнать все о своих клиентах Big Data под угрозой: почему бизнес больше не стремится узнать все о своих клиентах

Почему гонка за клиентскими данными у крупного бизнеса замедлилась

Forbes
Как это развидеть Как это развидеть

Что мешает нам стирать воспоминания

N+1
Открыть в приложении