Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

У берегов Явы обнаружили обломки черепов поздних эректусов У берегов Явы обнаружили обломки черепов поздних эректусов

Впервые были описаны фрагменты черепов архаичных людей, поднятые у острова Ява

N+1
Дмитрий Леонтьев. Грейдер в Небесный Иерусалим Дмитрий Леонтьев. Грейдер в Небесный Иерусалим

Надо ли так держаться за асфальт?

4x4 Club
Древнему жителю Китаю ампутировали ногу в наказание Древнему жителю Китаю ампутировали ногу в наказание

Ампутацию считают древнейшей хирургической операцией

N+1
Вопрос на засыпку: почему кислород назвали кислородом, если он не кислый? Вопрос на засыпку: почему кислород назвали кислородом, если он не кислый?

Почему кислород безвкусный?

ТехИнсайдер
Индивидуалистка из СССР: как Айн Рэнд боролась с коммунизмом и создавала бестселлеры Индивидуалистка из СССР: как Айн Рэнд боролась с коммунизмом и создавала бестселлеры

Как Айн Рэнд, дочь аптекаря из Петербурга, смогла покорить США

Forbes
12 шпионов из сериалов 12 шпионов из сериалов

Дюжина самых необычных шпионов на ТВ

Weekend
Обратная сторона комплиментов: что не стоит говорить — 5 запрещенных приемов Обратная сторона комплиментов: что не стоит говорить — 5 запрещенных приемов

Как правильно подчеркнуть уникальность человека?

Psychologies
Никакого сходства с реальностью: почему в Средневековье рисовали таких нелепых львов Никакого сходства с реальностью: почему в Средневековье рисовали таких нелепых львов

Искусство средневековых художников не отличалось реалистичностью изображения

ТехИнсайдер
Матчасть отечественного планеризма: самые известные планеры, созданные в СССР Матчасть отечественного планеризма: самые известные планеры, созданные в СССР

Изучаем матчасть советского планеризма

ТехИнсайдер
Невидимая болезнь: что важно знать о деменции Невидимая болезнь: что важно знать о деменции

Можно ли защититься от деменции и как сохранить ясность ума в пожилом возрасте

Правила жизни
Как доверие в обществе связано с богатством, демократией и долголетием Как доверие в обществе связано с богатством, демократией и долголетием

Как доверие влияет на долголетие, благосостояние граждан и демократию

Forbes
6 типичных ошибок в публичных выступлениях 6 типичных ошибок в публичных выступлениях

Как сделать свое выступление запоминающимся, ярким и полезным?

Psychologies
Пять знаменитых женщин, которые любили выпить Пять знаменитых женщин, которые любили выпить

И среди великих женщин встречались яркие личности, неравнодушные к алкоголю

Maxim
Высокобелковое питание обеспечило дрозофил и мышей крепким сном Высокобелковое питание обеспечило дрозофил и мышей крепким сном

Пища, богатая белком, снижает у плодовых мух и мышей пробуждаемость от сна

N+1
«Как прокачать устойчивость к переменам?»: 6 главных вопросов и ответов о жизни в трудные времена «Как прокачать устойчивость к переменам?»: 6 главных вопросов и ответов о жизни в трудные времена

Как позаботиться о себе и адаптироваться к новому в эпоху перемен?

Psychologies
Секонд-хенд с Патриков: как сервис ресейла люксовых сумок вырос в полтора раза за год Секонд-хенд с Патриков: как сервис ресейла люксовых сумок вырос в полтора раза за год

Как устроен ресейл люксовых сумок в России?

Forbes
Как модель Vogue Ли Миллер стала военным фоторепортером во время Второй мировой войны Как модель Vogue Ли Миллер стала военным фоторепортером во время Второй мировой войны

Модель и фотограф Ли Миллер главные свои снимки она сделала под бомбежками

Forbes
Мизантроп: псих или перестраховщик Мизантроп: псих или перестраховщик

Что такое мизантропия?

ТехИнсайдер
Дай лапу! Дай лапу!

Сотрудники фонда «РЭЙ» – о тех, с кем они не смогли расстаться

Новый очаг
Сладкая наука Сладкая наука

Наука бокса заключается не только в том, чтобы быстро двигаться и наносить удары

Вокруг света
Артериальное давление Артериальное давление

Что влияет на давление у здорового человека и можно ли его регулировать?

Здоровье
Клиника, мать и два дитя Клиника, мать и два дитя

«Медея»: русский хоррор осваивает античный миф

Weekend
Почему дергается глаз: рефлекс, о причинах которого мы не догадываемся Почему дергается глаз: рефлекс, о причинах которого мы не догадываемся

Что вызывает глазной тик и когда пора обратиться к врачу?

ТехИнсайдер
След тигра След тигра

Как складывается судьба проекта «Амурский тигр»

Вокруг света
Йога помогла девушке справиться с опытом изнасилования. Трагичная история Йога помогла девушке справиться с опытом изнасилования. Трагичная история

Девушка нашла необычный способ для преодоления травматичного опыта

ТехИнсайдер
Яркие краски Калмыкии Яркие краски Калмыкии

Чем удивляет Калмыкия своих гостей и ради чего сюда стоит приехать?

Отдых в России
Трудоголики, боссы и паникеры: кто работает по выходным и придется ли это делать вам Трудоголики, боссы и паникеры: кто работает по выходным и придется ли это делать вам

Останутся ли в ближайшем будущем выходные у «белых воротничков»?

Forbes
Чечевица Чечевица

Блюда из чечевицы заново обретают популярность, а мы разбираемся в их пользе

Здоровье
Как Land Cruiser, но вдвое дешевле: в России представили Tank 500 Как Land Cruiser, но вдвое дешевле: в России представили Tank 500

Большой рамный китайский внедорожник Tank 500 добрался до российского рынка

РБК
Полет на Маркс Полет на Маркс

Авангардистам редко удавалось осуществить свои утопические фантазии на практике

Правила жизни
Открыть в приложении