Публікація:
Оптичне розпізнававання тексту в історичних документах: ключові проблеми та іноваціні рішення

Завантаження...
Зображення мініатюри

Дата

Назва журналу

ISSN журналу

Назва тому

Видавець

ТОВ «Видавництво Ліра-К»

Дослідницькі проекти

Організаційні одиниці

Випуск журналу

Анотація

Optical Character Recognition (OCR) of historical documents is critically important not only for preserving cultural heritage and providing access to archival materials, but also for the modern printing industry, which increasingly turns to digitized classical texts and the reprinting of rare editions. However, this task is complicated by a number of specific challenges: from physical degradation and non-standard fonts in old prints to the diversity of handwriting in manuscripts. This paper analyzes the key difficulties of OCR applied to historical materials, examines current innovative approaches (specialized neural networks, page layout segmentation, language models for post-processing), and outlines future research directions relevant to both archival science and publishing. It is shown that combining modern machine learning technologies with an understanding of the particular features of historical sources significantly improves recognition quality and opens new possibilities for reprinting and editorial work with classical texts.

Опис

Ключові слова

оптичне розпізнававання тексту, текст в історичних документах

Цитування

Абросімов Є. О. Оптичне розпізнававання тексту в історичних документах: ключові проблеми та іноваціні рішення / Є. О. Абросімов, О. П. Зелений, А. О. Дейнеко // Поліграфічні, мультимедійні та web-технології : тези доп. X Міжнар. наук.-техн. конф., 14-17 травня 2025 р. – Київ : ТОВ «Видавництво Ліра-К», 2025. – Т. 1. – С. 100-102.

DOI

Схвалення

Рецензія

Доповнено

На які посилаються