Публікація:
Оптичне розпізнававання тексту в історичних документах: ключові проблеми та іноваціні рішення

dc.contributor.authorАбросімов, Є. О.
dc.contributor.authorЗелений, О. П.
dc.contributor.authorДейнеко, А. О.
dc.date.accessioned2025-05-25T18:02:20Z
dc.date.available2025-05-25T18:02:20Z
dc.date.issued2025
dc.description.abstractOptical Character Recognition (OCR) of historical documents is critically important not only for preserving cultural heritage and providing access to archival materials, but also for the modern printing industry, which increasingly turns to digitized classical texts and the reprinting of rare editions. However, this task is complicated by a number of specific challenges: from physical degradation and non-standard fonts in old prints to the diversity of handwriting in manuscripts. This paper analyzes the key difficulties of OCR applied to historical materials, examines current innovative approaches (specialized neural networks, page layout segmentation, language models for post-processing), and outlines future research directions relevant to both archival science and publishing. It is shown that combining modern machine learning technologies with an understanding of the particular features of historical sources significantly improves recognition quality and opens new possibilities for reprinting and editorial work with classical texts.
dc.identifier.citationАбросімов Є. О. Оптичне розпізнававання тексту в історичних документах: ключові проблеми та іноваціні рішення / Є. О. Абросімов, О. П. Зелений, А. О. Дейнеко // Поліграфічні, мультимедійні та web-технології : тези доп. X Міжнар. наук.-техн. конф., 14-17 травня 2025 р. – Київ : ТОВ «Видавництво Ліра-К», 2025. – Т. 1. – С. 100-102.
dc.identifier.urihttps://openarchive.nure.ua/handle/document/31262
dc.language.isouk
dc.publisherТОВ «Видавництво Ліра-К»
dc.subjectоптичне розпізнававання тексту
dc.subjectтекст в історичних документах
dc.titleОптичне розпізнававання тексту в історичних документах: ключові проблеми та іноваціні рішення
dc.typeConference proceedings
dspace.entity.typePublication

Файли

Оригінальний пакунок

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
PMW1-100-102.pdf
Розмір:
1016.92 KB
Формат:
Adobe Portable Document Format

Пакунок ліцензії

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
license.txt
Розмір:
9.55 KB
Формат:
Item-specific license agreed upon to submission
Опис: