Публікація: Порівняльний аналіз системи оптичного розпізнавання тексту TESSERACT OCR з моделями на базі глибоких нейронних мереж
Завантаження...
Дата
2025
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
ХНУРЕ
Анотація
Optical Character Recognition (OCR) systems have evolved from traditional approaches like TesseractOCR, which relies on classical image processing, to modern deep learning frameworks that integrate convolutional and recurrent neural networks. While TesseractOCR, a very popular system for solving tasks of Optical Character Recognition, it performs well on standardized text, but struggles with non-standard fonts, handwritten text, and low-quality images, whereas contemporary end-to-end neural models utilize data augmentation and language model post-processing to enhance accuracy. Transitioning from conventional OCR methods to deep learning – based solutions might significantly improve performance across diverse conditions, advancing document digitization and text recognition.
Опис
Ключові слова
розпізнавання тексту, оптичне розпізнавання
Бібліографічний опис
Абросімов Є. О. Порівняльний аналіз системи оптичного розпізнавання тексту TESSERACT OCR з моделями на базі глибоких нейронних мереж / Є. О. Абросімов, О. П. Зелений // Радіоелектроніка та молодь у ХХІ столітті : матеріали 29-го Міжнар. молодіжн. форуму, 16–18 квітня 2025 р. – Харків : ХНУРЕ, 2025. – Т. 6. – С. 555–557.