Публікація:
Дослідження підходів до розпізнавання рукописного тексту на зображеннях за допомогою CNN (Convolutional Neural Network)

Завантаження...
Зображення мініатюри

Дата

2025

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Об’єктом дослідження є процес автоматизованого розпізнавання рукописного тексту на зображеннях, що містять фрагменти тексту з різною якістю, стилями письма та шрифтами. Метою роботи є дослідження та реалізація ефективного методу розпізнавання рукописного тексту на зображеннях, здатної адаптуватися до варіативності рукописних стилів, із використанням згорткових нейронних мереж для підвищення точності автоматичного зчитування тексту в реальних умовах. Методи розробки та проєктування базуються на сучасних технологіях глибокого навчання, зокрема згорткових нейронних мережах (CNN), а також архітектурах типу CRNN, що поєднують просторову обробку зображень із послідовною обробкою ознак. Застосовано методи попередньої обробки даних (фільтрація шуму, бінаризація, нормалізація), генерації навчальних вибірок, перенавчання моделі з використанням відкритих датасетів, а також техніки оцінювання якості моделі (accuracy, CER, WER, та F1-score). Реалізація здійснювалася із застосуванням мов програмування Python та бібліотек OpenCV, Tkinter, PyTorch Lightning. В результаті роботи було реалізовано функціональну модель на базі згорткових нейронних мереж для розпізнавання рукописного тексту, що демонструє високу точність при роботі з текстом різного стилю, форми та якості. Модель протестовано на реальних і синтетичних зображеннях, проведено її порівняльну оцінку з класичними методами розпізнавання, підтверджено ефективність використання CNN для задач рукописного тексту. Отримані 5 результати доводять практичну цінність моделі для застосування у сфері цифрового архівування, автоматизації обробки документів та інтеграції в сучасні інформаційні системи.

Опис

Ключові слова

глибоке навчання, згорткова нейронна мережа, класифікація символів, розпізнавання зображень, рукописний текст

Бібліографічний опис

Берковський М. В. Дослідження підходів до розпізнавання рукописного тексту на зображеннях за допомогою CNN (Convolutional Neural Network) : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 121 – Інженерія програмного забезпечення / М. В. Берковський ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 97 с.

DOI