Публікація:
Дослідження моделей компʼютерного зору для вирішення задачі розпізнавання обʼєктів та тексту

dc.contributor.authorОмельченко, М. Д.
dc.date.accessioned2026-02-07T17:40:08Z
dc.date.issued2025
dc.description.abstractОб’єкт дослідження – процес аналізу зображень із використанням сучасних мультимодальних моделей комп’ютерного зору та обробки природної мови. Предмет дослідження – методи та моделі розпізнавання об’єктів і тексту на зображеннях у межах vision-language підходу. Мета роботи – теоретичне та експериментальне дослідження можливостей мультимодальних vision-language моделей для вирішення задач розпізнавання об’єктів, оптичного розпізнавання тексту та комбінованого аналізу сцен. Методи дослідження – аналіз і узагальнення наукових публікацій, теоретичне моделювання, експериментальне дослідження роботи мультимодальної моделі у режимі inference, порівняльний аналіз результатів. У роботі досліджено можливості застосування мультимодальних моделей для вирішення задач аналізу зображень без спеціалізованого донавчання. Показано, що формулювання завдання у вигляді текстової інструкції дозволяє отримувати структуровані результати у вигляді описів об’єктів, координат обмежувальних прямокутників та розпізнаного тексту. Отримані результати підтверджують перспективність мультимодального підходу для побудови універсальних систем комп’ютерного зору.
dc.identifier.citationОмельченко М. Д. Дослідження моделей компʼютерного зору для вирішення задачі розпізнавання обʼєктів та тексту : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / М. Д. Омельченко ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 61 с.
dc.identifier.urihttps://openarchive.nure.ua/handle/document/33683
dc.language.isouk
dc.subjectкомп’ютерний зір
dc.subjectмультимодальна модель
dc.subjectоптичне розпізнавання тексту
dc.subjectvision-language підхід
dc.titleДослідження моделей компʼютерного зору для вирішення задачі розпізнавання обʼєктів та тексту
dc.typeOther
dspace.entity.typePublication

Файли

Оригінальний пакунок

Зараз показано 1 - 2 з 2
Завантаження...
Зображення мініатюри
Назва:
2025_M_ShI_Omelchenko_MD.pdf
Розмір:
860.65 KB
Формат:
Adobe Portable Document Format
Завантаження...
Зображення мініатюри
Назва:
2025_M_ShI_Omelchenko_dodatok.pdf
Розмір:
853.48 KB
Формат:
Adobe Portable Document Format

Пакунок ліцензії

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
license.txt
Розмір:
10.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: