Публікація: Дослідження моделей компʼютерного зору для вирішення задачі розпізнавання обʼєктів та тексту
| dc.contributor.author | Омельченко, М. Д. | |
| dc.date.accessioned | 2026-02-07T17:40:08Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Об’єкт дослідження – процес аналізу зображень із використанням сучасних мультимодальних моделей комп’ютерного зору та обробки природної мови. Предмет дослідження – методи та моделі розпізнавання об’єктів і тексту на зображеннях у межах vision-language підходу. Мета роботи – теоретичне та експериментальне дослідження можливостей мультимодальних vision-language моделей для вирішення задач розпізнавання об’єктів, оптичного розпізнавання тексту та комбінованого аналізу сцен. Методи дослідження – аналіз і узагальнення наукових публікацій, теоретичне моделювання, експериментальне дослідження роботи мультимодальної моделі у режимі inference, порівняльний аналіз результатів. У роботі досліджено можливості застосування мультимодальних моделей для вирішення задач аналізу зображень без спеціалізованого донавчання. Показано, що формулювання завдання у вигляді текстової інструкції дозволяє отримувати структуровані результати у вигляді описів об’єктів, координат обмежувальних прямокутників та розпізнаного тексту. Отримані результати підтверджують перспективність мультимодального підходу для побудови універсальних систем комп’ютерного зору. | |
| dc.identifier.citation | Омельченко М. Д. Дослідження моделей компʼютерного зору для вирішення задачі розпізнавання обʼєктів та тексту : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / М. Д. Омельченко ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 61 с. | |
| dc.identifier.uri | https://openarchive.nure.ua/handle/document/33683 | |
| dc.language.iso | uk | |
| dc.subject | комп’ютерний зір | |
| dc.subject | мультимодальна модель | |
| dc.subject | оптичне розпізнавання тексту | |
| dc.subject | vision-language підхід | |
| dc.title | Дослідження моделей компʼютерного зору для вирішення задачі розпізнавання обʼєктів та тексту | |
| dc.type | Other | |
| dspace.entity.type | Publication |
Файли
Оригінальний пакунок
1 - 2 з 2
Завантаження...
- Назва:
- 2025_M_ShI_Omelchenko_MD.pdf
- Розмір:
- 860.65 KB
- Формат:
- Adobe Portable Document Format
Завантаження...
- Назва:
- 2025_M_ShI_Omelchenko_dodatok.pdf
- Розмір:
- 853.48 KB
- Формат:
- Adobe Portable Document Format
Пакунок ліцензії
1 - 1 з 1
Завантаження...
- Назва:
- license.txt
- Розмір:
- 10.74 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: