Публікація: Покращення прозорості процесу прийняття рішень у моделях на базі трансформера в задачах динамічного розпізнавання виразів обличчя в реальних умовах
Завантаження...
Дата
Автори
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
Об’єкт дослідження – системи розпізнавання виразів обличчя в умовах реального світу. Предмет дослідження – методи покращення точності та пояснюваності моделей розпізнавання емоцій на основі графових і трансформерних архітектур. Мета роботи – розробити інтерпретовану модель розпізнавання виразів обличчя з використанням Spatio-Temporal Graph Transformer та інтегрувати її з системою емоційно-залежного синтезу мовлення Llasa. Методи дослідження – методи комп’ютерного зору, графових нейронних мереж, трансформерних моделей, а також підходи пояснювального ШІ для візуалізації важливих ознак і рішень моделі. У роботі розроблено модель Spatio-Temporal Graph Transformer для розпізнавання емоцій у відео на основі орієнтирів обличчя. Реалізовано обробку просторово-часових даних та інтегровано XAI-методи (Grad-CAM, attention attribution), що підвищують інтерпретованість. Проведено експерименти на послідовностях різної довжини. Результати демонструють високу точність і прозорість моделі.
Опис
Ключові слова
гібридна інтелектуальна система, графофий трансформер, динамічне розпізнавання виразів обличчя
Цитування
Кочкіна А. П. Покращення прозорості процесу прийняття рішень у моделях на базі трансформера в задачах динамічного розпізнавання виразів обличчя в реальних умовах : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / А. П. Кочкіна ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 68 с.