Публікація:
Вплив розміру кадру на розпізнавання емоції за мовленням

dc.contributor.authorСуворов, Д. С.
dc.contributor.authorАфанасьєва, І. В.
dc.contributor.authorОнищенко, К. Г.
dc.contributor.authorКалиниченко, О. В.
dc.date.accessioned2026-04-23T11:49:32Z
dc.date.issued2023
dc.description.abstractУ задачі розпізнавання емоції за мовленням, як і у більшості задач машинного навчання розпізнавання за звуком, використовується так званий фреймінг. Це процес поділу вихідного аудіосигналу на кадри певного розміру, кожен з яких оброблюється окремо. У цій статті представлено порівняння впливу розміру кадрів на результат розпізнавання емоції на прикладі CNN мережі. Для експериментів використовувався набір CREMA-D із аугментаціями, використовуючи додавання шуму, розтягування у часі та зміну висоти тону. В ході досліджень вдалося досягти точності розпізнавання в 98,8% із використанням динамічного розміру кадру.
dc.identifier.citationСуворов Д. С., Афанасьєва І. В, Онищенко К. Г., Калиниченко О. В. Вплив розміру кадру на розпізнавання емоції за мовленням // Біоніка інтелекту. 2023. № 1(99). С. 44-51.
dc.identifier.doihttps://doi.org/10.30837/bi.2023.1(99).06
dc.identifier.urihttps://openarchive.nure.ua/handle/document/34205
dc.language.isouk
dc.publisherХНУРЕ
dc.subjectаудіо
dc.subjectемоції
dc.subjectкадр
dc.subjectмашинне навчання
dc.subjectнейронні мережі
dc.subjectрозпізнавання
dc.subjectpython
dc.subjecttensorflow
dc.titleВплив розміру кадру на розпізнавання емоції за мовленням
dc.typeArticle
dspace.entity.typePublication

Файли

Оригінальний пакунок

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
6_99_44_51.pdf
Розмір:
1.57 MB
Формат:
Adobe Portable Document Format

Пакунок ліцензії

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
license.txt
Розмір:
10.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: