Публікація:
Improving quality of music source separation in constrained and corrupted training data setting using loss masking

dc.contributor.authorMonastyrskyi, M.
dc.date.accessioned2026-04-18T16:38:15Z
dc.date.issued2025
dc.description.abstractThis work aims to explore the efficiency of the loss masking strategy for training deep music source separation models in a setting where training data is corrupted, specifically with bleeding artefacts. A soft loss masking training strategy, which assigns weights to batch loss values inversely proportional to their magnitude, is proposed and compared to hard loss masking, where weights are computed as binary masks based on whether the loss function value exceeds a certain threshold. An investigation is conducted to determine whether a soft loss masking approach yields better results than hard masking in settings with low training data availability. Results indicate that, under constrained training data conditions with bleeding artefacts, the soft masking approach outperforms the hard loss masking method, specifically for the vocal source. Alongside, the evaluation strategy based on neural network approximation of the MUSHRA score is presented to account for both subjective and objective components of the music source separation system quality evaluation. В поточній роботі досліджується ефективність використання підходу маскування функції втрат для тренування моделей розділення музичних сигналів в умовах наявності похибок в даних, зокрема артефактів перетікання. Пропонується стратегія м’якого маскування функції втрат, суть якої полягає в присвоєнні ваг значенням функції втрат у батчі обернено пропорційно до їхньої величини, і порівнюється з підходом жорсткого маскування, де ваги обчислюються як бінарні маски на основі того, чи перевищує значення функції втрат певний пороговий рівень. Проводиться дослідження щодо того, чи дає підхід м’якого маскування функції втрат кращі результати порівняно з жорстким маскуванням в умовах обмеженої кількості доступних навчальних даних. Результати засвідчують, що в умовах обмеженої кількості тренувальних даних, за умови наявності в них артефактів перетікання, підхід м’якого маскування дозволяє отримати кращі результати за підхід жорсткого маскування зокрема для виокремлення вокалу. Пропонується також метод оцінки результатів розділення заснований на апроксимації метрики MUSHRA з використанням нейронної мережі, задля врахування як об’єктивної так і суб’єктивної компоненти оцінки якості розділення сигналів системою.
dc.identifier.citationMonastyrskyi M. Improving quality of music source separation in constrained and corrupted training data setting using loss masking // Біоніка інтелекту. 2025. № 2(103). С. 34-39.
dc.identifier.doihttps://doi.org/10.30837/ bi.2025.2(103).05
dc.identifier.urihttps://openarchive.nure.ua/handle/document/34028
dc.language.isoen
dc.publisherХНУРЕ
dc.relation.ispartofseries2(103).
dc.subjectmusic source separation
dc.subjectloss masking
dc.subjectperceptual quality assessment
dc.subjectsignal processing
dc.subjectmachine learning
dc.subjectneural networks
dc.subjectрозділення музичних сигналів
dc.subjectмаскування функції втрат
dc.subjectоцінка сприйманої якості
dc.subjectобробка сигналів
dc.subjectмашинне навчання
dc.subjectнейронні мережі
dc.titleImproving quality of music source separation in constrained and corrupted training data setting using loss masking
dc.typeArticle
dspace.entity.typePublication

Файли

Оригінальний пакунок

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
5_103_34-39.pdf
Розмір:
127.58 KB
Формат:
Adobe Portable Document Format

Пакунок ліцензії

Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
license.txt
Розмір:
10.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: