Improving quality of music source separation in constrained and corrupted training data setting using loss masking

Monastyrskyi, M.

doi:https://doi.org/10.30837/ bi.2025.2(103).05

Публікація:
Improving quality of music source separation in constrained and corrupted training data setting using loss masking

dc.contributor.author	Monastyrskyi, M.
dc.date.accessioned	2026-04-18T16:38:15Z
dc.date.issued	2025
dc.description.abstract	This work aims to explore the efficiency of the loss masking strategy for training deep music source separation models in a setting where training data is corrupted, specifically with bleeding artefacts. A soft loss masking training strategy, which assigns weights to batch loss values inversely proportional to their magnitude, is proposed and compared to hard loss masking, where weights are computed as binary masks based on whether the loss function value exceeds a certain threshold. An investigation is conducted to determine whether a soft loss masking approach yields better results than hard masking in settings with low training data availability. Results indicate that, under constrained training data conditions with bleeding artefacts, the soft masking approach outperforms the hard loss masking method, specifically for the vocal source. Alongside, the evaluation strategy based on neural network approximation of the MUSHRA score is presented to account for both subjective and objective components of the music source separation system quality evaluation. В поточній роботі досліджується ефективність використання підходу маскування функції втрат для тренування моделей розділення музичних сигналів в умовах наявності похибок в даних, зокрема артефактів перетікання. Пропонується стратегія м’якого маскування функції втрат, суть якої полягає в присвоєнні ваг значенням функції втрат у батчі обернено пропорційно до їхньої величини, і порівнюється з підходом жорсткого маскування, де ваги обчислюються як бінарні маски на основі того, чи перевищує значення функції втрат певний пороговий рівень. Проводиться дослідження щодо того, чи дає підхід м’якого маскування функції втрат кращі результати порівняно з жорстким маскуванням в умовах обмеженої кількості доступних навчальних даних. Результати засвідчують, що в умовах обмеженої кількості тренувальних даних, за умови наявності в них артефактів перетікання, підхід м’якого маскування дозволяє отримати кращі результати за підхід жорсткого маскування зокрема для виокремлення вокалу. Пропонується також метод оцінки результатів розділення заснований на апроксимації метрики MUSHRA з використанням нейронної мережі, задля врахування як об’єктивної так і суб’єктивної компоненти оцінки якості розділення сигналів системою.
dc.identifier.citation	Monastyrskyi M. Improving quality of music source separation in constrained and corrupted training data setting using loss masking // Біоніка інтелекту. 2025. № 2(103). С. 34-39.
dc.identifier.doi	https://doi.org/10.30837/ bi.2025.2(103).05
dc.identifier.uri	https://openarchive.nure.ua/handle/document/34028
dc.language.iso	en
dc.publisher	ХНУРЕ
dc.relation.ispartofseries	2(103).
dc.subject	music source separation
dc.subject	loss masking
dc.subject	perceptual quality assessment
dc.subject	signal processing
dc.subject	machine learning
dc.subject	neural networks
dc.subject	розділення музичних сигналів
dc.subject	маскування функції втрат
dc.subject	оцінка сприйманої якості
dc.subject	обробка сигналів
dc.subject	машинне навчання
dc.subject	нейронні мережі
dc.title	Improving quality of music source separation in constrained and corrupted training data setting using loss masking
dc.type	Article
dspace.entity.type	Publication

Файли

Оригінальний пакунок

Зараз показано 1 - 1 з 1

Назва:: 5_103_34-39.pdf
Розмір:: 127.58 KB
Формат:: Adobe Portable Document Format

Завантажити

Пакунок ліцензії

Зараз показано 1 - 1 з 1

Назва:: license.txt
Розмір:: 10.74 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекції

Біоніка інтелекту

Публікація: Improving quality of music source separation in constrained and corrupted training data setting using loss masking

Файли

Оригінальний пакунок

Пакунок ліцензії

Колекції

Публікація:
Improving quality of music source separation in constrained and corrupted training data setting using loss masking