Публікація: Дослідження сучасних методів аугментації текстових даних
Завантаження...
Дата
2024
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
ХНУРЕ
Анотація
The goal of this work is to explore methods of text data augmentation, which involves creating new synthetic data similar to real ones, for machine learning tasks where available data is limited. Generative data augmentation is used to combat overfitting, but it has found limited application in Natural Language Processing. Simple augmentation methods like random insertions, replacements, and shuffling are too limited in their effectiveness. Substituting n-grams with synonyms is another method that can be used for data augmentation, as well as the application of intelligent models like Back translation and Style augmentation. The use of generative models such as C-BERT is a popular solution for the augmentation task. Prompt engineering is also becoming increasingly popular for creating queries that prompt the model to provide optimal responses.
Опис
Ключові слова
текстові дані, аугментація
Бібліографічний опис
Абросімов Є. О. Дослідження сучасних методів аугментації текстових даних / Є. О. Абросімов ; наук. керівник к. т. н., доц. А. О. Дейнеко // Радіоелектроніка та молодь у XXI столітті : матеріали 28-го Міжнар. молодіж. форуму, 16–18 квітня 2024 р. – Харків : ХНУРЕ, 2024. – Т. 6 – С. 35-36.