Публікація:
Дослідження сучасних методів аугментації текстових даних

Завантаження...
Зображення мініатюри

Дата

Назва журналу

ISSN журналу

Назва тому

Видавець

ХНУРЕ

Дослідницькі проекти

Організаційні одиниці

Випуск журналу

Анотація

The goal of this work is to explore methods of text data augmentation, which involves creating new synthetic data similar to real ones, for machine learning tasks where available data is limited. Generative data augmentation is used to combat overfitting, but it has found limited application in Natural Language Processing. Simple augmentation methods like random insertions, replacements, and shuffling are too limited in their effectiveness. Substituting n-grams with synonyms is another method that can be used for data augmentation, as well as the application of intelligent models like Back translation and Style augmentation. The use of generative models such as C-BERT is a popular solution for the augmentation task. Prompt engineering is also becoming increasingly popular for creating queries that prompt the model to provide optimal responses.

Опис

Ключові слова

текстові дані, аугментація

Цитування

Абросімов Є. О. Дослідження сучасних методів аугментації текстових даних / Є. О. Абросімов ; наук. керівник к. т. н., доц. А. О. Дейнеко // Радіоелектроніка та молодь у XXI столітті : матеріали 28-го Міжнар. молодіж. форуму, 16–18 квітня 2024 р. – Харків : ХНУРЕ, 2024. – Т. 6 – С. 35-36.

DOI

Схвалення

Рецензія

Доповнено

На які посилаються