Публікація:
Дослідження сучасних методів аугментації текстових даних

dc.contributor.authorАбросімов, Є. О.
dc.date.accessioned2024-09-11T13:49:44Z
dc.date.available2024-09-11T13:49:44Z
dc.date.issued2024
dc.description.abstractThe goal of this work is to explore methods of text data augmentation, which involves creating new synthetic data similar to real ones, for machine learning tasks where available data is limited. Generative data augmentation is used to combat overfitting, but it has found limited application in Natural Language Processing. Simple augmentation methods like random insertions, replacements, and shuffling are too limited in their effectiveness. Substituting n-grams with synonyms is another method that can be used for data augmentation, as well as the application of intelligent models like Back translation and Style augmentation. The use of generative models such as C-BERT is a popular solution for the augmentation task. Prompt engineering is also becoming increasingly popular for creating queries that prompt the model to provide optimal responses.
dc.identifier.citationАбросімов Є. О. Дослідження сучасних методів аугментації текстових даних / Є. О. Абросімов ; наук. керівник к. т. н., доц. А. О. Дейнеко // Радіоелектроніка та молодь у XXI столітті : матеріали 28-го Міжнар. молодіж. форуму, 16–18 квітня 2024 р. – Харків : ХНУРЕ, 2024. – Т. 6 – С. 35-36.
dc.identifier.urihttps://openarchive.nure.ua/handle/document/28625
dc.language.isouk
dc.publisherХНУРЕ
dc.subjectтекстові дані
dc.subjectаугментація
dc.titleДослідження сучасних методів аугментації текстових даних
dc.typeThesis
dspace.entity.typePublication

Файли

Оригінальний пакет
Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
T6_RiM_2024_35-36.pdf
Розмір:
133.32 KB
Формат:
Adobe Portable Document Format
Ліцензійний пакет
Зараз показано 1 - 1 з 1
Немає доступних мініатюр
Назва:
license.txt
Розмір:
9.55 KB
Формат:
Item-specific license agreed upon to submission
Опис: