Публікація: Метод синтезу навчальної вибірки для трансформер моделей на базі навчання з підкріпленням
Завантаження...
Дата
Автори
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
У роботі представлено застосунок для побудови навчальної вибірки на текстових даних, що генеруються із залученням мовних моделей. Основна увага приділена алгоритму PPO, який навчає агент обирати найінформативніші приклади відповідно до reward-функції, що поєднує новизну, тематичну відповідність і структурну адекватність текстів. У результаті реалізовано систему, здатну формувати вибірку з високими показниками варіативності та релевантності. Проведено експериментальний аналіз, побудовано метрики й графіки, які підтверджують ефективність підходу в контексті генерації тренувальних даних для трансформерних моделей.
Опис
Ключові слова
генерація синтетичних даних, трансформер моделі, тематична сложність, семантична новизна, навчання з підкріпленням
Цитування
Крамаренко О. О. Метод синтезу навчальної вибірки для трансформер моделей на базі навчання з підкріпленням : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / О. О. Крамаренко ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 129 с.