Публікація:
Метод синтезу навчальної вибірки для трансформер моделей на базі навчання з підкріпленням

Завантаження...
Зображення мініатюри

Дата

Назва журналу

ISSN журналу

Назва тому

Видавець

Дослідницькі проекти

Організаційні одиниці

Випуск журналу

Анотація

У роботі представлено застосунок для побудови навчальної вибірки на текстових даних, що генеруються із залученням мовних моделей. Основна увага приділена алгоритму PPO, який навчає агент обирати найінформативніші приклади відповідно до reward-функції, що поєднує новизну, тематичну відповідність і структурну адекватність текстів. У результаті реалізовано систему, здатну формувати вибірку з високими показниками варіативності та релевантності. Проведено експериментальний аналіз, побудовано метрики й графіки, які підтверджують ефективність підходу в контексті генерації тренувальних даних для трансформерних моделей.

Опис

Ключові слова

генерація синтетичних даних, трансформер моделі, тематична сложність, семантична новизна, навчання з підкріпленням

Цитування

Крамаренко О. О. Метод синтезу навчальної вибірки для трансформер моделей на базі навчання з підкріпленням : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / О. О. Крамаренко ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 129 с.

DOI

Схвалення

Рецензія

Доповнено

На які посилаються