Публікація:
Метод синтезу навчальної вибірки для LLM на основі методу навчання з підкріпленням

dc.contributor.authorБондаренко, Д. К.
dc.date.accessioned2025-03-03T17:01:14Z
dc.date.available2025-03-03T17:01:14Z
dc.date.issued2025
dc.description.abstractМета роботи – розробити та впровадити ефективний підхід до створення синтетичного текстового датасету для навчання великих мовних моделей, використовуючи навчання з підкріпленням, оцінювання відповідей моделі та техніки перефразування для розширення датасету. Методи дослідження – аналіз даних, експеримент, створення алгоритмів, валідація. У результаті роботи було розроблено підхід до створення синтетичного датасету для навчання великих мовних моделей за допомогою навчання з підкріпленням. Модель попередньо навчалася на великому обсязі немічених текстових даних, а потім отримувала запити з попередньо визначеного набору. Для розширення датасету відповіді перефразовувалися та перекладалися на кілька мов. Отриманий підхід дозволяє ефективно генерувати високоякісні дані для навчання великих мовних моделей, що сприяє покращенню їх продуктивності та здатності працювати з багатомовними даними.
dc.identifier.citationБондаренко Д. К. Метод синтезу навчальної вибірки для LLM на основі методу навчання з підкріпленням : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / Д. К. Бондаренко ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 76 с.
dc.identifier.urihttps://openarchive.nure.ua/handle/document/29956
dc.language.isouk
dc.subjectоцінювання тексту
dc.subjectвеликі мовні моделі
dc.subjectнавчання з підкріпленням
dc.subjectсинтетичні дані
dc.titleМетод синтезу навчальної вибірки для LLM на основі методу навчання з підкріпленням
dc.typeOther
dspace.entity.typePublication

Файли

Оригінальний пакет
Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
2025_M_ShI_Bondarenko_DK.pdf
Розмір:
1.7 MB
Формат:
Adobe Portable Document Format
Ліцензійний пакет
Зараз показано 1 - 1 з 1
Немає доступних мініатюр
Назва:
license.txt
Розмір:
9.55 KB
Формат:
Item-specific license agreed upon to submission
Опис: