Публікація: Дослідження комбінування навчання з підкріпленням та мовних моделей для реалізації діалогових агентів
Завантаження...
Дата
2024
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
Анотація
В даній роботі розглядається варіант поєднання такої мовної моделі, як GTP-2 на базі трансформеру, та алгоритмів навчання з підкріпленням, а саме – алгоритмів з необмеженою кількістю станів та безперервним простором дій, таких, як Actor-Critic та його модифікації. В результаті досліджень вдалося побудувати архітектуру таск орієнтованої діалогової системи, яка дозволила підвищити якість відповідей. Було доведено, що офлайнове навчання з підкріпленням може успішно використовуватися у складних людських інтерактивних завданнях, таких, як діалог. Результати роботи можуть слугувати підґрунтям для створення таск-орієнтованих діалогових систем, які можуть бути успішно примінені у різноманітних галузях і затребувані у бізнесу.
Опис
Ключові слова
глибока нейронна мережа, діалогова система, механізм уваги, мовна модель, навчання з підкріпленням, трансформер
Бібліографічний опис
Бовдуй Р. В. Дослідження комбінування навчання з підкріпленням та мовних моделей для реалізації діалогових агентів : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / Р. В. Бовдуй ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 65 с.