Бовдуй, Р. В.2024-08-112024-08-112024Бовдуй Р. В. Дослідження комбінування навчання з підкріпленням та мовних моделей для реалізації діалогових агентів : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / Р. В. Бовдуй ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 65 с.https://openarchive.nure.ua/handle/document/27733В даній роботі розглядається варіант поєднання такої мовної моделі, як GTP-2 на базі трансформеру, та алгоритмів навчання з підкріпленням, а саме – алгоритмів з необмеженою кількістю станів та безперервним простором дій, таких, як Actor-Critic та його модифікації. В результаті досліджень вдалося побудувати архітектуру таск орієнтованої діалогової системи, яка дозволила підвищити якість відповідей. Було доведено, що офлайнове навчання з підкріпленням може успішно використовуватися у складних людських інтерактивних завданнях, таких, як діалог. Результати роботи можуть слугувати підґрунтям для створення таск-орієнтованих діалогових систем, які можуть бути успішно примінені у різноманітних галузях і затребувані у бізнесу.ukглибока нейронна мережадіалогова системамеханізм увагимовна модельнавчання з підкріпленнямтрансформерДослідження комбінування навчання з підкріпленням та мовних моделей для реалізації діалогових агентівOther