Публікація: Використання асинхронних методів для підвищення ефективності Reinforcement Learning
Завантаження...
Дата
2025
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
Анотація
Метою роботи є дослідження ефективності, масштабованості та стабільності асинхронних actor-critic алгоритмів на прикладі A3C у порівнянні з іншими класичними алгоритмами навчання з підкріпленням. У результаті дослідження доведено, що алгоритм A3C забезпечує вищу ефективність та стабільність у порівнянні з одно- та багатокроковими методами на основі Q-learning і SARSA; новизна полягає у повноцінному порівнянні асинхронних підходів при змінній кількості потоків і різних умовах середовища. Результати роботи можуть бути використані при розробці адаптивних агентів у сфері автономного керування, симуляцій, ігрового AI та робототехніки. Запропоновані методики масштабованого асинхронного навчання можуть слугувати основою для створення ефективних рішень у ресурсно обмежених обчислювальних умовах.
Опис
Ключові слова
актор-критик, асинхронність, глибинне навчання, навчання з підкріпленням
Бібліографічний опис
Рубанов Є. О. Використання асинхронних методів для підвищення ефективності Reinforcement Learning : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / Є. О. Рубанов ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 89 с.