Публікація:
Використання асинхронних методів для підвищення ефективності Reinforcement Learning

Завантаження...
Зображення мініатюри

Дата

2025

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Метою роботи є дослідження ефективності, масштабованості та стабільності асинхронних actor-critic алгоритмів на прикладі A3C у порівнянні з іншими класичними алгоритмами навчання з підкріпленням. У результаті дослідження доведено, що алгоритм A3C забезпечує вищу ефективність та стабільність у порівнянні з одно- та багатокроковими методами на основі Q-learning і SARSA; новизна полягає у повноцінному порівнянні асинхронних підходів при змінній кількості потоків і різних умовах середовища. Результати роботи можуть бути використані при розробці адаптивних агентів у сфері автономного керування, симуляцій, ігрового AI та робототехніки. Запропоновані методики масштабованого асинхронного навчання можуть слугувати основою для створення ефективних рішень у ресурсно обмежених обчислювальних умовах.

Опис

Ключові слова

актор-критик, асинхронність, глибинне навчання, навчання з підкріпленням

Бібліографічний опис

Рубанов Є. О. Використання асинхронних методів для підвищення ефективності Reinforcement Learning : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / Є. О. Рубанов ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 89 с.

DOI