Використання асинхронних методів для підвищення ефективності Reinforcement Learning

Рубанов, Є. О.Використання асинхронних методів для підвищення ефективності Reinforcement LearningMy University2025актор-критикасинхронністьглибинне навчаннянавчання з підкріпленнямMy UniversityMy University2025-10-072025-10-072025ukOtherРубанов Є. О. Використання асинхронних методів для підвищення ефективності Reinforcement Learning : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / Є. О. Рубанов ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 89 с.https://openarchive.nure.ua/handle/document/32923Метою роботи є дослідження ефективності, масштабованості та стабільності асинхронних actor-critic алгоритмів на прикладі A3C у порівнянні з іншими класичними алгоритмами навчання з підкріпленням. У результаті дослідження доведено, що алгоритм A3C забезпечує вищу ефективність та стабільність у порівнянні з одно- та багатокроковими методами на основі Q-learning і SARSA; новизна полягає у повноцінному порівнянні асинхронних підходів при змінній кількості потоків і різних умовах середовища. Результати роботи можуть бути використані при розробці адаптивних агентів у сфері автономного керування, симуляцій, ігрового AI та робототехніки. Запропоновані методики масштабованого асинхронного навчання можуть слугувати основою для створення ефективних рішень у ресурсно обмежених обчислювальних умовах.