Публікація: Адаптивний підбір архітектури нейромережі для агентів у симульованих середовищах на основі NAS та RL
Завантаження...
Дата
2025
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
Анотація
Мета роботи : розробка системи, яка автоматично формує оптимальну архітектуру нейромережі для RL-агента. Методи: формування початкового набору архітектур через NAS-агента, короткий цикл навчання PPO-агентів у середовищі Cheetah, відбір найкращих архітектур за середньою винагородою, тривале тренування обраних варіантів для остаточного ранжування. Результати: створено систему, що забезпечує автоматизований вибір конфігурації нейромережі для навчання агента, мінімізуючи участь людини в ручному налаштуванні. Рішення демонструє високу ефективність та може бути розширене на інші типи симульованих середовищ або задач у робототехніці, автономних системах і машинному сприйнятті.
Опис
Ключові слова
PPO-агент, архітектура нейронної мережі, автоматизація підбору параметрів, адаптивне конструювання нейромереж
Бібліографічний опис
Балаба С. О. Адаптивний підбір архітектури нейромережі для агентів у симульованих середовищах на основі NAS та RL : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / С. О. Балаба ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 66 с.