Публікація:
Адаптивний підбір архітектури нейромережі для агентів у симульованих середовищах на основі NAS та RL

Завантаження...
Зображення мініатюри

Дата

2025

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Мета роботи : розробка системи, яка автоматично формує оптимальну архітектуру нейромережі для RL-агента. Методи: формування початкового набору архітектур через NAS-агента, короткий цикл навчання PPO-агентів у середовищі Cheetah, відбір найкращих архітектур за середньою винагородою, тривале тренування обраних варіантів для остаточного ранжування. Результати: створено систему, що забезпечує автоматизований вибір конфігурації нейромережі для навчання агента, мінімізуючи участь людини в ручному налаштуванні. Рішення демонструє високу ефективність та може бути розширене на інші типи симульованих середовищ або задач у робототехніці, автономних системах і машинному сприйнятті.

Опис

Ключові слова

PPO-агент, архітектура нейронної мережі, автоматизація підбору параметрів, адаптивне конструювання нейромереж

Бібліографічний опис

Балаба С. О. Адаптивний підбір архітектури нейромережі для агентів у симульованих середовищах на основі NAS та RL : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на першому (бакалаврському) рівні, спеціальність 122 Комп’ютерні науки / С. О. Балаба ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 66 с.

DOI