Кваліфікаційні роботи бакалаврів (Бак_ШІ)
Постійний URI для цієї колекції
Перегляд
Перегляд Кваліфікаційні роботи бакалаврів (Бак_ШІ) за темою "PPO-агент"
Зараз показано 1 - 1 з 1
Результатів на сторінку
Варіанти сортування
Публікація Адаптивний підбір архітектури нейромережі для агентів у симульованих середовищах на основі NAS та RL(2025) Балаба, С. О.Мета роботи : розробка системи, яка автоматично формує оптимальну архітектуру нейромережі для RL-агента. Методи: формування початкового набору архітектур через NAS-агента, короткий цикл навчання PPO-агентів у середовищі Cheetah, відбір найкращих архітектур за середньою винагородою, тривале тренування обраних варіантів для остаточного ранжування. Результати: створено систему, що забезпечує автоматизований вибір конфігурації нейромережі для навчання агента, мінімізуючи участь людини в ручному налаштуванні. Рішення демонструє високу ефективність та може бути розширене на інші типи симульованих середовищ або задач у робототехніці, автономних системах і машинному сприйнятті.