Публікація: Дослідження та розробка системи на базі великої мовної моделі для розважальних цілей
Завантаження...
Дата
2025
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
Анотація
Об’єкт дослідження – процеси мовної взаємодії людини з комп’ютерною системою в режимі реального часу за допомогою голосових технологій. Предмет дослідження – архітектурні, програмні та інтелектуальні компоненти інтерактивної голосової системи на базі великих мовних моделей, що функціонує у середовищі Discord. Мета роботи – розробити прототип інтерактивної голосової системи на основі технологій штучного інтелекту, здатної реалізовувати повноцінний цикл спілкування з користувачем у голосовому форматі: від розпізнавання мовлення до генерації та озвучення відповіді з мінімальною затримкою. Методи дослідження – у роботі використано методи архітектурного проєктування програмних систем, модульної розробки на Python, аналізу й інформації. Застосовано мовні моделі як хмарного, так і локального типу, модель розпізнавання мовлення Whisper та синтезатор Kokoro TTS із підтримкою зміни голосу. Взаємодія між компонентами реалізована через високопродуктивний GRPC-сервер для забезпечення низької затримки і масштабованості. Система здатна адаптуватися до різних стилів спілкування, підтримує багатокористувацьку комунікацію та є придатною для використання у таких сферах, як створення віртуальних стрімерів, освітніх платформ із голосовими асистентами, інтерактивних ігор, сервісів підтримки та цифрових компаньйонів.
Опис
Ключові слова
велика мовна модель, обробка природної мови, синтез мовлення
Бібліографічний опис
Небаба М. Ю. Дослідження та розробка системи на базі великої мовної моделі для розважальних цілей : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / М. Ю. Небаба ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 70 с.