Публікація:
Метод 1-бітового квантування ваг для великих мовних моделей

Завантаження...
Зображення мініатюри

Дата

2025

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Метою роботи є аналіз можливостей використання методу 1-бітового квантування ваг для великих мовних моделей, оцінка його впливу на точність і продуктивність, а також розробка рекомендацій щодо впровадження цього методу в реальні задачі. У дослідженні здійснено теоретичний аналіз літератури, розроблено алгоритми, проведено експерименти на реальних моделях і здійснено статистичний аналіз отриманих результатів. Робота включає огляд теоретичних основ квантування ваг із фокусом на 1-бітове квантування, що дозволяє значно скоротити обчислювальні ресурси без суттєвого зниження точності. Проведено експериментальне дослідження для оцінки ефективності цього підходу на великих мовних моделях. Отримані результати підтверджують можливість використання методу у середовищах із обмеженими ресурсами. Практичне значення роботи полягає в розширенні доступності великих мовних моделей через зниження їхньої обчислювальної складності, що сприяє їх впровадженню у мобільні пристрої та інші обмежені середовища

Опис

Ключові слова

велика мовна модель, квантування, обчислювальні витрати

Бібліографічний опис

Приходько Д. М. Метод 1-бітового квантування ваг для великих мовних моделей : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / Д. М. Приходько ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 71 с.

DOI