Публікація:
Аналіз впливу використання контекстуальних ембедингів на точність класифікації тексту

Завантаження...
Зображення мініатюри

Дата

2024

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Метою даного дослідження є аналіз впливу використання Contextual та Word ембедінгів на точність класифікації текстових масивів. Contextual ембединги є сучасним методом представлення слів, який враховує семантичний контекст слів у тексті, що може впливати на точність аналізу текстового контенту. На відміну від Contextual ембедингів, Word ембединги захоплюють лише статичну інформацію про слова і не враховують їх семантичний зв'язок у конкретному контексті. У ході виконання кваліфікаційної роботи були проведені дослідження, в ході яких було порівняно різні стратегії та підходи до використання ембедингів у задачах класифікації тексту. За результатами дослідження було встановлено, що найкращою моделлю Word Embedding є GloVe, яка продемонструвала кінцеву точність на рівні 87.72%. Це було вище, ніж у моделі Word2Vec з точністю 86.87%. У контексті Contextual Embedding, BERT виявився ефективнішим порівняно з GPT, з кінцевою точністю 91.23% проти 89.45% в GPT. Ці результати свідчать про перевагу Contextual Embedding у завданнях обробки природної мови і підтверджують їхню перспективність для сучасних додатків та систем текстового аналізу.

Опис

Ключові слова

класифікація тексту, word embedding, contextual embedding, LSTM, Word2Vec, точність прогнозування, обробка природної мови

Бібліографічний опис

Воропаєва К. А. Аналіз впливу використання контекстуальних ембедингів на точність класифікації тексту : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 123 Комп'ютерна інженерія / К. А. Воропаєва ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 87 с.

DOI