Публікація: Аналіз впливу використання контекстуальних ембедингів на точність класифікації тексту
Завантаження...
Дата
2024
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
Анотація
Метою даного дослідження є аналіз впливу використання Contextual та Word ембедінгів на точність класифікації текстових масивів. Contextual ембединги є сучасним методом представлення слів, який враховує семантичний контекст слів у тексті, що може впливати на точність аналізу текстового контенту. На відміну від Contextual ембедингів, Word ембединги захоплюють лише статичну інформацію про слова і не враховують їх семантичний зв'язок у конкретному контексті. У ході виконання кваліфікаційної роботи були проведені дослідження, в ході яких було порівняно різні стратегії та підходи до використання ембедингів у задачах класифікації тексту. За результатами дослідження було встановлено, що найкращою моделлю Word Embedding є GloVe, яка продемонструвала кінцеву точність на рівні 87.72%. Це було вище, ніж у моделі Word2Vec з точністю 86.87%. У контексті Contextual Embedding, BERT виявився ефективнішим порівняно з GPT, з кінцевою точністю 91.23% проти 89.45% в GPT. Ці результати свідчать про перевагу Contextual Embedding у завданнях обробки природної мови і підтверджують їхню перспективність для сучасних додатків та систем текстового аналізу.
Опис
Ключові слова
класифікація тексту, word embedding, contextual embedding, LSTM, Word2Vec, точність прогнозування, обробка природної мови
Бібліографічний опис
Воропаєва К. А. Аналіз впливу використання контекстуальних ембедингів на точність класифікації тексту : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 123 Комп'ютерна інженерія / К. А. Воропаєва ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 87 с.