Публікація: Дослідження підходів до аугментації текстових даних
Завантаження...
Дата
2024
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
Анотація
Об'єкт дослідження – процес навчання класифікатора на текстових даних для розпізнавання фейкових новин, вплив методів генерації синтетичних даних на результати роботи алгоритмів. Предмет дослідження – методи генерації синтетичних текстових даних. Метою даного дослідження є виявлення найбільш ефективного методу генерації синтетичних текстових даних. Методи дослідження – теорія обчислювального інтелекту; теорія штучних нейронних мереж; теорія оптимізації і статистичний аналіз; імітаційне моделювання. Припускається що задача класифікації текстових даних, а разом з тим і аугментації табличних даних для виявлення таких характеристик як маніпуляції, емоційне забарвлення та стиль тексту, є вкрай важливою задачею в 21 столітті адже абсолютна більшість інформації в мережі Інтернет представлена в текстовому вигляді і її оптимальна обробка обіцяє значні покращення для нашого виду.
Опис
Ключові слова
аугментація, навчання зі вчителем, текстові дані, BERT, LLM
Бібліографічний опис
Абросімов Є. О. Дослідження підходів до аугментації текстових даних : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / Є. О. Абросімов ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 66 с.