Публікація:
Дослідження підходів до аугментації текстових даних

Завантаження...
Зображення мініатюри

Дата

2024

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Об'єкт дослідження – процес навчання класифікатора на текстових даних для розпізнавання фейкових новин, вплив методів генерації синтетичних даних на результати роботи алгоритмів. Предмет дослідження – методи генерації синтетичних текстових даних. Метою даного дослідження є виявлення найбільш ефективного методу генерації синтетичних текстових даних. Методи дослідження – теорія обчислювального інтелекту; теорія штучних нейронних мереж; теорія оптимізації і статистичний аналіз; імітаційне моделювання. Припускається що задача класифікації текстових даних, а разом з тим і аугментації табличних даних для виявлення таких характеристик як маніпуляції, емоційне забарвлення та стиль тексту, є вкрай важливою задачею в 21 столітті адже абсолютна більшість інформації в мережі Інтернет представлена в текстовому вигляді і її оптимальна обробка обіцяє значні покращення для нашого виду.

Опис

Ключові слова

аугментація, навчання зі вчителем, текстові дані, BERT, LLM

Бібліографічний опис

Абросімов Є. О. Дослідження підходів до аугментації текстових даних : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / Є. О. Абросімов ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 66 с.

DOI