Публікація:
Інтеграція синтетичних та реальних даних для покращення виявлення та категоризації пропаганди

Завантаження...
Зображення мініатюри

Дата

2024

Назва журналу

ISSN журналу

Назва тома

Видавництво

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Об'єкт дослідження– задача покращення класифікації текстової пропаганди. Предмет дослідження– використання синтетичних та людських даних для покращення класифікації пропаганди. Мета роботи– дослідити та оцінити роль штучного інтелекту у створенні та поширенні пропаганди, а також можливості використання поєднання синтетичної та людської пропаганди під час навчання класифікатора-трансформера для кращого розпізнавання пропаганди. Методи дослідження– теоретичний (збір та структуризація теоретичного матеріалу), експериментальний (генерація синтетичного датасету методом промптінгу, програмна реалізація класифікатора та його навчання). Методи розробки базуються на технологіях Python з фреймворками TensorFlow та Keras. У результаті роботи проведено теоретичний аналіз ролі штучного інтелекту в поширенні пропаганди та її генерації. Розглянуто різні вибірки тренувальних даних, архітектур трансформерів генерації та класифікації тексту, технік промптінгу, тощо. Проведення практичних дослідів передбачало генерацію синтетичної вибірки пропаганди та підбір архітектури класифікатора-трансформера. Отримані результати підтвердили покращення класифікації пропаганди при використанні поєднання людських та синтетичних даних для тренування класифікатора

Опис

Ключові слова

класифікація пропаганди, модель трансформера, природна мова, промптінг, пропаганда

Бібліографічний опис

Іванова О. С. Інтеграція синтетичних та реальних даних для покращення виявлення та категоризації пропаганди : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / О. С. Іванова ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 92 с.

DOI