Публікація:
Інтеграція синтетичних та реальних даних для покращення виявлення та категоризації пропаганди

Завантаження...
Зображення мініатюри

Дата

Назва журналу

ISSN журналу

Назва тому

Видавець

Дослідницькі проекти

Організаційні одиниці

Випуск журналу

Анотація

Об'єкт дослідження– задача покращення класифікації текстової пропаганди. Предмет дослідження– використання синтетичних та людських даних для покращення класифікації пропаганди. Мета роботи– дослідити та оцінити роль штучного інтелекту у створенні та поширенні пропаганди, а також можливості використання поєднання синтетичної та людської пропаганди під час навчання класифікатора-трансформера для кращого розпізнавання пропаганди. Методи дослідження– теоретичний (збір та структуризація теоретичного матеріалу), експериментальний (генерація синтетичного датасету методом промптінгу, програмна реалізація класифікатора та його навчання). Методи розробки базуються на технологіях Python з фреймворками TensorFlow та Keras. У результаті роботи проведено теоретичний аналіз ролі штучного інтелекту в поширенні пропаганди та її генерації. Розглянуто різні вибірки тренувальних даних, архітектур трансформерів генерації та класифікації тексту, технік промптінгу, тощо. Проведення практичних дослідів передбачало генерацію синтетичної вибірки пропаганди та підбір архітектури класифікатора-трансформера. Отримані результати підтвердили покращення класифікації пропаганди при використанні поєднання людських та синтетичних даних для тренування класифікатора

Опис

Ключові слова

класифікація пропаганди, модель трансформера, природна мова, промптінг, пропаганда

Цитування

Іванова О. С. Інтеграція синтетичних та реальних даних для покращення виявлення та категоризації пропаганди : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / О. С. Іванова ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2024. – 92 с.

DOI

Схвалення

Рецензія

Доповнено

На які посилаються