Метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання

Лозинська, В.; Марків, О. О.; Висоцька, В. А.

doi:https://doi.org/10.30837/bi.2О25.1(1О2).О2

Публікація:
Метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання

dc.contributor.author	Лозинська, В.
dc.contributor.author	Марків, О. О.
dc.contributor.author	Висоцька, В. А.
dc.date.accessioned	2026-04-21T13:39:19Z
dc.date.issued	2025
dc.description.abstract	У представленому дослідженні розроблено метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання. Проаналізовано сучасні методи боротьби з дезінформацією та виявлення неправдивого контенту. В рамках роботи реалізовано систему ідентифікації фейків, побудовану на ансамблевому підході, а також описано її архітектурну структуру. Детально описано основні етапи очищення текстових даних, отриманих із соціальних мереж і повинних, зокрема нормалізацію категоріальних змінних. Проведено статистичний аналіз тексту та аналіз критеріїв виявлення джерел поширення дезінформації. Здійснено аналіз балансу цільових і допоміжних змінних, що дало змогу виявити залежності між мовою повідомлення та достовірністю. Для моделювання використано два різні типи текстових ембедингів та відповідні моделі класифікації: лінійну регресію та логістичну регресію. Підсумковим етапом стало застосування ансамблю моделей, що дало змогу поєднати прогностичну здатність обох моделей. Результати показали, що комбінація підходів покращує класифікаційну якість, особливо в умовах незбалансованих даних. Використання ансамблю моделей дало змогу збільшити точність з 73% (модель 1) та 71% (модель 2) до 78%. The presented study developed a method for detecting sources of disinformation based on ensemble machine learning models. Modem methods of combating disinformation and detecting false content were analyzed. A fake news identification system based on the ensemble approach was implemented as part of the work, and its architectural structure was described. The main stages of cleaning text data obtained from social networks and news are described in detaU, in particular, the normalization of categorical variables. Statistical analysis of the text and analysis of the criteria for identifying sources of disinformation distribution are carried out. An analysis of the balance of target and auxiliary variables was performed, which made it possible to identify dependencies between the language of the message and reliability. Two types of text embeddings and corresponding classification models were used for modeling: linear regression and logistic regression. The final stage was the application of an ensemble of models, which made it possible to combine the predictive ability of both models. The results showed that the combination of approaches improves classification quality, especially in conditions of imbalanced data. Using an ensemble of models allowed us to increase the accuracy from 73% (model 1) and 71% (model 2) to 78%.
dc.identifier.citation	Лозинська В., Марків О. О., Висоцька В. А. Метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання // Біоніка інтелекту. 2025. № 1(102). С. 11-19.
dc.identifier.doi	https://doi.org/10.30837/bi.2О25.1(1О2).О2
dc.identifier.uri	https://openarchive.nure.ua/handle/document/34143
dc.language.iso	uk
dc.publisher	ХНУРЕ
dc.relation.ispartofseries	1(102)
dc.subject	дезінформація
dc.subject	датасет
dc.subject	ансамблеві моделі
dc.subject	лінійна регресія
dc.subject	логістична регресія
dc.subject	ембединг
dc.subject	disinformation
dc.subject	dataset
dc.subject	machine learnin
dc.subject	ensemble models
dc.subject	linear regression
dc.subject	logistic regression
dc.subject	embedding
dc.title	Метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання
dc.type	Article
dspace.entity.type	Publication

Файли

Оригінальний пакунок

Зараз показано 1 - 1 з 1

Назва:: BI_102_11-19.pdf
Розмір:: 7.81 MB
Формат:: Adobe Portable Document Format

Завантажити

Пакунок ліцензії

Зараз показано 1 - 1 з 1

Назва:: license.txt
Розмір:: 10.74 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекції

Біоніка інтелекту

Публікація: Метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання

Файли

Оригінальний пакунок

Пакунок ліцензії

Колекції

Публікація:
Метод виявлення джерел дезінформації на основі ансамблевих моделей машинного навчання