Виявлення веб-атак по HTTP запитам з використання технік NLP

Кавецький, М. С.Руженцев, В. І.2025-04-072025-04-072024Кавецький М. Виявлення веб-атак по HTTP запитам з використання технік NLP / М. Кавецький, В. Руженцев // Радіотехніка. – 2024. – Вип. 218. – С. 64–75. – DOI : https://doi.org/10.30837/rt.2024.3.218.05.https://openarchive.nure.ua/handle/document/30246Робота зосереджена на вдосконаленні методів виявлення веб-атак через аналіз HTTP-трафіку з використанням технік обробки природної мови (NLP) та моделей на базі трансформерів, зокрема BERT. Актуальність дослідження в галузі виявлення веб-атак підкреслюється значними досягненнями моделі, натренованої на розширеному датасеті, який містив 195 тисяч записів. Розроблена модель на основі BERT демонструє високу ефективність у виявленні веб-атак завдяки глибокому контекстному розумінню та сучасному токенізатору WordPiece, який краще обробляє рідкісні слова. На відміну від методів Doc2Vec, LSTM-CNN або Isolation Forest, наша модель враховує глобальні взаємозв'язки між словами, що підвищує її точність. Деякі попередні дослідження мають свої недоліки, зокрема, деякі з них не використовують новітні архітектури, що обмежує їх здатність досягти високої точності моделі. Крім того, інші дослідження, хоч і використовують сучасні архітектури, працюють з малими датасетами, що обмежує їхню здатність ефективно виявляти різноманітні типи атак та забезпечувати високу якість їх виявлення. Створена модель тренована на розширеному датасеті, що дозволило досягти значно кращих результатів у порівнянні з провідними аналогами в галузі виявлення веб-атак. Висока збалансована точність моделі на рівні 0,9998 підтверджує її ефективність та надійність, роблячи її потенційно важливим інструментом для кібербезпекових застосувань.ukHTTP запитNLPBERTархітектура transformerвиявлення веб-атакВиявлення веб-атак по HTTP запитам з використання технік NLPArticlehttps://doi.org/10.30837/rt.2024.3.218.05