Публікація:
Розробка системи динамічної оптимізації обсягів збереження даних у Data Lake на основі класифікації корисності даних

dc.contributor.authorМітрошкіна, К. В.
dc.date.accessioned2025-08-05T10:52:23Z
dc.date.available2025-08-05T10:52:23Z
dc.date.issued2025
dc.description.abstractОб’єкт дослідження – система управління обсягами даних у хмарному сховищі типу Data Lake. Предмет дослідження – методи динамічної оптимізації зберігання даних на основі класифікації їх корисності. Мета роботи – розробити систему автоматизованого управління обсягами збереження даних у Data Lake, яка дозволяє знижувати витрати на інфраструктуру за рахунок аналізу й класифікації корисності даних з використанням машинного навчання. Методи дослідження – аналіз літератури та сучасних підходів до зберігання даних у хмарних середовищах, моделювання, машинне навчання, побудова архітектури програмної системи, реалізація прототипу на основі Python та Apache Spark. У результаті роботи здійснено аналіз проблем надмірного зберігання даних у Data Lake, побудовано модель корисності даних на основі доступу, частоти використання та джерела надходження. Розроблено систему, що включає модуль класифікації даних, модуль моніторингу доступу та модуль застосування політик зберігання. Система протестована на реальних обсягах симульованих даних, що дозволило досягти зменшення витрат на зберігання до 38% без втрати критично важливої інформації. Виявлено обмеження поточної моделі та запропоновано шляхи подальшої оптимізації.
dc.identifier.citationМітрошкіна К. В. Розробка системи динамічної оптимізації обсягів збереження даних у Data Lake на основі класифікації корисності даних : пояснювальна записка до кваліфікаційної роботи здобувача вищої освіти на другому (магістерському) рівні, спеціальність 122 Комп’ютерні науки / К. В. Мітрошкіна ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2025. – 60 с.
dc.identifier.urihttps://openarchive.nure.ua/handle/document/32349
dc.language.isouk
dc.subjectархівація
dc.subjectжиттєвий цикл даних
dc.subjectхмарні технології
dc.subjectжиттєвий цикл даних
dc.subjectкласифікація корисності
dc.subjectконтроль доступу
dc.subjectоптимізація зберігання
dc.subjectполітики зберігання
dc.titleРозробка системи динамічної оптимізації обсягів збереження даних у Data Lake на основі класифікації корисності даних
dc.typeOther
dspace.entity.typePublication

Файли

Оригінальний пакет
Зараз показано 1 - 2 з 2
Завантаження...
Зображення мініатюри
Назва:
2025_M_ShI_Mitroshkina_kV.pdf
Розмір:
11.62 MB
Формат:
Adobe Portable Document Format
Завантаження...
Зображення мініатюри
Назва:
dodatok_Mitroshkina_kV.pdf
Розмір:
158.5 KB
Формат:
Adobe Portable Document Format
Ліцензійний пакет
Зараз показано 1 - 1 з 1
Немає доступних мініатюр
Назва:
license.txt
Розмір:
10.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: