Публікація:
Нечітка кластеризація часових рядів в інтелектуальному аналізі потоків даних

Завантаження...
Зображення мініатюри

Дата

2019

Назва журналу

ISSN журналу

Назва тома

Видавництво

ХНУРЕ

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

На сьогоднішній час тенденція обробки великих обсягів інформації та їх аналіз за допомогою кластеризації дає змогу зрозуміти різноманіття процесів для її подальшого використання у сферах життєдіяльності, що супроводжують людину.Значну частину інформації, пов’язану з обробкою великих обсягів даних, містять часові ряди. Однак, однією з типових проблем обробки часових рядів є їх нерівномірне квантування та багатовимірність.Предметом дослідження є методи інтелектуального аналізу для нечіткої онлайн кластеризації багатовимірних часових рядів з нерівномірними та асинхронними тактами квантування, що призначені для аналізу потоків даних. Розглянуто питання розвитку та використання методів нечіткої кластеризації в умовах недостатньої кількості спостережень та забрудненості оброблюваних даних. Наведено огляд технологій для вирішення задач класифікації, кластеризації та фільтрації. Запропоновано метод нечіткої кластеризації, який ефективно працює за умов перетину класів та несхильний до ефекту концентрації норм та працює в онлайн режимі з асинхронними нерівномірно квантованими часовими рядами за рахунок використання спеціальної цільової функції. Запроваджений метод може бути корисний при вирішенні завдань, що виникають в рамках інтелектуального аналізу потоків даних, коли вихідні дані мають високу розмірність. Запропоновано послідовний онлайн метод кластеризації багатовимірних часових рядів, що базується на апараті гібридних систем обчислювального інтелекту, який дозволяє вирішувати задачу кластеризації даних, які послідовно надходять на обробку, з нерівномірними тактами квантування. Розроблено метод адаптивної ймовірнісної та можливісної кластеризації, що базується на метриці спеціального вигляду, в основі якої лежить аналіз тангенсів кутів нахилу часового ряду, що дозволило спростити чисельну реалізацію методу та розв’язувати задачу кластеризації нерівномірно квантованих часових рядів і формалізувати розв’язання задачі нечіткої кластеризації коротких часових рядів. Відмінною особливістю методики є оцінка якості кожного розбиття і вибір найкращого з них. Запропоновано метод робастної адаптивної ідентифікації нестаціонарних часових рядів, що в онлайн режимі надходять на обробку, який характеризується простотою обчислювальної реалізації та стійкістю до аномальних викидів. Розглянутий метод простий у чисельній реалізації, будучи по суті градієнтним методом оптимізації цільових функцій спеціального виду. Проведено низку імітаційних експериментів на основі тестових та реальних даних, результати яких підтверджують доцільність застосування запропонованого підходу для вирішення задач інтелектуального аналізу потоків даних. Розв’язано практичну задачу на базі розроблених методів кластеризації для вирішення медичної проблеми захворювання серцево-судинної системи. The offered fuzzy clustering method works effectively under conditions of classes overlapping and is free from the norms concentration effect under online mode with asynchronous non-stationary quantized time series through a special objective function. The offered sequential online clustering method for multidimensional time series, based on the apparatus of hybrid systems of computational intelligence, enables solves the problem of clustering data that are sequentially send to processing with non-stationary quantization cycles. The developed method of adaptive modification based on probabilistic and possibilistic clustering based on a special type metric stemming from slope ratio analysis of the time series, that simplifies the numerical implementation of the methods and solves the clustering problem for non-stationary quantized time series. The offered model of robust adaptive identification of non-stationary time series, under online mode, of data flow, characterized by simple computational implementation and resistance to anomalous emissions.

Опис

Ключові слова

часові ряди, нечітка кластеризація часових рядів, асинхронність квантування, онлайн метод нечіткої кластеризації, адаптивні методи навчання, інтелектуальний аналіз даних, робастні цільові функції, нестаціонарні нелінійні часові ряди, ймовірнісна кластеризація, можливісна кластеризація, time series, fuzzy clustering of time series, asynchronous quantization, online fuzzy clustering procedure, adaptive learning procedures, data stream mining, robust objective functions, nonstationary time series, probabilistic clustering, possibilistic clustering

Бібліографічний опис

Кобилін І. О. Нечітка кластеризація часових рядів в інтелектуальному аналізі потоків даних : автореф. дис. ... канд. техн. наук : 05.13.23 "Системи та засоби штучного інтелекту" ; наук. кер. Бодянський Є. В., д-р техн. наук, проф. / І. О. Кобилін ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2019. – 18 с.

DOI

Колекції