Публікація: Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат
Завантаження...
Дата
2021
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
ХНУРЭ
Анотація
Розглянуто методи пошуку та кодування схожих послідовностей даних, та їх використання для покращення алгоритмів стиснення даних без втрат. Досліджено сучасні підходи до пошуку послідовностей з неточним збігом – тривіальні та евристичні методи, індексні методи та методи, що базуються на N-грамах. Розглянуто підходи кодування відмінностей з використанням відстані Левенштейна та Геммінга. Запропонована розширена структура алгоритму стиснення даних. Комбінації вищезазначених методів у складі запропонованої структури було протестовано на двох датасетах – датасеті англійського тексту «enwik8» та комбінованому датасеті «Silesia Corpus». При тестування оцінювались ступінь стиснення, швидкість кодування та декодування, та загальний баланс. У результаті було розроблено нову структуру алгоритмів стиснення даних та виявлено найбільш ефективні комбінації методів для компресії різних типів даних.
Опис
Ключові слова
стиснення даних без втрат, схожі послідовності даних, індексні методи, n-грами, відстань Левенштейна
Бібліографічний опис
Валлас О. С. Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат / О. С. Валлас, О. В. Вечур // Бионика интеллекта : научно-технический журнал. – 2021. – № (96). – С. 41–49.