Публікація:
Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат

Завантаження...
Зображення мініатюри

Дата

2021

Назва журналу

ISSN журналу

Назва тома

Видавництво

ХНУРЭ

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

Розглянуто методи пошуку та кодування схожих послідовностей даних, та їх використання для покращення алгоритмів стиснення даних без втрат. Досліджено сучасні підходи до пошуку послідовностей з неточним збігом – тривіальні та евристичні методи, індексні методи та методи, що базуються на N-грамах. Розглянуто підходи кодування відмінностей з використанням відстані Левенштейна та Геммінга. Запропонована розширена структура алгоритму стиснення даних. Комбінації вищезазначених методів у складі запропонованої структури було протестовано на двох датасетах – датасеті англійського тексту «enwik8» та комбінованому датасеті «Silesia Corpus». При тестування оцінювались ступінь стиснення, швидкість кодування та декодування, та загальний баланс. У результаті було розроблено нову структуру алгоритмів стиснення даних та виявлено найбільш ефективні комбінації методів для компресії різних типів даних.

Опис

Ключові слова

стиснення даних без втрат, схожі послідовності даних, індексні методи, n-грами, відстань Левенштейна

Бібліографічний опис

Валлас О. С. Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат / О. С. Валлас, О. В. Вечур // Бионика интеллекта : научно-технический журнал. – 2021. – № (96). – С. 41–49.

DOI