Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат

Валлас, О. С.; Вечур, О. В.

Публікація:
Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат

Файли

Bionika_2021-41-49.pdf (681.1 KB)

Дата

2021

Автори

Валлас, О. С.

Вечур, О. В.

Видавець

ХНУРЭ

Анотація

Розглянуто методи пошуку та кодування схожих послідовностей даних, та їх використання для покращення алгоритмів стиснення даних без втрат. Досліджено сучасні підходи до пошуку послідовностей з неточним збігом – тривіальні та евристичні методи, індексні методи та методи, що базуються на N-грамах. Розглянуто підходи кодування відмінностей з використанням відстані Левенштейна та Геммінга. Запропонована розширена структура алгоритму стиснення даних. Комбінації вищезазначених методів у складі запропонованої структури було протестовано на двох датасетах – датасеті англійського тексту «enwik8» та комбінованому датасеті «Silesia Corpus». При тестування оцінювались ступінь стиснення, швидкість кодування та декодування, та загальний баланс. У результаті було розроблено нову структуру алгоритмів стиснення даних та виявлено найбільш ефективні комбінації методів для компресії різних типів даних.

Ключові слова

стиснення даних без втрат, схожі послідовності даних, індексні методи, n-грами, відстань Левенштейна

Цитування

Валлас О. С. Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат / О. С. Валлас, О. В. Вечур // Бионика интеллекта : научно-технический журнал. – 2021. – № (96). – С. 41–49.

URI

https://openarchive.nure.ua/handle/document/23321

Колекції

Біоніка інтелекту

Повна сторінка документа

Публікація:
Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат

Файли

Дата

Автори

Назва журналу

ISSN журналу

Назва тому

Видавець

Дослідницькі проекти

Організаційні одиниці

Випуск журналу

Анотація

Опис

Ключові слова

Цитування

DOI

URI

Колекції

Схвалення

Рецензія

Доповнено

На які посилаються

Публікація: Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат

Файли

Дата

Автори

Назва журналу

ISSN журналу

Назва тому

Видавець

Дослідницькі проекти

Організаційні одиниці

Випуск журналу

Анотація

Опис

Ключові слова

Цитування

DOI

URI

Колекції

Схвалення

Рецензія

Доповнено

На які посилаються

Публікація:
Методи пошуку та кодування схожих послідовностей даних в алгоритмах стиснення даних без втрат