Публікація:
Метод виявлення нечітких дублікатів електронних текстових файлів

Завантаження...
Зображення мініатюри

Дата

2013

Назва журналу

ISSN журналу

Назва тома

Видавництво

ХНУРЭ

Дослідницькі проекти

Організаційні підрозділи

Видання журналу

Анотація

В роботі здійснено аналіз методів виявлення нечітких дублікатів текстових файлів. Показано, що існуючі методи виявлення нечітких дублікатів спрямовані на мінімізацію обчислювальної складності з одночасним збільшенням повноти і точності алгоритму. У даній роботі запропоновано та протестовано гібридний метод, який дозволяє істотно поліпшити якість виявлення нечітких дублікатів при незначному збільшенні обчислювальної складності базового алгоритму.

Опис

Ключові слова

частотный алгоритм, шинглування, гібридний метод

Бібліографічний опис

Чалая, Л. Э. Метод виявлення нечітких дублікатів електронних текстових файлів [Текст] / Л.Э. Чалая, П.Ю. Попаденко // Бионика интеллекта. – 2013. – № 1 (80). – С. 88–92.

DOI