Публікація: Метод виявлення нечітких дублікатів електронних текстових документів
Завантаження...
Дата
Автори
Назва журналу
ISSN журналу
Назва тому
Видавець
ХНУРЭ
Анотація
В роботі здійснено аналіз методів виявлення нечітких дублікатів текстових файлів. Показано, що існуючі методи виявлення нечітких дублікатів спрямовані на мінімізацію обчислювальної складності з одночасним збільшенням повноти і точності алгоритму. У даній роботі запропоновано та протестовано гібридний метод, який дозволяє істотно поліпшити якість виявлення нечітких дублікатів при незначному збільшенні обчислювальної складності базового алгоритму.
Опис
Ключові слова
нечіткі дублікати, частотний алгоритм, шинглування, гібридний метод
Цитування
Чала Л. Е., Попаденко П. Ю. Метод виявлення нечітких дублікатів електронних текстових документів // Бионика интеллекта. 2013. № 1 (80). С. 88–92.