Публікація: Метод виявлення нечітких дублікатів електронних текстових файлів
Завантаження...
Дата
2013
Автори
Назва журналу
ISSN журналу
Назва тома
Видавництво
ХНУРЭ
Анотація
В роботі здійснено аналіз методів виявлення нечітких дублікатів текстових файлів. Показано, що існуючі методи виявлення нечітких дублікатів спрямовані на мінімізацію обчислювальної складності з одночасним збільшенням повноти і точності алгоритму. У даній роботі запропоновано та протестовано гібридний метод, який дозволяє істотно поліпшити якість виявлення нечітких дублікатів при незначному збільшенні обчислювальної складності базового алгоритму.
Опис
Ключові слова
частотный алгоритм, шинглування, гібридний метод
Бібліографічний опис
Чалая, Л. Э. Метод виявлення нечітких дублікатів електронних текстових файлів / Л. Э. Чалая, П. Ю. Попаденко // Бионика интеллекта. – 2013. – № 1 (80). – С. 88–92.