1 article Анализ

Алгоритм опознавания и сравнения текстов

Свиснуто отсюда: https://habr.com/ru/sandbox/101202/ Data Mining, Open source, Perl, Поисковые технологии, Семантика Алгоритм опознавания и сравнения текстов предназначен для поиска плагиата и повторов в текстах. Реализован в Text::Distill. 1. Распознавание текста Прямое сравнение текстов является крайне ресурсоёмким и алгоритмически сложным. Оно исключает возможность быстрого поиска похожего текста. Требуется механизм, который позволит, опираясь на индексированные поля в…