Аннотация В работе описывается метод определения неестественного происхождения документа, основанный на изучении статистики встречаемости пар соседних слов в тексте. Тестирование показывает, что метод может быть использован как отдельно, так и для существенного улучшения результатов уже известных методов определения спама по контенту.
http://rcdl.ru/doc/2009/306_308_Section09-3.pdf
Nav komentāru:
Ierakstīt komentāru