ceturtdiena, 2010. gada 22. aprīlis

Поиск неестественных текстов

Аннотация В работе описывается метод определения неестественного происхождения документа, основанный на изучении статистики встречаемости пар соседних слов в тексте. Тестирование показывает, что метод может быть использован как отдельно, так и для существенного улучшения результатов уже известных методов определения спама по контенту.

http://rcdl.ru/doc/2009/306_308_Section09-3.pdf

Nav komentāru:

Ierakstīt komentāru