WEB SPAM PAGE CLASSIFICATION USING QUERY-DEPENDENT DATA
A web spam page classifier is described that identifies web spam pages based on features of a search query and web page pair. The features can be extracted from training instances and a training algorithm can be employed to develop the classifier. Pages identified as web spam pages can be demoted an...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A web spam page classifier is described that identifies web spam pages based on features of a search query and web page pair. The features can be extracted from training instances and a training algorithm can be employed to develop the classifier. Pages identified as web spam pages can be demoted and/or removed from a relevancy ranked list.
L'invention concerne un classificateur de pages de spam d'Internet qui permet d'identifier des pages de spam d'Internet sur la base de caractéristiques d'une requête de recherche appariée à des pages d'Internet. Ces caractéristiques peuvent être extraites d'instances d'apprentissage, et un algorithme d'apprentissage peut être utilisé pour développer le classificateur. Les pages identifiées comme pages de spam d'Internet peuvent être reclassées à un rang inférieur et/ou supprimées d'une liste de classement par pertinence. |
---|