WEB SPAM PAGE CLASSIFICATION USING QUERY-DEPENDENT DATA

A web spam page classifier is described that identifies web spam pages based on features of a search query and web page pair. The features can be extracted from training instances and a training algorithm can be employed to develop the classifier. Pages identified as web spam pages can be demoted an...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SVORE, KRYSTA, BURGES, CHRIS
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A web spam page classifier is described that identifies web spam pages based on features of a search query and web page pair. The features can be extracted from training instances and a training algorithm can be employed to develop the classifier. Pages identified as web spam pages can be demoted and/or removed from a relevancy ranked list. L'invention concerne un classificateur de pages de spam d'Internet qui permet d'identifier des pages de spam d'Internet sur la base de caractéristiques d'une requête de recherche appariée à des pages d'Internet. Ces caractéristiques peuvent être extraites d'instances d'apprentissage, et un algorithme d'apprentissage peut être utilisé pour développer le classificateur. Les pages identifiées comme pages de spam d'Internet peuvent être reclassées à un rang inférieur et/ou supprimées d'une liste de classement par pertinence.