CROSS-LINGUAL AUTOMATIC QUERY ANNOTATION
Cross-lingual automatic query annotation technique is described, for example, to classify online search queries in Arabic as being of commercial intent, without the need to use human-judged Arabic queries. In examples, a query classifier available for a source language (such as English) is used to p...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Cross-lingual automatic query annotation technique is described, for example, to classify online search queries in Arabic as being of commercial intent, without the need to use human-judged Arabic queries. In examples, a query classifier available for a source language (such as English) is used to produce a query classifier for a target language (such as Arabic, German, French). In various examples, a target language query log and target language documents may be used to enable target language and target culture dependent queries to be classified. In various examples a click graph with edges weighted by click frequency is used to infer class membership of unlabeled target language queries from target language documents. In examples the target language documents may be classified using a supervised or semi-supervised classifier. In various examples the automatically labeled target language queries are used to train a target language query classifier for information retrieval and/or advertising.
La présente invention porte sur une technique d'annotation de requête automatique interlinguistique, par exemple, pour classifier des requêtes de recherche en ligne en arabe comme étant d'intention commerciale, sans le besoin d'utiliser des requêtes en arabe jugées par humain. Selon des exemples, un classificateur de requête disponible pour une langue de source (telle que l'anglais) est utilisé pour produire un classificateur de requête pour une langue cible (telle que l'arabe, l'allemand, le français). Selon différents exemples, un journal de requête de langue cible et des documents de langue cible peuvent être utilisés pour permettre à une langue cible et des requêtes dépendantes de culture cible d'être classifiées. Selon différents exemples, un graphique à clic ayant des bords pondérés par une fréquence de clic est utilisé pour deviner une appartenance de classe de requêtes de langue cible non étiquetées partir de documents de langue cible. Selon des exemples, les documents de langue cible peuvent être classifiés à l'aide d'un classificateur supervisé ou semi supervisé. Selon différents exemples, les requêtes de langue cible étiquetées automatiquement sont utilisées pour entraîner un classificateur de requête de langue cible pour récupération d'informations et/ou publicité. |
---|