TOPIC SET REFINEMENT
A computing system including one or more processors generates a topic set for a domain. A taxonomic evaluator is executed by the one or more processors to evaluate a set of category clusters generated from domain-specific textual data against a domain-specific taxonomic tree based on a coherency con...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A computing system including one or more processors generates a topic set for a domain. A taxonomic evaluator is executed by the one or more processors to evaluate a set of category clusters generated from domain-specific textual data against a domain-specific taxonomic tree based on a coherency condition and to identify the category clusters that satisfy the coherency condition. The domain-specific taxonomic tree is generated from hierarchical structures of documents relating to the domain. Each identified category cluster is labeled with a label. A topic set creator is executed by the one or more processors to insert the labels of the set of identified category clusters into the topic set for the domain.
La présente invention concerne un système informatique, comprenant au moins un processeur, générant un ensemble de sujets pour un domaine. Un évaluateur taxonomique est exécuté par ledit processeur pour évaluer un ensemble de groupes de catégories générés à partir de données textuelles spécifiques au domaine par rapport à un arbre taxonomique spécifique au domaine en fonction d'une condition de cohérence et pour identifier les groupes de catégories qui satisfont la condition de cohérence. L'arbre taxonomique spécifique au domaine est généré à partir de structures hiérarchiques des documents relatifs au domaine. Le groupe de catégories identifié respectif se voit attribuer une étiquette. Un créateur d'ensemble de sujets est exécuté par ledit processeur pour insérer les étiquettes de l'ensemble des groupes de catégories identifiés dans l'ensemble de sujets pour le domaine. |
---|