SYSTEM AND METHOD FOR GENERATING VOCABULARY FROM NETWORK DATA

A method is provided in one example and includes receiving data propagating in a network environment and separating the data into one or more fields. At least some of the fields are evaluated in order to identify nouns and noun phrases within the fields. The method also includes identifying selected...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ARUMUGAM, THANGAVELU, POSSE, CHRISTIAN, WALIA, NITASHA, MIHAILOVICI, VIRGIL N, GANNU, SATISH K, MALEGAONKAR, ASHUTOSH A, SAMBHUS, SONALI M
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method is provided in one example and includes receiving data propagating in a network environment and separating the data into one or more fields. At least some of the fields are evaluated in order to identify nouns and noun phrases within the fields. The method also includes identifying selected words within the nouns and noun phrases based on a whitelist and a blacklist. The whitelist includes a plurality of designated words to be tagged and the blacklist includes a plurality of rejected words that are not to be tagged. A resultant composite is generated for the selected nouns and noun phrases that are tagged. The resultant composite is incorporated into the whitelist if the resultant composite is approved. L'invention concerne notamment un procédé décrit à titre d'exemple, comprenant les étapes consistant à recevoir des données se propageant dans un environnement de réseau et à séparer les données en un ou plusieurs champs. Au moins une partie des champs est évaluée afin d'identifier des noms et des groupes nominaux à l'intérieur des champs. Le procédé comporte également une étape consistant à identifier des mots choisis parmi les noms et groupes nominaux en se basant sur une liste blanche et une liste noire. La liste blanche comprend une pluralité de mots désignés en vue de leur étiquetage et la liste noire comprend une pluralité de mots rejetés à ne pas étiqueter. Un composite résultant est généré pour les noms et groupes nominaux choisis qui sont étiquetés. Le composite résultant est incorporé à la liste blanche si le composite résultant est approuvé.