HIERARCHICAL CLASSIFICATION OF TRANSACTION DATA

Methods, systems and computer program products implementing hierarchical classification techniques are disclosed. A hierarchical classification system receives training data including labeled transaction records. The system determines tag sequences from the training data. The system clusters the tag...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ATHOOPALLIL, Divya James, KARIMPANA, Aparajita Choudhury, YADAV, Chirag, RANJAN, Rakesh Kumar, PATIL, Ganesh, DESHMUKH, Om Dadaji
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems and computer program products implementing hierarchical classification techniques are disclosed. A hierarchical classification system receives training data including labeled transaction records. The system determines tag sequences from the training data. The system clusters the tag sequences into clusters. The system determines a cluster level classifier that is trained to predict a cluster for an input transaction record. The system determines a respective cluster specific classifier for each cluster. The system trains the cluster specific classifier to predict a label of entity of interest for an input transaction record, given a particular cluster. Upon receiving a test transaction record, the system first applies the cluster level classifier to determine a particular cluster for the test transaction record, and then determines a label of entity of interest of the test transaction record by applying a cluster specific classifier of that particular cluster. L'invention concerne des procédés, des systèmes et des produits-programmes informatiques permettant de mettre en œuvre des techniques de classification hiérarchique. Un système de classification hiérarchique reçoit des données d'apprentissage comprenant des enregistrements de transaction étiquetés. Le système détermine les séquences d'étiquettes à partir des données d'apprentissage. Le système regroupe les séquences d'étiquettes en groupes. Le système détermine un classificateur de niveau de groupe qui est appris afin de prédire un groupe pour un enregistrement de transaction d'entrée. Le système détermine un classificateur spécifique à un groupe respectif pour chaque groupe. Le système amène le classificateur spécifique à un groupe à prédire une étiquette d'entité d'intérêt pour un enregistrement de transaction d'entrée en tenant compte d'un groupe particulier. Lors de la réception d'un enregistrement de transaction de test, le système applique d'abord le classificateur de niveau de groupe afin de déterminer un groupe particulier pour l'enregistrement de transaction de test, puis détermine une étiquette d'entité d'intérêt de l'enregistrement de transaction de test en appliquant un classificateur spécifique au groupe de ce groupe particulier.