METHOD AND SYSTEM FOR CONTENT CLASSIFICATION

A processing method for classification (300) of contents (400) in a domain (500; 501) that can be represented through a taxonomy is described, the method comprising: generating (301) a first digital mathematical representation of the taxonomy; generating (302) a second digital mathematical represent...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SIMEONI, ROSSANA, CANDAN, KASIM SELCUK, GEYMONAT, MARINA, DI CARO, LUIGI, CATALDI, MARIO, SAPINO, MARIA LUISA, MANA, DARIO, ANTONELLI, FABRIZIO
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A processing method for classification (300) of contents (400) in a domain (500; 501) that can be represented through a taxonomy is described, the method comprising: generating (301) a first digital mathematical representation of the taxonomy; generating (302) a second digital mathematical representation of text documents (600) different from said contents and containing keywords; processing (303) the first and second digital mathematical representations for enriching the taxonomy, by associating keywords of the text documents (600) with the first digital mathematical representation; generating (304) a third digital mathematical representation of the contents (400); processing (305) the first digital enriched mathematical representation and third mathematical representation for classifying the contents (400) in the enriched taxonomy. L'invention porte sur un procédé de traitement de classification (300) de contenus (400) dans un domaine (500; 501) qui peut être représenté par une taxonomie, le procédé comprenant : la génération (301) d'une première représentation mathématique numérique de la taxonomie; la génération (302) d'une deuxième représentation mathématique numérique de documents de texte (600) différents desdits contenus et contenant des mots-clés; le traitement (303) des première et deuxième représentions mathématiques numériques pour enrichir la taxonomie, par association de mots-clés des documents de texte (600) à la première représentation mathématique numérique; la génération (304) d'une troisième représentation mathématique numérique des contenus (400); le traitement (305) de la première représentation mathématique enrichie numérique et de la troisième représentation mathématique pour classer les contenus (400) dans la taxonomie enrichie.