SYSTEMS AND METHODS FOR THE AUTOMATIC CATEGORIZATION OF TEXT
Computer implemented methods for categorizing documents are provided that include: receiving a document having a plurality of headnotes and metadata associated with the document, wherein the plurality of headnotes each comprise a segment of text that summarizes at least a portion of the document; pr...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Computer implemented methods for categorizing documents are provided that include: receiving a document having a plurality of headnotes and metadata associated with the document, wherein the plurality of headnotes each comprise a segment of text that summarizes at least a portion of the document; predicting using at least a first machine learning model, for at least a first of the plurality of headnotes, a statute pertaining to the first headnote, wherein the predicted statute has associated therewith a taxonomy of topics; predicting using the first machine learning model, a topic from the taxonomy of topics associated with the statute that the first headnote pertains; and associating the first headnote with the predicted topic.
L'invention concerne des procédés mis en ?uvre par ordinateur permettant de catégoriser des documents qui comprennent les étapes consistant à : recevoir un document comptant une pluralité de notes de tête et de métadonnées associées au document, la pluralité de notes de tête comprenant chacune un segment de texte résumant au moins une partie du document ; prédire, à l'aide d'au moins un premier modèle d'apprentissage automatique, pour au moins une première note parmi la pluralité de notes de tête, une loi relative à la première note de tête, une taxonomie de sujets étant associée à la loi prédite ; prédire, à l'aide du premier modèle d'apprentissage automatique, un sujet à partir de la taxonomie de sujets associés à la loi auquel appartient la première note de tête ; et associer la première note de tête au sujet prédit. |
---|