MACHINE LEARNING BASED PREDICTION OF DOCUMENT METADATA

A system predicts metadata attributes associated with documents using machine learning models. The document may represent an interaction between entities. The system trains machine learning models to predict scores indicating whether a token or a sequence of token of a document represents a metadata...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: JETHAVA, Vinay, WONG, David Matthew, GHANIMIFARD, Mohammad Mehdi, LINDSTROM, Pontus, HE, Yan, LANGE, David, NARAYANAN, Kaushik, ZHENG, Qing, RAMAN, Gowtham Rangarajan, DEBARR, David
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A system predicts metadata attributes associated with documents using machine learning models. The document may represent an interaction between entities. The system trains machine learning models to predict scores indicating whether a token or a sequence of token of a document represents a metadata attribute. The metadata prediction is used to annotate the document and display to users. The system receives user feedback via the user interface and uses the user feedback to evaluate or retrain the model. The system generates training data by receiving a set of annotated documents and comparing the annotated documents against other documents to identify matching documents. The system determines when to execute the machine learning based metadata prediction based on steps of document workflow executed by the system. Système prédisant des attributs de métadonnées associés à des documents à l'aide de modèles d'apprentissage automatique. Le document peut représenter une interaction entre des entités. Le système forme des modèles d'apprentissage automatique pour prédire des scores indiquant si un jeton ou une séquence de jeton d'un document représente un attribut de métadonnées. La prédiction de métadonnées est utilisée pour annoter le document et l'afficher à des utilisateurs. Le système reçoit une rétroaction d'utilisateur par l'intermédiaire de l'interface utilisateur et utilise la rétroaction d'utilisateur pour évaluer ou reformer le modèle. Le système génère des données de formation en recevant un ensemble de documents annotés et en comparant les documents annotés à d'autres documents pour identifier des documents correspondants. Le système détermine à quel moment exécuter la prédiction de métadonnées basée sur l'apprentissage automatique sur la base d'étapes du flux de travaux de document exécuté par le système.