SYSTEMS AND METHODS FOR MACHINE LEARNING-BASED DATA EXTRACTION
In some aspects, the disclosure is directed to methods and systems for machine learning-based data extraction using multiple string searching models. String extraction logic may differ depending on the type of document received. For documents identified to contain line item structures, broader searc...
Gespeichert in:
Hauptverfasser: | , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | In some aspects, the disclosure is directed to methods and systems for machine learning-based data extraction using multiple string searching models. String extraction logic may differ depending on the type of document received. For documents identified to contain line item structures, broader searching models are applied to the document to account for the increased variability of data in the document inherent in data organized in line item structures. For documents identifier to contain non-line item structures, stricter searching models are applied to the document to account for predictable data in the document associated with data organized in non-line item structures.
Selon certains aspects, l'invention concerne des procédés et des systèmes d'extraction de données basée sur l'apprentissage machine à l'aide de multiples modèles de recherche de chaînes. La logique d'extraction de chaîne peut différer en fonction du type de document reçu. Pour des documents identifiés pour contenir des structures d'élément de ligne, des modèles de recherche plus étendus sont appliqués au document de façon à tenir compte de la variabilité accrue de données dans le document inhérent à des données organisées en structures d'élément de ligne. Afin que l'identifiant de documents contiennent des structures d'articles non linéaires, des modèles de recherche plus stricts sont appliqués au document de façon à prendre en compte des données prédictibles dans le document associé à des données organisées dans des structures d'articles non linéaires. |
---|