LABEL AND FIELD IDENTIFICATION WITHOUT OPTICAL CHARACTER RECOGNITION (OCR)
Systems of the present disclosure allow fields and labels to be identified in a digital image of a form without performing OCR. A digital image of a form can be partitioned into image segments using computer-vision image-segmentation techniques. Features for each image segment can be extracted using...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Systems of the present disclosure allow fields and labels to be identified in a digital image of a form without performing OCR. A digital image of a form can be partitioned into image segments using computer-vision image-segmentation techniques. Features for each image segment can be extracted using computer-vision feature-detection methods. The features extracted from an image segment can be included in an input instance for a machine-learning model. The machine-learning model can assign a classification to the input instance. The classification can associate the input instance with a field type or a label type.
Les systèmes de la présente invention permettent d'identifier des champs et des étiquettes dans une image numérique d'une forme sans effectuer d'OCR. Une image numérique d'une forme peut être divisée en segments d'image à l'aide de techniques de segmentation d'images par vision artificielle. Des caractéristiques concernant chaque segment d'image peuvent être extraites à l'aide de procédés de détection de caractéristiques par vision artificielle. Les caractéristiques extraites d'un segment d'image peuvent être incluses dans une instance d'entrée pour un modèle d'apprentissage automatique. Le modèle d'apprentissage automatique peut attribuer une classification à l'instance d'entrée. La classification peut associer l'instance d'entrée à un type de champ ou à un type d'étiquette. |
---|