BLOCKWISE EXTRACTION OF DOCUMENT METADATA
Methods, computer program products, and systems are presented. The methods include, for instance: obtaining a document image, wherein the document image includes a plurality of objects; identifying a plurality of macroblocks within the document image; performing microblock processing within macroblo...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Methods, computer program products, and systems are presented. The methods include, for instance: obtaining a document image, wherein the document image includes a plurality of objects; identifying a plurality of macroblocks within the document image; performing microblock processing within macroblocks of the plurality of macroblocks, wherein the microblock processing includes examining content of microblocks within a macroblock for extraction of key-value pairs, the examining content including performing an ontological analysis of microblocks, wherein the microblock processing includes associating confidence levels to the extracted key-value pairs; and outputting metadata based on the performing microblock processing within macroblocks of the plurality of macroblocks.
La présente invention concerne des procédés, des produits-programmes d'ordinateur et des systèmes. Les procédés comprennent, par exemple, l'obtention d'une image de document, l'image de document comprenant une pluralité d'objets; l'identification d'une pluralité de macro-blocs à l'intérieur de l'image de document; la réalisation d'un traitement de micro-blocs dans des macro-blocs de la pluralité de macro-blocs, le traitement de micro-blocs comprenant l'examen du contenu de micro-blocs dans un macro-bloc pour l'extraction de paires de valeurs clés, le contenu d'examen comprenant la réalisation d'une analyse ontologique de micro-blocs, le traitement de micro-blocs comprenant l'association de niveaux de confiance aux paires de valeurs clés extraites; et l'émission de métadonnées sur la base du traitement de micro-blocs effectué dans des macro-blocs de la pluralité de macro-blocs. |
---|