BLOCKWISE EXTRACTION OF DOCUMENT METADATA

Methods, computer program products, and systems are presented. The methods include, for instance: obtaining a document image, wherein the document image includes a plurality of objects; identifying a plurality of macroblocks within the document image; performing microblock processing within macroblo...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: NORTHRUP, Kevin, HICKEY, Terry, JAVU, Thozamile, TRIM, Craig
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, computer program products, and systems are presented. The methods include, for instance: obtaining a document image, wherein the document image includes a plurality of objects; identifying a plurality of macroblocks within the document image; performing microblock processing within macroblocks of the plurality of macroblocks, wherein the microblock processing includes examining content of microblocks within a macroblock for extraction of key-value pairs, the examining content including performing an ontological analysis of microblocks, wherein the microblock processing includes associating confidence levels to the extracted key-value pairs; and outputting metadata based on the performing microblock processing within macroblocks of the plurality of macroblocks. La présente invention concerne des procédés, des produits-programmes d'ordinateur et des systèmes. Les procédés comprennent, par exemple, l'obtention d'une image de document, l'image de document comprenant une pluralité d'objets; l'identification d'une pluralité de macro-blocs à l'intérieur de l'image de document; la réalisation d'un traitement de micro-blocs dans des macro-blocs de la pluralité de macro-blocs, le traitement de micro-blocs comprenant l'examen du contenu de micro-blocs dans un macro-bloc pour l'extraction de paires de valeurs clés, le contenu d'examen comprenant la réalisation d'une analyse ontologique de micro-blocs, le traitement de micro-blocs comprenant l'association de niveaux de confiance aux paires de valeurs clés extraites; et l'émission de métadonnées sur la base du traitement de micro-blocs effectué dans des macro-blocs de la pluralité de macro-blocs.