ITERATIVE TRAINING FOR TEXT-IMAGE-LAYOUT TRANSFORMER

Disclosed herein is a system and method for Natural Language Processing (NLP) of real world documents. The system and method combines various models not previously combined and overcomes the challenges of this combination. Models include an encoder-decoder model, a spatial model, and a multi-modal m...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: BORCHMANN, Lukasz Konrad, DANCEWICZ, Adam, GRALINSKI, Filip
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Disclosed herein is a system and method for Natural Language Processing (NLP) of real world documents. The system and method combines various models not previously combined and overcomes the challenges of this combination. Models include an encoder-decoder model, a spatial model, and a multi-modal model. An iterative training process receives documents and generates outputs, wherein the iterative training process comprises enabling information retrieval from documents without training data. Sont divulgués un système et un procédé de traitement de langage naturel (TLN) de documents du monde réel. Le système et le procédé combinent divers modèles n'ayant jamais été combinés et surmontent les défis de cette combinaison. Les modèles comprennent un modèle codeur-décodeur, un modèle spatial et un modèle multimodal. Un processus d'entraînement itératif reçoit des documents et génère des sorties, le processus d'entraînement itératif comprenant l'activation de l'extraction d'informations à partir de documents sans données d'entraînement.