SYSTEMS AND METHODS FOR COGNITIVE INFORMATION MINING

The present invention relates to a cognitive information extraction system and method for intelligent information extraction from documents in different formats, types and forms. Since a huge portion of the data and information is still stored in unstructured documents in physical format, the system...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: VYAS, Sachin, PATIL, K Nitin, PATIL, Pranav, KUMAR, Dubey Deepak, SALUJA, Satish, MEHROTRA, Sanchit, SINGH, Anoop, BOBHATE, Bhushan, SHAIKH, Aamir, AGARWAL, Aayushi
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention relates to a cognitive information extraction system and method for intelligent information extraction from documents in different formats, types and forms. Since a huge portion of the data and information is still stored in unstructured documents in physical format, the system provides a framework to extract information from such documents. Further, even in the digital form, the documents are available in multiple different formats, which can act as a great hindrance to useful extract information. The invention focuses upon mitigating this by combining multiple AI models and modules to create a framework for document processing and human-machine interaction for training and QC verification, wherein the framework provides user the flexibility to work upon multiple types of documents, and also ensures that accuracy is maintained while the information is being extracted. The framework is further capable of continuously updating and creating advanced versions by an automated feedback system. La présente invention concerne un système et un procédé d'extraction d'informations cognitives pour l'extraction intelligente d'informations à partir de documents dans différents formats, types et formes. Étant donné qu'une grande partie des données et des informations est toujours stockée dans des documents non structurés en format physique, le système fournit un cadre pour extraire des informations à partir de tels documents. En outre, même sous la forme numérique, les documents sont disponibles dans de multiples formats différents, ce qui peut constituer un obstacle important à l'extraction d'informations utiles. L'invention vise à atténuer ce problème en combinant plusieurs modèles et modules d'intelligence artificielle (IA) afin de créer un cadre pour le traitement des documents et l'interaction homme-machine pour la formation et la vérification du contrôle de la qualité (CQ), le cadre offrant à l'utilisateur la souplesse nécessaire pour travailler sur plusieurs types de documents, et garantissant également le maintien de l'exactitude pendant l'extraction des informations. Le cadre est en outre capable de mettre à jour et de créer en continu des versions avancées par un système de rétroaction automatisé.