EXTRACTING FACTS FROM UNSTRUCTURED INFORMATION

A computer-implemented technique is described herein for extracting facts from unstructured text documents provided by one or more information sources. The technique uses a pipeline to perform this operation that involves, at least in part, providing a corpus of information items, extracting candida...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ABDELBAKI, Ahmed Mohamed Emad Morsi, ABDELAZIZ, Sayed Hassan Sayed, ABDEL-REHEEM, Eslam Kamal Abdel-Aal, MARTON, Yuval Yehezkel, ANDERSON, Brandon Robert, CHEN, Deqing, GERGUIS, Michel Naim Naguib, CHALABI, Achraf Abdel Moneim Tawfik
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A computer-implemented technique is described herein for extracting facts from unstructured text documents provided by one or more information sources. The technique uses a pipeline to perform this operation that involves, at least in part, providing a corpus of information items, extracting candidate facts from the information items, merging synonymous argument values associated with the candidate facts, organizing the candidate facts into relation clusters, and assessing the confidence level of the candidate facts within the relation clusters. L'invention concerne une technique mise en oeuvre sur ordinateur pour extraire des faits de documents textuels non structurés fournis par une ou plusieurs sources d'informations. La présente technique utilise un pipeline pour exécuter cette opération, celle-ci consistant, au moins en partie, à fournir un corpus d'éléments d'informations, à extraire des faits des éléments d'informations candidats, à fusionner des valeurs d'arguments synonymes associées aux faits candidats, à organiser les faits candidats en groupements de relations, et à évaluer le niveau de confiance des faits candidats au sein des groupements de relations.