CONSTRUCTING A KNOWLEDGE GRAPH EMPLOYING MULTIPLE SUBGRAPHS AND A LINKING LAYER INCLUDING MULTIPLE LINKING NODES

A graph-based data storage and retrieval system in which multiple subgraphs representing respective datasets in different namespaces are interconnected via a linking or "canonical" layer. Respective datasets represented by subgraphs in different namespaces may pertain to a particular infor...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	POTTS, Christopher, ITHARAJU, Abhilash, RESCHKE, Kevin, DINGWALL, Nick
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING PHYSICS
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	A graph-based data storage and retrieval system in which multiple subgraphs representing respective datasets in different namespaces are interconnected via a linking or "canonical" layer. Respective datasets represented by subgraphs in different namespaces may pertain to a particular information domain, and may include heterogeneous datasets. The canonical layer provides for a substantial reduction of graph complexity required to interconnect respective corresponding nodes in different subgraphs, which in turn offers distinct advantages as the number of subgraphs increases for the particular domain(s) of interest. Examples of such advantages include reductions in data storage and retrieval times, enhanced query/search efficacy and discovery of relationships in different parts of the system, enhanced ability to infer relationships in different parts of the system, and enhanced ability to train data models for natural language processing and other purposes based on information extracted from the system. L'invention concerne un système de mémorisation et de récupération de données reposant sur un graphe dans lequel de multiples sous-graphes représentant des ensembles de données respectifs dans différents espaces de nommage sont interconnectés par l'intermédiaire d'une couche de liaison ou « canonique ». Des ensembles de données respectifs représentés par des sous-graphes dans différents espaces de nommage peuvent se rapporter à un domaine d'informations particulier et peuvent comprendre des ensembles de données hétérogènes. La couche canonique permet une réduction sensible de la complexité graphique requise pour interconnecter des nœuds correspondants respectifs dans différents sous-graphes, ce qui par ailleurs offre des avantages distincts à mesure que le nombre de sous-graphes augmente pour le ou les domaines particuliers d'intérêt. Des exemples de tels avantages comprennent des réductions de temps de mémorisation et de récupération de données, une efficacité d'interrogation/recherche améliorée et une découverte de relations dans différentes parties du système, une capacité améliorée à déduire des relations dans différentes parties du système, et une capacité améliorée à entraîner des modèles de données pour un traitement de langage naturel et à d'autres fins sur la base d'informations extraites du système.