PARALLEL AND EFFICIENT TECHNIQUE FOR BUILDING AND MAINTAINING A MAIN MEMORY CSR BASED GRAPH INDEX IN A RDBMS

Herein are techniques that concurrently populate entries in a compressed sparse row (CSR) encoding, of a type of edge of a heterogenous graph. In an embodiment, a computer obtains a mapping of a relational schema to a graph data model. The relational schema defines vertex tables that correspond to v...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HAPRIAN, Vlad Ioan, HONG, Sungpack, CHAVAN, Shasank Kisan, DAYNES, Laurent Phillipe, LOZI, Jean-Pierre, KAPP, Hugo, ARNABOLDI, Marco
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Herein are techniques that concurrently populate entries in a compressed sparse row (CSR) encoding, of a type of edge of a heterogenous graph. In an embodiment, a computer obtains a mapping of a relational schema to a graph data model. The relational schema defines vertex tables that correspond to vertex types in the graph data model, and edge tables that correspond to edge types in the graph data model. Each edge type is associated with a source vertex type and a target vertex type. For each vertex type, a sequence of persistent identifiers of vertices is obtained. Based on the mapping and for a CSR representation of each edge type, a source array is populated that, for a same vertex ordering as the sequence of persistent identifiers for the source vertex type, is based on counts of edges of the edge type that originate from vertices of the source vertex type. For the CSR, the computer populates, in parallel and based on said mapping, a destination array that contains canonical offsets as sequence positions within the sequence of persistent identifiers of the vertices. La présente invention concerne des techniques qui remplissent simultanément des entrées dans un codage de rangée creuse comprimée (CSR), d'un type d'arête d'un graphe hétérogène. Dans un mode de réalisation, un ordinateur obtient une mise en correspondance d'un schéma relationnel avec un modèle de données de graphe. Le schéma relationnel définit des tables de sommet qui correspondent à des types de sommets dans le modèle de données de graphe, et des tables d'arête qui correspondent à des types d'arêtes dans le modèle de données de graphe. Chaque type d'arête est associé à un type de sommet source et à un type de sommet cible. Pour chaque type de sommet, une séquence d'identifiants persistants de vertex est obtenue. Sur la base de la mise en correspondance et pour une représentation CSR de chaque type d'arête, un réseau de source est rempli qui, pour un même ordre de sommet que la séquence d'identifiants persistants du type de sommet source, est basé sur des comptes d'arêtes du type d'arête qui proviennent de vertex du type de sommet source. Dans le CSR, l'ordinateur remplit, en parallèle et sur la base de ladite mise en correspondance, un réseau de destination qui contient des décalages canoniques en tant que positions de séquence dans la séquence d'identifiants persistants des vertex.