PRIVACY PRESERVING FEDERATED QUERY ENGINE

A federated query engine system and method for multiple datasets is enhanced with privacy preserving features. It may, for example, limit the movement of data from one or more of the datasets being accessed. It may use cryptographic long-term keys, enabling fuzzy table joins that do not require a co...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: GILMORE, David, HALES, Isaac, NGO, Chi, MAKOWSKI, Maciej, GABRYANCZYK, Piotr
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A federated query engine system and method for multiple datasets is enhanced with privacy preserving features. It may, for example, limit the movement of data from one or more of the datasets being accessed. It may use cryptographic long-term keys, enabling fuzzy table joins that do not require a comparison of the plaintext column values. The query plan may leverage the particular infrastructure of the storage system that houses each of the datasets. The query engine receives a standard SQL query, translates the query into a logical plan for performing the query across the multiple datasets, converts the logical plan into physical plans that are specific to the implementational architecture of the multiple datasets, and sends these physical plans to SQL workers located near the data warehouses housing each dataset. Un système et un procédé de moteur de requête fédéré pour de multiples ensembles de données sont améliorés avec des caractéristiques préservant la confidentialité. Ils peuvent, par exemple, limiter le mouvement de données à partir d'un ou plusieurs des ensembles de données faisant l'objet d'un accès. Ils peuvet utiliser des clés cryptographiques à long terme, ce qui permet des jonctions de tables floues qui ne nécessitent pas de comparaison des valeurs de colonne en clair. Le plan de requête peut tirer parti de l'infrastructure particulière du système de stockage qui héberge chacun des ensembles de données. Le moteur de requête reçoit une requête SQL standard, traduit la requête en un plan logique en vue de la réalisation de la requête à travers les multiples ensembles de données, convertit le plan logique en plans physiques qui sont spécifiques à l'architecture de mise en œuvre des multiples ensembles de données, et envoie ces plans physiques à des travailleurs SQL situés à proximité des entrepôts de données hébergeant chaque ensemble de données.