GEO-SCALE ANALYTICS WITH BANDWIDTH AND REGULATORY CONSTRAINTS

Various technologies described herein pertain to controlling geo-scale analytics with bandwidth and regulatory constraints. An analytical query (e.g., a recurrent analytical query, a non-recurrent analytical query, etc.) to be executed over distributed data in data partitions stored in a plurality o...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PADHYE, Jitendra Dattatraya, VARGHESE, George, CURINO, Carlo Aldo, VULIMIRI, Ashish
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Various technologies described herein pertain to controlling geo-scale analytics with bandwidth and regulatory constraints. An analytical query (e.g., a recurrent analytical query, a non-recurrent analytical query, etc.) to be executed over distributed data in data partitions stored in a plurality of data centers can be received. Moreover, a query execution plan for the analytical query can be generated, where the query execution plan includes tasks. Further, replication strategies for the data partitions can be determined. A replication strategy for a particular data partition can specify one or more data centers to which the particular data partition is to be replicated if the particular data partition is to be replicated. The tasks of the query execution plan for the analytical query can further be scheduled to the data centers based on the replication strategies for the data partitions. The analytical query can be part of a workload of analytical queries. L'invention concerne diverses technologies relatives au contrôle de l'analytique à l'échelle mondiale comportant des contraintes de largeur de bande et de régulation. Une requête analytique (par exemple une requête analytique récurrente, une requête analytique non récurrente, etc.) qui doit être exécutée sur des données réparties dans des partitions de données stockées dans une pluralité de centres de données peut être reçue. De plus, un plan d'exécution de requête pour la requête d'analyse peut être généré, le plan d'exécution de requête comprenant des tâches. En outre, des stratégies de réplication pour les partitions de données peuvent être déterminées. Une stratégie de réplication pour une partition de données particulière peut spécifier un ou plusieurs centres de données vers lequel ou lesquels la partition de données particulière doit être répliquée si la partition de données particulière doit être répliquée. Les tâches du plan d'exécution de requête pour la requête analytique peuvent en outre être programmées vers les centres de données sur la base des stratégies de réplication pour les partitions de données. La requête analytique peut faire partie d'une charge de travail de requêtes analytiques.