UPDATING A STAGED DATASET FOR INGESTION
Updating a staged dataset from a delta-based data repository is provided, including receiving an instruction to update the staged dataset based on a checkpoint and requesting a versioned subset of data from the repository based on the checkpoint and the received instruction. The versioned subset of...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Updating a staged dataset from a delta-based data repository is provided, including receiving an instruction to update the staged dataset based on a checkpoint and requesting a versioned subset of data from the repository based on the checkpoint and the received instruction. The versioned subset of the data includes a data differential between a staged version of the data stored in the repository and a checkpoint-based version of the data stored in the repository. The versioned subset of the data is received from the repository. The versioned subset of the data is incompatibly formatted for ingestion by a data analytics engine. The received versioned subset of the data is transformed into a staged subset of the data. The staged subset of the data is formatted for ingestion by a data analytics engine and stored in association with another staged subset of the data for ingestion by the data analytics engine.
La mise à jour d'un ensemble de données indexé à partir d'un référentiel de données basé sur Delta est proposée, comprenant la réception d'une instruction pour mettre à jour l'ensemble de données indexé sur la base d'un point de contrôle, et la demande d'un sous-ensemble versionné de données à partir du référentiel sur la base du point de contrôle et de l'instruction reçue. Le sous-ensemble versionné des données comprend un différentiel de données entre une version indexée des données stockées dans le référentiel et une version basée sur un point de contrôle des données stockées dans le référentiel. Le sous-ensemble versionné des données est reçu en provenance du référentiel. Le sous-ensemble versionné des données est formaté de manière incompatible pour ingestion par un moteur d'analyse de données. Le sous-ensemble versionné reçu des données est transformé en un sous-ensemble indexé des données. Le sous-ensemble indexé des données est formaté pour ingestion par un moteur d'analyse de données, et stocké en association avec un autre sous-ensemble indexé des données pour ingestion par le moteur d'analyse de données. |
---|