MAPPING INSTANCES OF A DATASET WITHIN A DATA MANAGEMENT SYSTEM

Mapping data stored in a data storage system (170) for use by a computer system includes processing specifications of dataflow graphs (180) that include nodes representing computations interconnected by links representing flows of data. At least one of the dataflow graphs receives a flow of data fro...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: WAKELING, TIM, WEISS, ADAM
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Mapping data stored in a data storage system (170) for use by a computer system includes processing specifications of dataflow graphs (180) that include nodes representing computations interconnected by links representing flows of data. At least one of the dataflow graphs receives a flow of data from at least one input dataset and at least one of the dataflow graphs provides a flow of data to at least one output dataset. A mapper (100) identifies one or more sets of datasets. Each dataset in a given set matches one or more criteria for identifying different versions of a single dataset. A user interface (160) is provided to receive a mapping between at least two datasets in a given set. The mapping received over the user interface is stored in association with a dataflow graph that provides data to or receives data from the datasets of the mapping. L'invention concerne un mappage de données mémorisées dans un système de mémorisation de données (170) destiné à être utilisé par un système informatique, comprenant le traitement de spécifications de graphiques de flux de données (180) qui comprennent des nuds représentant des calculs interconnectés par des liaisons représentant des flux de données. Au moins un des graphiques de flux de données reçoit un flux de données provenant d'au moins un ensemble de données d'entrée et au moins un des graphiques de flux de données fournit un flux de données à au moins un ensemble de données de sortie. Un mappeur (100) identifie un ou plusieurs groupes d'ensembles de données. Chaque ensemble de données dun groupe donné correspond à un ou plusieurs critères pour identifier différentes versions d'un ensemble de données unique. Une interface utilisateur (160) est fournie pour recevoir un mappage entre au moins deux ensembles de données dun ensemble donné. Le mappage reçu sur l'interface utilisateur est mémorisé en association avec un graphique de flux de données qui fournit des données aux ensembles de données du mappage, ou reçoit des données provenant de ceux-ci.