DISTRIBUTED PROCESSING OF STREAMING DATA RECORDS
Representative embodiments of a distributed processing method of facilitating interactive analytics of streaming data records by receiving the data records at a plurality of distributed computational nodes, establishing and storing dimensions corresponding to attributes of the data records, parsing...
Gespeichert in:
Hauptverfasser: | , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Representative embodiments of a distributed processing method of facilitating interactive analytics of streaming data records by receiving the data records at a plurality of distributed computational nodes, establishing and storing dimensions corresponding to attributes of the data records, parsing the streaming data records to identify matches to at least one of the dimensions and based thereon, reducing the number of data records to create a targeted subset of the data, re- distributing the targeted subsets of the streaming data records among the distributed computational nodes in accordance with the dimensions stored on the nodes, updating a database storing measures of the dimensions in accordance with the targeted subsets of the streaming data records, and using the database to respond to a query based on measures associated with one or more of the dimensions.
Des modes de réalisation représentatifs de l'invention portent sur un procédé de traitement distribué pour faciliter une analyse interactive d'enregistrements de données de diffusion en flux par réception des enregistrements de données au niveau d'une pluralité de noeuds informatiques distribués, établissement et stockage de dimensions correspondant à des attributs des enregistrements de données, analyse des enregistrements de données de diffusion en flux afin d'identifier des concordances avec au moins une des dimensions et, sur leur base, réduction du nombre d'enregistrements de données afin de créer un sous-ensemble ciblé des données, redistribution des sous-ensembles ciblés des enregistrements de données de diffusion en flux parmi les noeuds informatiques distribués en fonction des dimensions stockées sur les noeuds, mise à jour d'une base de données stockant des mesures des dimensions en fonction des sous-ensembles ciblés des enregistrements de données de diffusion en flux, et utilisation de la base de données pour répondre à une interrogation sur la base de mesures associées à une ou plusieurs des dimensions. |
---|