RANDOM DATA STREAM SAMPLING

There is provided a method of sampling data elements from a data stream for subsequent analysis, the data stream comprising a plurality of data elements, wherein each data element has a respective unique quasi-random identifier determined from a set of identifiers, the method comprising selecting da...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	VERES, ANDRAS, BENKOE, PETER
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	ELECTRIC COMMUNICATION TECHNIQUE ELECTRICITY TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	There is provided a method of sampling data elements from a data stream for subsequent analysis, the data stream comprising a plurality of data elements, wherein each data element has a respective unique quasi-random identifier determined from a set of identifiers, the method comprising selecting data elements from the data stream whose identifiers are within a first element selection range to give a set of selected data elements, the first element selection range being a subset of the set of identifiers; wherein, once the set of selected data elements comprises a predetermined number of data elements, the method further comprises: determining a second element selection range as a proper subset of the first element selection range; discarding data elements from the set of selected data elements whose identifiers are not within the second element selection range; and selecting at least one further data element from the data stream whose identifier is within the second element selection range for the set of selected data elements. L'invention porte sur un procédé d'échantillonnage d'éléments de données dans un flux de données en vue d'une analyse subséquente, le flux de données comprenant une pluralité d'éléments de données, chaque élément de données ayant un identifiant quasi aléatoire unique respectif déterminé dans un ensemble d'identifiants, le procédé consistant à sélectionner des éléments de données dans le flux de données dont les identifiants sont compris dans une première plage de sélection d'éléments afin d'obtenir un ensemble d'éléments de données sélectionnés, la première plage de sélection d'éléments étant un sous-ensemble de l'ensemble d'identifiants. Une fois que l'ensemble d'éléments de données sélectionnés comprend un nombre prédéterminé d'éléments de données, le procédé consiste en outre à : déterminer une seconde plage de sélection d'éléments sous la forme d'un sous-ensemble approprié de la première plage de sélection d'éléments ; mettre au rebut des éléments de données de l'ensemble d'éléments de données sélectionnés dont les identifiants ne sont pas compris dans la seconde plage de sélection d'éléments ; et sélectionner au moins un autre élément de données dans le flux de données dont l'identifiant est compris dans la seconde plage de sélection d'éléments pour l'ensemble d'éléments de données sélectionnés.