VISUALIZATION METHOD AND VISUALIZATION SYSTEM

The present invention relates to computerized system modeling, and more particularly to a method and system for transforming a multivariate data domain into a low-dimensional visual representation. Probabilistic models of the data domain are utilized, and at least one probabilistic model is used to...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: TIRRI, HENRY, RAINER, VALTONEN, KIMMO, ANTERO, KONTKANEN, PETRI, TAPANI, LAHTINEN, JUSSI, MIKA, ANTERO, MYLLYMAEKI, PETRI, JUKKA, SILANDER, TOMI, VILJAM
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention relates to computerized system modeling, and more particularly to a method and system for transforming a multivariate data domain into a low-dimensional visual representation. Probabilistic models of the data domain are utilized, and at least one probabilistic model is used to produce at least one predictive distribution. The predictive distributions are used as inputs to the visualization process, where the multidimensional space is converted to a low-dimensional space. In this process data vectors are considered similar, for example, if the corresponding instances of a predictive distribution, conditioned with the variable value assignments found in the data vectors, are similar. Consequently, similarity is not defined directly using the physical properties of the data vectors, but indirectly through the probabilistic predictive model(s). This allows the use of the heterogeneous data (with both continuous and discrete attributes with different value ranges) in a theoretically solid manner without need for heuristic scaling and normalization schemes in data preprocessing. L'invention concerne la modélisation de systèmes informatisés et notamment un procédé et un système de transformation d'un domaine de données multivariées en une représentation visuelle de faible dimension. Des modèles probabilistes du domaine de données sont utilisés, et au moins un modèle probabiliste est employé pour la production d'au moins une distribution prédictive. Les distributions prédictives sont utilisées sous forme d'entrées dans le procédé de visualisation, l'espace multidimensionnel étant converti en un espace de faible dimension. Dans ce procédé, les vecteurs de données sont considérés comme étant similaires, par exemple, si les instances correspondantes d'une distribution prédictive, conditionnées avec les attributions de valeurs variables trouvées dans les vecteurs de données, sont similaires. Par conséquent, la similarité n'est pas définie directement au moyen des propriétés physiques des vecteurs de données, mais indirectement à travers le(s) modèle(s) prédictif(s) probabiliste(s). Cela permet d'utiliser des données hétérogènes (possédant des attributs continus et discrets à différentes plages de valeurs) de manière théorique solide sans mise à l'échelle heuristique ni plan de normalisation dans le pré-traitement de données.