RECOMMENDING ANALYTIC TASKS BASED ON SIMILARITY OF DATASETS

Recommending analytic tasks based on similarity of datasets is disclosed. One example is a system including a data processor, a matching module, and a recommendation module. The data processor receives an incoming dataset via a processing system, and generates a feature vector for the incoming datas...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DAS, Mahashweta, OZONAT, Mehmet Kivanc
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Recommending analytic tasks based on similarity of datasets is disclosed. One example is a system including a data processor, a matching module, and a recommendation module. The data processor receives an incoming dataset via a processing system, and generates a feature vector for the incoming dataset. The matching module determines similarity measures between the generated feature vector and representative feature vectors for a plurality of datasets in a data repository, and selects at least one dataset of the plurality of datasets based on the similarity measures. The recommendation module identifies at least one analytic task associated with the selected dataset, and recommends, to a computing device via the processing system, the at least one analytic task to be performed on the incoming dataset. L'invention concerne la recommandation de tâches analytiques d'après la similarité d'ensembles de données. Un exemple de l'invention est un système comprenant un processeur de données, un module de mise en correspondance et un module de recommandation. Le processeur de données reçoit un ensemble de données entrant par l'intermédiaire d'un système de traitement et génère un vecteur de caractéristique pour l'ensemble de données entrant. Le module de mise en correspondance détermine des mesures de similarité entre le vecteur de caractéristique généré et des vecteurs de caractéristique représentatifs relatifs à une pluralité d'ensembles de données située dans un référentiel de données, et sélectionne au moins un ensemble de données de la pluralité d'ensembles de données d'après les mesures de similarité. Le module de recommandation identifie au moins une tâche analytique associée à l'ensemble de données sélectionné, et recommande à un dispositif informatique, par l'intermédiaire du système de traitement, que ladite au moins une tâche analytique soit exécutée sur l'ensemble de données entrant.