APPROXIMATE QUERY EQUIVALENCE FOR FEATURE STORES IN MACHINE LEARNING OPERATIONS PRODUCTS

Methods, systems, apparatuses, and computer-readable storage mediums are descried for identifying a similarity between queries. An intermediate representation generator receives a set of queries from a repository, each query in the set of queries having generated a corresponding set of data stored i...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: RAMA, Kiran, AGNEESWARAN, Vijay Srinivas, BOUÉ, Laurent
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, apparatuses, and computer-readable storage mediums are descried for identifying a similarity between queries. An intermediate representation generator receives a set of queries from a repository, each query in the set of queries having generated a corresponding set of data stored in a data store. An intermediate representation is generated for each query, where the intermediate representation is characterized by a feature associated with text specified in the query. A similarity determiner determines similarity scores between pairs of intermediate representations. A pair of intermediate representations with a similarity score above a threshold is identified. An indication is generated that sets of data corresponding to queries corresponding to the intermediate representations are overlapping. Sont ici décrits des procédés, des systèmes, des appareils et des supports de stockage lisibles par ordinateur pour identifier une similarité entre des interrogations. Un générateur de représentation intermédiaire reçoit un ensemble d'interrogations provenant d'un référentiel, chaque interrogation dans l'ensemble d'interrogations ayant généré un ensemble correspondant de données stockées dans un magasin de données. Une représentation intermédiaire est générée pour chaque interrogation, la représentation intermédiaire étant caractérisée par une caractéristique associée à un texte spécifié dans l'interrogation. Un dispositif de détermination de similarité détermine des scores de similarité entre des paires de représentations intermédiaires. Une paire de représentations intermédiaires ayant un score de similarité supérieur à un seuil est identifiée. Une indication est générée selon laquelle des ensembles de données correspondant à des interrogations correspondant aux représentations intermédiaires se chevauchent.