CLASSIFYING DATA ITEMS USING REGULARISED SIMILARITY VALUES

A computer-implemented training method includes receiving a plurality of labelled training data items; generating a training data vector from each training data item; and determining prototype vector representative of training data items. A maximum similarity value between the training data vectors...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	GRAYSON, Martin Philip, MASSICETI, Daniela, LONGDEN, Camilla Alice
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	CALCULATING COMPUTING COUNTING ELECTRIC COMMUNICATION TECHNIQUE ELECTRIC DIGITAL DATA PROCESSING ELECTRICITY PHYSICS TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	A computer-implemented training method includes receiving a plurality of labelled training data items; generating a training data vector from each training data item; and determining prototype vector representative of training data items. A maximum similarity value between the training data vectors and the prototype vector is identified and stored with the prototype vector. A computer-implemented inference method includes generating an input vector from an input data item; calculating a first similarity value between the input vector and the prototype vector; and calculating a second similarity value based on the first similarity value and the maximum similarity value. The method then determines that the input data item is a member of the class of data items based on the second similarity value. The methods provide lightweight classifiers that can be rapidly trained by non-expert end users for applications such as object detection and cybersecurity risk detection. Un procédé d'apprentissage mis en œuvre par ordinateur consiste à recevoir une pluralité d'éléments de données d'apprentissage étiquetés ; générer un vecteur de données d'apprentissage à partir de chaque élément de données d'apprentissage ; et déterminer un vecteur prototype représentatif d'éléments de données d'apprentissage. Une valeur de similarité maximale entre les vecteurs de données d'apprentissage et le vecteur prototype est identifiée et stockée avec le vecteur prototype. Un procédé d'inférence mis en œuvre par ordinateur consiste à générer un vecteur d'entrée à partir d'un élément de données d'entrée ; calculer une première valeur de similarité entre le vecteur d'entrée et le vecteur prototype ; et calculer une seconde valeur de similarité sur la base de la première valeur de similarité et de la valeur de similarité maximale. Le procédé consiste à déterminer ensuite que l'élément de données d'entrée est un élément de la classe d'éléments de données sur la base de la seconde valeur de similarité. Les procédés fournissent des classificateurs légers qui peuvent être rapidement entraînés par des utilisateurs finaux non experts pour des applications telles que la détection d'objets et la détection de risques de cybersécurité.