Method for training codebook e.g. for vector quantizers, involves evaluating data training records recursively in stages

A method for training a codebook (C) with a number (M) of vectors for vector quantization of data with a training record (data set) (T) involves initially factorizing the codebook into N-part codebooks (CI) training the part codebooks (CI) with the starting training data set (TS), diving the data tr...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HALES, CHAZ MATTHEW, KUROPATWINSKI, MARCIN
Format: Patent
Sprache:eng ; ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method for training a codebook (C) with a number (M) of vectors for vector quantization of data with a training record (data set) (T) involves initially factorizing the codebook into N-part codebooks (CI) training the part codebooks (CI) with the starting training data set (TS), diving the data training set (TS) with the part codebook into further training sets (TI-TK) and evaluating the training data set recursively in stages (j). The number of code vectors in each of the codebooks is determined on the basis of an evaluation function of the respective cells of the codebook of stage (j). With the set of training sequences (TS), the codebooks for the next stage (j+1) are trained until the total number (M) of the code vectors is trained. An Independent claim is given for a computer program product. Die Erfindung betrifft ein Verfahren zum Trainieren eines Codebuches mit einer Vielzahl von Vektoren zur Vektorquantisierung von Daten mit einem Trainingsdatensatz. DOLLAR A Erfindungsgemäß ist vorgesehen, dass das Verfahren die Schritte DOLLAR A - Faktorisieren des Codebuches (C) in den N Teil-Codebücher (C¶i¶) DOLLAR A - Trainieren des Teil-Codebuches (C¶1¶) mit dem Anfangs-Trainingsdatensatz (TS) DOLLAR A - Teilen des Trainingsdatensatzes (TS) mit dem Teil-Codebuch C¶1¶ in weitere Trainingsdatensätzen (T¶1¶) bis (T¶k¶) DOLLAR A - Auswerten des Trainingsdatensatzes rekursiv in Stufen (j), indem DOLLAR A + die Anzahl der Codevektoren in jedem der Codebücher der nächsten Stufe (j + 1) anhand einer Bewertungsfunktion der jeweiligen Zelle des Codebuches der Stufe (j) bestimmt wird DOLLAR A + mit dem Satz der Trainingssequenzen (TS) die Codebücher für die nächste Stufe (j + 1) trainiert werden DOLLAR A - bis die Gesamtzahl (M) der Codevektoren trainiert ist, DOLLAR A umfasst.