PROCESSING AUDIO DATA TO PRODUCE METADATA

A system for automated control of retrieval and output of music audio files, comprises a training input for receiving music audio files each having one or more associated keywords from a set of keywords. An analyser is arranged to convert keywords to M dimensional vectors in a vector space, where M...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SANDLER, MARK, FAZEKAS, GYORGY, KUDUMAKIS, PANOS, BARTHET, MATHIEU, BAUME, CHRIS, HILL, ANDREW, MARSTON, DAVID
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A system for automated control of retrieval and output of music audio files, comprises a training input for receiving music audio files each having one or more associated keywords from a set of keywords. An analyser is arranged to convert keywords to M dimensional vectors in a vector space, where M is less than the total number of distinct keywords in the set of keywords. The analyser arranged to sample features of the music audio files and to produce an F dimensional vector in a vector space representing each music audio file. A machine learning module is arranged to derive a conversion between M dimensional vectors and F dimensional vectors. A sample input is arranged to receive a sample audio file, to extract features and to produce a derived F dimensional vector in vector space. A converter is arranged to convert the F dimensional vector to a derived M dimensional vector in vector space using the derived conversion. An output is arranged to allow selection and retrieval of music audio files using the derived M dimensional vector. Selon cette invention, un système pour la commande automatisée de la récupération et de l'émission de fichiers audio musicaux comprend une entrée d'apprentissage qui sert à la réception de fichiers audio musicaux ayant chacun un ou plusieurs mots-clés associés en provenance d'un ensemble de mots-clés. Un analyseur est conçu pour convertir les mots-clés en vecteurs à M dimensions dans un espace vectoriel, M étant inférieur au nombre total de mots-clés différents dans l'ensemble de mots-clés. Cet analyseur permet d'échantillonner des caractéristiques des fichiers audio musicaux et de produire un vecteur à F dimensions dans un espace vectoriel représentant chaque fichier audio musical. Un module d'apprentissage automatique est prévu pour déduire une conversion entre les vecteurs à M dimensions et les vecteurs à F dimensions. Une entrée d'échantillon est destinée à la réception d'un fichier audio échantillon, à l'extraction de caractéristiques et à la production d'un vecteur à F dimensions déduit dans l'espace vectoriel. Un convertisseur est conçu pour convertir le vecteur à F dimensions en vecteur à M dimensions déduit dans l'espace vectoriel, à l'aide de la conversion déduite. Une sortie permet de sélectionner et de récupérer les fichiers audio musicaux au moyen du vecteur à M dimensions déduit.