PROCESSING AUDIO DATA TO PRODUCE METADATA
A system for automated control of retrieval and output of music audio files, comprises a training input for receiving music audio files each having one or more associated keywords from a set of keywords. An analyser is arranged to convert keywords to M dimensional vectors in a vector space, where M...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A system for automated control of retrieval and output of music audio files, comprises a training input for receiving music audio files each having one or more associated keywords from a set of keywords. An analyser is arranged to convert keywords to M dimensional vectors in a vector space, where M is less than the total number of distinct keywords in the set of keywords. The analyser arranged to sample features of the music audio files and to produce an F dimensional vector in a vector space representing each music audio file. A machine learning module is arranged to derive a conversion between M dimensional vectors and F dimensional vectors. A sample input is arranged to receive a sample audio file, to extract features and to produce a derived F dimensional vector in vector space. A converter is arranged to convert the F dimensional vector to a derived M dimensional vector in vector space using the derived conversion. An output is arranged to allow selection and retrieval of music audio files using the derived M dimensional vector.
Selon cette invention, un système pour la commande automatisée de la récupération et de l'émission de fichiers audio musicaux comprend une entrée d'apprentissage qui sert à la réception de fichiers audio musicaux ayant chacun un ou plusieurs mots-clés associés en provenance d'un ensemble de mots-clés. Un analyseur est conçu pour convertir les mots-clés en vecteurs à M dimensions dans un espace vectoriel, M étant inférieur au nombre total de mots-clés différents dans l'ensemble de mots-clés. Cet analyseur permet d'échantillonner des caractéristiques des fichiers audio musicaux et de produire un vecteur à F dimensions dans un espace vectoriel représentant chaque fichier audio musical. Un module d'apprentissage automatique est prévu pour déduire une conversion entre les vecteurs à M dimensions et les vecteurs à F dimensions. Une entrée d'échantillon est destinée à la réception d'un fichier audio échantillon, à l'extraction de caractéristiques et à la production d'un vecteur à F dimensions déduit dans l'espace vectoriel. Un convertisseur est conçu pour convertir le vecteur à F dimensions en vecteur à M dimensions déduit dans l'espace vectoriel, à l'aide de la conversion déduite. Une sortie permet de sélectionner et de récupérer les fichiers audio musicaux au moyen du vecteur à M dimensions déduit. |
---|