ENHANCED CHROMA EXTRACTION FROM AN AUDIO CODEC

The present document relates to methods and systems for music information retrieval (MIR). In particular, the present document relates to methods and systems for extracting a chroma vector from an audio signal. A method (900) for determining a chroma vector (100) for a block of samples of an audio s...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: FINK, MARCO, BISWAS, ARIJIT, SCHUG, MICHAEL
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present document relates to methods and systems for music information retrieval (MIR). In particular, the present document relates to methods and systems for extracting a chroma vector from an audio signal. A method (900) for determining a chroma vector (100) for a block of samples of an audio signal (301) is described. The method (900) comprises receiving (901) a corresponding block of frequency coefficients derived from the block of samples of the audio signal (301) from a core encoder (412) of a spectral band replication based audio encoder (410) adapted to generate an encoded bitstream (305) of the audio signal (301) from the block of frequency coefficients; and determining (904) the chroma vector (100) for the block of samples of the audio signal (301) based on the received block of frequency coefficients. La présente invention concerne des procédés et des systèmes de récupération d'informations musicales (MIR). En particulier, la présente invention concerne des procédés et des systèmes pour extraire un vecteur de chrominance d'un signal audio. Un procédé (900) pour déterminer un vecteur de chrominance (100) pour un bloc d'échantillons d'un signal audio (301) est décrit. Le procédé (900) consiste à recevoir (901) un bloc correspondant de coefficients de fréquence obtenus à partir du bloc d'échantillons du signal audio (301) en provenance d'un codeur coeur (412) d'un codeur audio à base de duplication de bande spectrale (410) conçu pour générer un flux binaire codé (305) du signal audio (301) à partir du bloc de coefficients de fréquence; et déterminer (904) le vecteur de chrominance (100) pour le bloc d'échantillons du signal audio (301) sur la base du bloc de coefficients de fréquence reçu.