MATCHING AUDIO USING MACHINE LEARNING BASED AUDIO REPRESENTATIONS

Systems and techniques are described herein for encoding and/or decoding audio information. For example, a process can process an input audio segment to generate a representation of the input audio segment, and can compare the representation of the input audio segment to representations stored in a...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: LI, Sen, VILLETTE, Stephane, SINDER, Daniel Jared, RAMADAS, Pravin Kumar
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Systems and techniques are described herein for encoding and/or decoding audio information. For example, a process can process an input audio segment to generate a representation of the input audio segment, and can compare the representation of the input audio segment to representations stored in a memory. The representations represent a plurality of audio segments. The process can determine, based on the comparison, target representation(s) of target audio segment(s) from the representations stored in the memory. The process can determine one or more indices associated with the target audio segment(s). The process can then packetize the one or more indices and transmit the one or more packetized indices (e.g., to a decoder configured to decode the packetized indices). L'invention concerne des systèmes et des techniques permettant de coder et/ou de décoder des informations audio. Un procédé peut par exemple comprendre les étapes consistant à : traiter un segment audio d'entrée de façon à générer une représentation du segment audio d'entrée ; comparer la représentation du segment audio d'entrée à des représentations stockées en mémoire, les représentations représentant une pluralité de segments audio ; sur la base de la comparaison, déterminer une ou plusieurs représentations cibles d'un ou plusieurs segments audio cibles à partir des représentations stockées en mémoire ; déterminer un ou plusieurs indices associés auxdits un ou plusieurs segments audio cibles ; mettre en paquets lesdits un ou plusieurs indices ; et transmettre lesdits un ou plusieurs indices en paquets (par exemple à un décodeur configuré pour décoder les indices en paquets).