APPARATUS AND METHOD EMPLOYING A PERCEPTION-BASED DISTANCE METRIC FOR SPATIAL AUDIO

An apparatus (100) according to an embodiment is provided. The apparatus comprises an input interface (110) for receiving a plurality of audio objects of an audio sound scene. Moreover, the apparatus (100) comprises a processor (120). Each of the plurality of audio objects represents a sound source...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DELGADO, Pablo Manuel, DICK, Sascha, HERRE, Jürgen
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:An apparatus (100) according to an embodiment is provided. The apparatus comprises an input interface (110) for receiving a plurality of audio objects of an audio sound scene. Moreover, the apparatus (100) comprises a processor (120). Each of the plurality of audio objects represents a sound source being different from any other sound source being represented by any other audio object of the plurality of audio objects; or at least two of the plurality of audio objects represent a same sound source at different locations. The processor (120) is configured to obtain information on a perceptual difference between two audio objects of the plurality of audio objects depending on a distance metric, wherein the distance metric represents perceptual differences in spatial properties of the audio sound scene. And/or, the processor (120) is configured to process the plurality of audio objects to obtain a plurality of audio object clusters or a plurality of processed audio objects depending on the distance metric. L'invention concerne, selon un mode de réalisation, un appareil (100). L'appareil comprend une interface d'entrée (110) pour recevoir une pluralité d'objets audio d'une scène sonore audio. En outre, l'appareil (100) comprend un processeur (120). Chaque objet audio de la pluralité d'objets audio représente une source sonore qui est différente de toute autre source sonore représentée par n'importe quel autre objet audio de la pluralité d'objets audio ; ou au moins deux objets audio de la pluralité d'objets audio représentent une même source sonore à différents emplacements. Le processeur (120) est configuré pour obtenir des informations sur une différence perceptuelle entre deux objets audio de la pluralité d'objets audio en fonction d'une métrique de distance, la métrique de distance représentant des différences perceptuelles dans des propriétés spatiales de la scène sonore audio. Et/ou le processeur (120) est configuré pour traiter la pluralité d'objets audio pour obtenir une pluralité de groupes d'objets audio ou une pluralité d'objets audio traités en fonction de la métrique de distance.