APPARATUS, METHODS AND COMPUTER PROGRAMS FOR TRAINING MACHINE LEARNING MODELS

According to examples of the disclosure there is provided an apparatus comprising means (321) for training a machine learning model such as a neural network to estimate spatial metadata for a spatial sound distribution (303). The apparatus comprises means (305) for obtaining first capture data (307)...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: VILKAMO, Juha Tapio, HONKALA, Mikko Johannes
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:According to examples of the disclosure there is provided an apparatus comprising means (321) for training a machine learning model such as a neural network to estimate spatial metadata for a spatial sound distribution (303). The apparatus comprises means (305) for obtaining first capture data (307) for a machine learning model where the first capture data (307) is related to a plurality of spatial sound distributions (303) and where the first capture data (307) relates to a target device configured to obtain at least two microphone signals. The apparatus also comprises means (313) for obtaining second capture data (315) for the machine learning model where the second capture data (315) is obtained using the same plurality of spatial sound distributions (303) and where the second capture data (315) comprises information indicative of spatial properties of the plurality of spatial sound distributions (303) and the second capture data (315) is obtained using a reference capture method (313). The apparatus also comprises means (321) for training the machine learning model to estimate the second capture data (315) based on the first capture data (307). Selon des modes de réalisation donnés à titre d'exemple, la divulgation concerne un appareil comprenant un moyen (321) pour entraîner un modèle d'apprentissage automatique, comme un réseau neuronal, pour estimer des métadonnées spatiales pour une distribution de son spatial (303). L'appareil comprend un moyen (305) pour obtenir des premières données de capture (307) pour un modèle d'apprentissage automatique, les premières données de capture (307) se rapportant à une pluralité de distributions de son spatial (303) et les premières données de capture (307) se rapportant à un dispositif cible configuré pour obtenir au moins deux signaux de microphone. L'appareil comprend également un moyen (313) pour obtenir des secondes données de capture (315) pour le modèle d'apprentissage automatique, les secondes données de capture (315) étant obtenues à l'aide de la même pluralité de distributions de son spatial (303) et les secondes données de capture (315) comprenant des informations indicatives de propriétés spatiales de la pluralité de distributions de son spatial (303) et les secondes données de capture (315) étant obtenues à l'aide d'un procédé de capture de référence (313). L'appareil comprend également un moyen (321) pour entraîner le modèle d'apprentissage automatique à estimer les secondes données de capture (315)