LOW-LATENCY NOISE SUPPRESSION
A device includes one or more processors configured to obtain audio data representing one or more audio signals. The audio data includes a first segment and a second segment subsequent to the first segment. The one or more processors are configured to perform one or more transform operations on the...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A device includes one or more processors configured to obtain audio data representing one or more audio signals. The audio data includes a first segment and a second segment subsequent to the first segment. The one or more processors are configured to perform one or more transform operations on the first segment to generate frequency-domain audio data. The one or more processors are configured to provide input data based on the frequency-domain audio data as input to one or more machine-learning models to generate a noise-suppression output. The one or more processors are configured to perform one or more reverse transform operations on the noise-suppression output to generate time-domain filter coefficients. The one or more processors are configured to perform time-domain filtering of the second segment using the time-domain filter coefficients to generate a noise-suppressed output signal.
L'invention concerne un dispositif comprenant un ou plusieurs processeurs configurés pour obtenir des données audio représentant un ou plusieurs signaux audio. Les données audio comprennent un premier segment et un second segment suivant le premier segment. Le ou les processeurs sont configurés pour effectuer une ou plusieurs opérations de transformation sur le premier segment afin de générer des données audio de domaine fréquentiel. Le ou les processeurs sont configurés pour fournir des données d'entrée audio de domaine basées sur les données audio du domaine fréquentiel en tant qu'entrée à un ou plusieurs modèles d'apprentissage automatique pour générer une sortie de suppression de bruit. Le ou les processeurs sont configurés pour effectuer une ou plusieurs opérations de transformée inverse sur la sortie de suppression de bruit afin de générer des coefficients de filtre de domaine temporel. Le ou les processeurs sont configurés pour effectuer un filtrage dans le domaine temporel du second segment à l'aide des coefficients de filtre dans le domaine temporel afin de générer un signal de sortie à bruit supprimé. |
---|