LOW-LATENCY NOISE SUPPRESSION

A device includes one or more processors configured to obtain audio data representing one or more audio signals. The audio data includes a first segment and a second segment subsequent to the first segment. The one or more processors are configured to perform one or more transform operations on the...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	ALVES, Rogerio Guedes, VISSER, Erik, BEAN, Jacob Jon, MONTAZERI, Vahid
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	ACOUSTICS DEAF-AID SETS ELECTRIC COMMUNICATION TECHNIQUE ELECTRICITY LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKEACOUSTIC ELECTROMECHANICAL TRANSDUCERS MUSICAL INSTRUMENTS PHYSICS PUBLIC ADDRESS SYSTEMS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	A device includes one or more processors configured to obtain audio data representing one or more audio signals. The audio data includes a first segment and a second segment subsequent to the first segment. The one or more processors are configured to perform one or more transform operations on the first segment to generate frequency-domain audio data. The one or more processors are configured to provide input data based on the frequency-domain audio data as input to one or more machine-learning models to generate a noise-suppression output. The one or more processors are configured to perform one or more reverse transform operations on the noise-suppression output to generate time-domain filter coefficients. The one or more processors are configured to perform time-domain filtering of the second segment using the time-domain filter coefficients to generate a noise-suppressed output signal. L'invention concerne un dispositif comprenant un ou plusieurs processeurs configurés pour obtenir des données audio représentant un ou plusieurs signaux audio. Les données audio comprennent un premier segment et un second segment suivant le premier segment. Le ou les processeurs sont configurés pour effectuer une ou plusieurs opérations de transformation sur le premier segment afin de générer des données audio de domaine fréquentiel. Le ou les processeurs sont configurés pour fournir des données d'entrée audio de domaine basées sur les données audio du domaine fréquentiel en tant qu'entrée à un ou plusieurs modèles d'apprentissage automatique pour générer une sortie de suppression de bruit. Le ou les processeurs sont configurés pour effectuer une ou plusieurs opérations de transformée inverse sur la sortie de suppression de bruit afin de générer des coefficients de filtre de domaine temporel. Le ou les processeurs sont configurés pour effectuer un filtrage dans le domaine temporel du second segment à l'aide des coefficients de filtre dans le domaine temporel afin de générer un signal de sortie à bruit supprimé.