Identificación en tiempo real de un orador con diarización

La invención se refiere a un sistema para la identificación en tiempo real de la identidad del orador de una conferencia, estando configurado el sistema para recibir al menos un flujo de datos de audio de entrada que representa una interacción entre una pluralidad de oradores individuales; en el que...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ROSEZ, Didier, DEMUYTERE, Pieter
Format: Patent
Sprache:spa
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:La invención se refiere a un sistema para la identificación en tiempo real de la identidad del orador de una conferencia, estando configurado el sistema para recibir al menos un flujo de datos de audio de entrada que representa una interacción entre una pluralidad de oradores individuales; en el que el sistema comprende una unidad de registro para segmentar dichos uno o más flujos de datos de audio de entrada en segmentos de audio homogéneos para el hablante; una unidad de perfil de altavoz que comprende una pluralidad de perfiles de altavoz individuales; y una unidad de identificación para asignar dichos segmentos de audio homogéneos del hablante a un hablante individual; en el que la unidad de registro está configurada además para derivar, para un segmento de audio, valores para un segundo conjunto de parámetros; y en el que dicho sistema comprende además un controlador que está configurado para monitorear la agenda, para controlar la identificación del orador de dichos segmentos y para compartir la identidad del orador de la conferencia. La invención se refiere además a un método para agregar e identificar un hablante no identificado a dicho sistema. (Traducción automática con Google Translate, sin valor legal) The invention refers to a system for real-time identification of conference speaker identity, the system being configured to receive at least one input audio data stream representing an interaction between a plurality of individual speakers; wherein the system comprises a diarization unit for segmenting said one or more input audio data streams into speaker-homogenous audio segments; a speaker profile unit comprising a plurality of individual speaker profiles; and an identification unit for assigning said speaker-homogenous audio segments to an individual speaker; wherein the diarization unit is further configured to derive for an audio segment values for a second set of parameters; and wherein said system further comprises a controller which is configured for monitoring diarization, for controlling speaker identification of said segments, and for sharing conference speaker identity. The invention further refers to a method for adding and identifying an unidentified speaker to said system.