오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사

프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	SIOHAN OLIVER, ROSE RICHARD, MAKINO TAKAKI, CASTILLO BASILIO GARCIA, BRAGA OTAVIO, LIAO HANK
Format:	Patent
Sprache:	kor
Schlagworte:	ACOUSTICS CALCULATING COMPUTING COUNTING ELECTRIC COMMUNICATION TECHNIQUE ELECTRIC DIGITAL DATA PROCESSING ELECTRICITY MUSICAL INSTRUMENTS PHYSICS PICTORIAL COMMUNICATION, e.g. TELEVISION SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가자를 포함하는지 여부를 결정하는 단계를 포함한다. 상기 대응 세그먼트의 화자의 신원이 상기 참가자를 포함하는 경우, 방법은 프라이버시 조건을 상기 대응 세그먼트에 적용하는 단계를 포함한다. 또한 방법은 상기 오디오 데이터에 대한 전사를 결정하기 위해 상기 오디오 데이터의 상기 복수의 세그먼트들을 프로세싱하는 단계를 포함한다. A method for a privacy-aware transcription includes receiving audio-visual signal including audio data and image data for a speech environment and a privacy request from a participant in the speech environment where the privacy request indicates a privacy condition of the participant. The method further includes segmenting the audio data into a plurality of segments. For each segment, the method includes determining an identity of a speaker of a corresponding segment of the audio data based on the image data and determining whether the identity of the speaker of the corresponding segment includes the participant associated with the privacy condition. When the identity of the speaker of the corresponding segment includes the participant, the method includes applying the privacy condition to the corresponding segment. The method also includes processing the plurality of segments of the audio data to determine a transcript for the audio data.