오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사

프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SIOHAN OLIVER, ROSE RICHARD, MAKINO TAKAKI, CASTILLO BASILIO GARCIA, BRAGA OTAVIO, LIAO HANK
Format: Patent
Sprache:kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator SIOHAN OLIVER
ROSE RICHARD
MAKINO TAKAKI
CASTILLO BASILIO GARCIA
BRAGA OTAVIO
LIAO HANK
description 프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가자를 포함하는지 여부를 결정하는 단계를 포함한다. 상기 대응 세그먼트의 화자의 신원이 상기 참가자를 포함하는 경우, 방법은 프라이버시 조건을 상기 대응 세그먼트에 적용하는 단계를 포함한다. 또한 방법은 상기 오디오 데이터에 대한 전사를 결정하기 위해 상기 오디오 데이터의 상기 복수의 세그먼트들을 프로세싱하는 단계를 포함한다. A method for a privacy-aware transcription includes receiving audio-visual signal including audio data and image data for a speech environment and a privacy request from a participant in the speech environment where the privacy request indicates a privacy condition of the participant. The method further includes segmenting the audio data into a plurality of segments. For each segment, the method includes determining an identity of a speaker of a corresponding segment of the audio data based on the image data and determining whether the identity of the speaker of the corresponding segment includes the participant associated with the privacy condition. When the identity of the speaker of the corresponding segment includes the participant, the method includes applying the privacy condition to the corresponding segment. The method also includes processing the plurality of segments of the audio data to determine a transcript for the audio data.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_KR20220101672A</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>KR20220101672A</sourcerecordid><originalsourceid>FETCH-epo_espacenet_KR20220101672A3</originalsourceid><addsrcrecordid>eNrjZPB-M2PJ6ylTgKTu650tbxbveTNtj8KbriVvu3a8XrbnzfQJb1rmKLyd0vJ67p43c7e83tTypnuO7pu5O950z1V4O6vnzdwZb7qXKLxZ0PKmaQ0PA2taYk5xKi-U5mZQdnMNcfbQTS3Ij08tLkhMTs1LLYn3DjIyMDIyMDQwNDM3cjQmThUAc4BMJw</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사</title><source>esp@cenet</source><creator>SIOHAN OLIVER ; ROSE RICHARD ; MAKINO TAKAKI ; CASTILLO BASILIO GARCIA ; BRAGA OTAVIO ; LIAO HANK</creator><creatorcontrib>SIOHAN OLIVER ; ROSE RICHARD ; MAKINO TAKAKI ; CASTILLO BASILIO GARCIA ; BRAGA OTAVIO ; LIAO HANK</creatorcontrib><description>프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가자를 포함하는지 여부를 결정하는 단계를 포함한다. 상기 대응 세그먼트의 화자의 신원이 상기 참가자를 포함하는 경우, 방법은 프라이버시 조건을 상기 대응 세그먼트에 적용하는 단계를 포함한다. 또한 방법은 상기 오디오 데이터에 대한 전사를 결정하기 위해 상기 오디오 데이터의 상기 복수의 세그먼트들을 프로세싱하는 단계를 포함한다. A method for a privacy-aware transcription includes receiving audio-visual signal including audio data and image data for a speech environment and a privacy request from a participant in the speech environment where the privacy request indicates a privacy condition of the participant. The method further includes segmenting the audio data into a plurality of segments. For each segment, the method includes determining an identity of a speaker of a corresponding segment of the audio data based on the image data and determining whether the identity of the speaker of the corresponding segment includes the participant associated with the privacy condition. When the identity of the speaker of the corresponding segment includes the participant, the method includes applying the privacy condition to the corresponding segment. The method also includes processing the plurality of segments of the audio data to determine a transcript for the audio data.</description><language>kor</language><subject>ACOUSTICS ; CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC COMMUNICATION TECHNIQUE ; ELECTRIC DIGITAL DATA PROCESSING ; ELECTRICITY ; MUSICAL INSTRUMENTS ; PHYSICS ; PICTORIAL COMMUNICATION, e.g. TELEVISION ; SPEECH ANALYSIS OR SYNTHESIS ; SPEECH OR AUDIO CODING OR DECODING ; SPEECH OR VOICE PROCESSING ; SPEECH RECOGNITION ; TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION</subject><creationdate>2022</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220719&amp;DB=EPODOC&amp;CC=KR&amp;NR=20220101672A$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25543,76293</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220719&amp;DB=EPODOC&amp;CC=KR&amp;NR=20220101672A$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>SIOHAN OLIVER</creatorcontrib><creatorcontrib>ROSE RICHARD</creatorcontrib><creatorcontrib>MAKINO TAKAKI</creatorcontrib><creatorcontrib>CASTILLO BASILIO GARCIA</creatorcontrib><creatorcontrib>BRAGA OTAVIO</creatorcontrib><creatorcontrib>LIAO HANK</creatorcontrib><title>오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사</title><description>프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가자를 포함하는지 여부를 결정하는 단계를 포함한다. 상기 대응 세그먼트의 화자의 신원이 상기 참가자를 포함하는 경우, 방법은 프라이버시 조건을 상기 대응 세그먼트에 적용하는 단계를 포함한다. 또한 방법은 상기 오디오 데이터에 대한 전사를 결정하기 위해 상기 오디오 데이터의 상기 복수의 세그먼트들을 프로세싱하는 단계를 포함한다. A method for a privacy-aware transcription includes receiving audio-visual signal including audio data and image data for a speech environment and a privacy request from a participant in the speech environment where the privacy request indicates a privacy condition of the participant. The method further includes segmenting the audio data into a plurality of segments. For each segment, the method includes determining an identity of a speaker of a corresponding segment of the audio data based on the image data and determining whether the identity of the speaker of the corresponding segment includes the participant associated with the privacy condition. When the identity of the speaker of the corresponding segment includes the participant, the method includes applying the privacy condition to the corresponding segment. The method also includes processing the plurality of segments of the audio data to determine a transcript for the audio data.</description><subject>ACOUSTICS</subject><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC COMMUNICATION TECHNIQUE</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>ELECTRICITY</subject><subject>MUSICAL INSTRUMENTS</subject><subject>PHYSICS</subject><subject>PICTORIAL COMMUNICATION, e.g. TELEVISION</subject><subject>SPEECH ANALYSIS OR SYNTHESIS</subject><subject>SPEECH OR AUDIO CODING OR DECODING</subject><subject>SPEECH OR VOICE PROCESSING</subject><subject>SPEECH RECOGNITION</subject><subject>TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2022</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZPB-M2PJ6ylTgKTu650tbxbveTNtj8KbriVvu3a8XrbnzfQJb1rmKLyd0vJ67p43c7e83tTypnuO7pu5O950z1V4O6vnzdwZb7qXKLxZ0PKmaQ0PA2taYk5xKi-U5mZQdnMNcfbQTS3Ij08tLkhMTs1LLYn3DjIyMDIyMDQwNDM3cjQmThUAc4BMJw</recordid><startdate>20220719</startdate><enddate>20220719</enddate><creator>SIOHAN OLIVER</creator><creator>ROSE RICHARD</creator><creator>MAKINO TAKAKI</creator><creator>CASTILLO BASILIO GARCIA</creator><creator>BRAGA OTAVIO</creator><creator>LIAO HANK</creator><scope>EVB</scope></search><sort><creationdate>20220719</creationdate><title>오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사</title><author>SIOHAN OLIVER ; ROSE RICHARD ; MAKINO TAKAKI ; CASTILLO BASILIO GARCIA ; BRAGA OTAVIO ; LIAO HANK</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_KR20220101672A3</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>kor</language><creationdate>2022</creationdate><topic>ACOUSTICS</topic><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC COMMUNICATION TECHNIQUE</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>ELECTRICITY</topic><topic>MUSICAL INSTRUMENTS</topic><topic>PHYSICS</topic><topic>PICTORIAL COMMUNICATION, e.g. TELEVISION</topic><topic>SPEECH ANALYSIS OR SYNTHESIS</topic><topic>SPEECH OR AUDIO CODING OR DECODING</topic><topic>SPEECH OR VOICE PROCESSING</topic><topic>SPEECH RECOGNITION</topic><topic>TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION</topic><toplevel>online_resources</toplevel><creatorcontrib>SIOHAN OLIVER</creatorcontrib><creatorcontrib>ROSE RICHARD</creatorcontrib><creatorcontrib>MAKINO TAKAKI</creatorcontrib><creatorcontrib>CASTILLO BASILIO GARCIA</creatorcontrib><creatorcontrib>BRAGA OTAVIO</creatorcontrib><creatorcontrib>LIAO HANK</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>SIOHAN OLIVER</au><au>ROSE RICHARD</au><au>MAKINO TAKAKI</au><au>CASTILLO BASILIO GARCIA</au><au>BRAGA OTAVIO</au><au>LIAO HANK</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사</title><date>2022-07-19</date><risdate>2022</risdate><abstract>프라이버시-인식 전사를 위한 방법은 음성 환경에서 오디오 데이터 및 이미지 데이터를 포함하는 오디오-비주얼 신호 및 음성 환경의 참가자로부터 프라이버시 요청을 수신하는 단계를 포함하고, 상기 프라이버시 요청은 참가자에 대한 프라이버시 조건을 표시한다. 방법은 또한 상기 오디오 데이터를 복수의 세그먼트들로 세그먼트화하는 단계를 포함한다. 각 세그먼트에 대해, 방법은 상기 이미지 데이터에 기초하여 상기 오디오 데이터의 대응 세그먼트의 화자의 신원을 결정하는 단계 및 상기 대응 세그먼트의 화자의 신원이 상기 프라이버시 조건과 연관된 참가자를 포함하는지 여부를 결정하는 단계를 포함한다. 상기 대응 세그먼트의 화자의 신원이 상기 참가자를 포함하는 경우, 방법은 프라이버시 조건을 상기 대응 세그먼트에 적용하는 단계를 포함한다. 또한 방법은 상기 오디오 데이터에 대한 전사를 결정하기 위해 상기 오디오 데이터의 상기 복수의 세그먼트들을 프로세싱하는 단계를 포함한다. A method for a privacy-aware transcription includes receiving audio-visual signal including audio data and image data for a speech environment and a privacy request from a participant in the speech environment where the privacy request indicates a privacy condition of the participant. The method further includes segmenting the audio data into a plurality of segments. For each segment, the method includes determining an identity of a speaker of a corresponding segment of the audio data based on the image data and determining whether the identity of the speaker of the corresponding segment includes the participant associated with the privacy condition. When the identity of the speaker of the corresponding segment includes the participant, the method includes applying the privacy condition to the corresponding segment. The method also includes processing the plurality of segments of the audio data to determine a transcript for the audio data.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language kor
recordid cdi_epo_espacenet_KR20220101672A
source esp@cenet
subjects ACOUSTICS
CALCULATING
COMPUTING
COUNTING
ELECTRIC COMMUNICATION TECHNIQUE
ELECTRIC DIGITAL DATA PROCESSING
ELECTRICITY
MUSICAL INSTRUMENTS
PHYSICS
PICTORIAL COMMUNICATION, e.g. TELEVISION
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION
title 오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-23T15%3A29%3A45IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=SIOHAN%20OLIVER&rft.date=2022-07-19&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EKR20220101672A%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true