METHOD AND TTS SYSTEM FOR CHANGING THE SPEED AND THE PITCH OF THE SPEECH

속도 및 피치가 변경된 음성을 합성하는 방법이 제공된다. 본 발명의 방법은, 제 1 음성 신호에 제 1 홉 길이 및 제 1 윈도우 길이를 기반으로 단시간 푸리에 변환을 수행하여 스펙트로그램을 생성하고, 스펙트로그램으로부터 제 2 홉 길이 간격으로 제 2 윈도우 길이를 갖는 구간들의 음성 신호들을 생성할 수 있다. 이 때, 제 2 홉 길이에 대한 제 1 홉 길이의 비는 배속율의 값과 같고, 제 2 윈도우 길이에 대한 제 1 윈도우 길이의 비는 피치 변경율의 값과 같도록 설정하여 속도 및 피치가 변경된 제 2 음성 신호를 생성할 수 있...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KANG JIN BEOM, NAM YONG WOOK, JOO DONG WON
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator KANG JIN BEOM
NAM YONG WOOK
JOO DONG WON
description 속도 및 피치가 변경된 음성을 합성하는 방법이 제공된다. 본 발명의 방법은, 제 1 음성 신호에 제 1 홉 길이 및 제 1 윈도우 길이를 기반으로 단시간 푸리에 변환을 수행하여 스펙트로그램을 생성하고, 스펙트로그램으로부터 제 2 홉 길이 간격으로 제 2 윈도우 길이를 갖는 구간들의 음성 신호들을 생성할 수 있다. 이 때, 제 2 홉 길이에 대한 제 1 홉 길이의 비는 배속율의 값과 같고, 제 2 윈도우 길이에 대한 제 1 윈도우 길이의 비는 피치 변경율의 값과 같도록 설정하여 속도 및 피치가 변경된 제 2 음성 신호를 생성할 수 있다.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_KR20240014251A</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>KR20240014251A</sourcerecordid><originalsourceid>FETCH-epo_espacenet_KR20240014251A3</originalsourceid><addsrcrecordid>eNrjZPDwdQ3x8HdRcPRzUQgJCVYIjgwOcfVVcPMPUnD2cPRz9_RzVwjxcFUIDnB1haoC8gI8Q5w9FPzd4FLOHjwMrGmJOcWpvFCam0HZzRWoSje1ID8-tbggMTk1L7Uk3jvIyMDIxMDA0MTI1NDRmDhVAFxcLNs</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>METHOD AND TTS SYSTEM FOR CHANGING THE SPEED AND THE PITCH OF THE SPEECH</title><source>esp@cenet</source><creator>KANG JIN BEOM ; NAM YONG WOOK ; JOO DONG WON</creator><creatorcontrib>KANG JIN BEOM ; NAM YONG WOOK ; JOO DONG WON</creatorcontrib><description>속도 및 피치가 변경된 음성을 합성하는 방법이 제공된다. 본 발명의 방법은, 제 1 음성 신호에 제 1 홉 길이 및 제 1 윈도우 길이를 기반으로 단시간 푸리에 변환을 수행하여 스펙트로그램을 생성하고, 스펙트로그램으로부터 제 2 홉 길이 간격으로 제 2 윈도우 길이를 갖는 구간들의 음성 신호들을 생성할 수 있다. 이 때, 제 2 홉 길이에 대한 제 1 홉 길이의 비는 배속율의 값과 같고, 제 2 윈도우 길이에 대한 제 1 윈도우 길이의 비는 피치 변경율의 값과 같도록 설정하여 속도 및 피치가 변경된 제 2 음성 신호를 생성할 수 있다.</description><language>eng ; kor</language><subject>ACOUSTICS ; MUSICAL INSTRUMENTS ; PHYSICS ; SPEECH ANALYSIS OR SYNTHESIS ; SPEECH OR AUDIO CODING OR DECODING ; SPEECH OR VOICE PROCESSING ; SPEECH RECOGNITION</subject><creationdate>2024</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20240201&amp;DB=EPODOC&amp;CC=KR&amp;NR=20240014251A$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25564,76547</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20240201&amp;DB=EPODOC&amp;CC=KR&amp;NR=20240014251A$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>KANG JIN BEOM</creatorcontrib><creatorcontrib>NAM YONG WOOK</creatorcontrib><creatorcontrib>JOO DONG WON</creatorcontrib><title>METHOD AND TTS SYSTEM FOR CHANGING THE SPEED AND THE PITCH OF THE SPEECH</title><description>속도 및 피치가 변경된 음성을 합성하는 방법이 제공된다. 본 발명의 방법은, 제 1 음성 신호에 제 1 홉 길이 및 제 1 윈도우 길이를 기반으로 단시간 푸리에 변환을 수행하여 스펙트로그램을 생성하고, 스펙트로그램으로부터 제 2 홉 길이 간격으로 제 2 윈도우 길이를 갖는 구간들의 음성 신호들을 생성할 수 있다. 이 때, 제 2 홉 길이에 대한 제 1 홉 길이의 비는 배속율의 값과 같고, 제 2 윈도우 길이에 대한 제 1 윈도우 길이의 비는 피치 변경율의 값과 같도록 설정하여 속도 및 피치가 변경된 제 2 음성 신호를 생성할 수 있다.</description><subject>ACOUSTICS</subject><subject>MUSICAL INSTRUMENTS</subject><subject>PHYSICS</subject><subject>SPEECH ANALYSIS OR SYNTHESIS</subject><subject>SPEECH OR AUDIO CODING OR DECODING</subject><subject>SPEECH OR VOICE PROCESSING</subject><subject>SPEECH RECOGNITION</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2024</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZPDwdQ3x8HdRcPRzUQgJCVYIjgwOcfVVcPMPUnD2cPRz9_RzVwjxcFUIDnB1haoC8gI8Q5w9FPzd4FLOHjwMrGmJOcWpvFCam0HZzRWoSje1ID8-tbggMTk1L7Uk3jvIyMDIxMDA0MTI1NDRmDhVAFxcLNs</recordid><startdate>20240201</startdate><enddate>20240201</enddate><creator>KANG JIN BEOM</creator><creator>NAM YONG WOOK</creator><creator>JOO DONG WON</creator><scope>EVB</scope></search><sort><creationdate>20240201</creationdate><title>METHOD AND TTS SYSTEM FOR CHANGING THE SPEED AND THE PITCH OF THE SPEECH</title><author>KANG JIN BEOM ; NAM YONG WOOK ; JOO DONG WON</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_KR20240014251A3</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; kor</language><creationdate>2024</creationdate><topic>ACOUSTICS</topic><topic>MUSICAL INSTRUMENTS</topic><topic>PHYSICS</topic><topic>SPEECH ANALYSIS OR SYNTHESIS</topic><topic>SPEECH OR AUDIO CODING OR DECODING</topic><topic>SPEECH OR VOICE PROCESSING</topic><topic>SPEECH RECOGNITION</topic><toplevel>online_resources</toplevel><creatorcontrib>KANG JIN BEOM</creatorcontrib><creatorcontrib>NAM YONG WOOK</creatorcontrib><creatorcontrib>JOO DONG WON</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>KANG JIN BEOM</au><au>NAM YONG WOOK</au><au>JOO DONG WON</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>METHOD AND TTS SYSTEM FOR CHANGING THE SPEED AND THE PITCH OF THE SPEECH</title><date>2024-02-01</date><risdate>2024</risdate><abstract>속도 및 피치가 변경된 음성을 합성하는 방법이 제공된다. 본 발명의 방법은, 제 1 음성 신호에 제 1 홉 길이 및 제 1 윈도우 길이를 기반으로 단시간 푸리에 변환을 수행하여 스펙트로그램을 생성하고, 스펙트로그램으로부터 제 2 홉 길이 간격으로 제 2 윈도우 길이를 갖는 구간들의 음성 신호들을 생성할 수 있다. 이 때, 제 2 홉 길이에 대한 제 1 홉 길이의 비는 배속율의 값과 같고, 제 2 윈도우 길이에 대한 제 1 윈도우 길이의 비는 피치 변경율의 값과 같도록 설정하여 속도 및 피치가 변경된 제 2 음성 신호를 생성할 수 있다.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; kor
recordid cdi_epo_espacenet_KR20240014251A
source esp@cenet
subjects ACOUSTICS
MUSICAL INSTRUMENTS
PHYSICS
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
title METHOD AND TTS SYSTEM FOR CHANGING THE SPEED AND THE PITCH OF THE SPEECH
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2024-12-29T11%3A02%3A09IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=KANG%20JIN%20BEOM&rft.date=2024-02-01&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EKR20240014251A%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true