긴 형식의 텍스트 문서에 대한 자동화된 텍스트-음성 변환 발음 편집

본 발명의 양태는 긴 형식의 텍스트 문서에 대해 효율적인 자동화된 텍스트-음성 변환 발음 편집을 가능하게 하는 기술에 관한 것이다. 메모리와 프로세서를 포함하는 컴퓨팅 디바이스는 본 기술을 수행하도록 구성될 수 있다. 메모리는 텍스트 문서를 저장할 수 있다. 프로세서는 텍스트 문서의 단어를 처리하여 텍스트 문서의 자동화된 텍스트-음성 변환 처리 동안 잘못 발음될 것으로 예측되는 제1 후보 단어를 식별할 수 있다. 그런 다음, 프로세서는 제1 후보 단어 중 하나 이상의 후보 단어를 제거하고, 제1 후보 단어보다 적은 수의 후보 단어를...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DINGLER RYAN, RIVLIN JOHN, ZHANG YUANLEI, STANTON DAISY, SALVARANI CHRISTOPHER, HOSSAIN MD ENZAM, CHANG JUDY, KUKHAR NAZARII, SKERRY RYAN RUSSELL JOHN WYATT
Format: Patent
Sprache:kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:본 발명의 양태는 긴 형식의 텍스트 문서에 대해 효율적인 자동화된 텍스트-음성 변환 발음 편집을 가능하게 하는 기술에 관한 것이다. 메모리와 프로세서를 포함하는 컴퓨팅 디바이스는 본 기술을 수행하도록 구성될 수 있다. 메모리는 텍스트 문서를 저장할 수 있다. 프로세서는 텍스트 문서의 단어를 처리하여 텍스트 문서의 자동화된 텍스트-음성 변환 처리 동안 잘못 발음될 것으로 예측되는 제1 후보 단어를 식별할 수 있다. 그런 다음, 프로세서는 제1 후보 단어 중 하나 이상의 후보 단어를 제거하고, 제1 후보 단어보다 적은 수의 후보 단어를 갖는 제2 후보 단어를 획득하기 위해 제1 후보 단어를 필터링할 수 있다. 그런 다음, 프로세서는 텍스트 문서에 주석을 달아서 제2 후보 단어를 식별하는 주석화된 텍스트 문서를 획득하고, 제2 후보 단어 중 적어도 하나의 후보 단어를 식별하는 주석화된 텍스트 문서의 적어도 일부를 출력할 수 있다. Aspects of this disclosure are directed to techniques that enable efficient automated text-to-speech pronunciation editing for long form text documents. A computing device comprising a memory and a processor may he configured to perfom the techniques. The memory may store a text document. The processor may process words in the text document to identify first candidate words that are predicted to be mispronounced during automated text-to-speeeh processing of the text document. The processor may next filter the first candidate words to remove one or more candidate words of the first candidate words and obtain second candidate words that have fewer candidate w ords than the first candidate words. The processor may then annotate the text document to obtain an annotated text document that identifies the second candidate words, and output at least a portion of the annotated text document that identifies at least one candidate word of the second candidate words.