Apparatus and method for improving context-based automatic interpretation performance

The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputte...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KIM SANG HUN, YUN SEUNG, BANG JEONG UK, LEE MIN KYU
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator KIM SANG HUN
YUN SEUNG
BANG JEONG UK
LEE MIN KYU
description The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputted by the spoken voice input unit, determines whether there exists a previous speech of the user; a voice encoding processing unit which, if there exists no previous speech of the user, decodes only the voice signal through the speech voice input unit, and if there exists a previous speech of the user, extracts a vector of the voice signal; a context encoding processing unit which, when there exists a previous speech, extracts a context vector from the previous speech, and transmits the extracted context vector of the previous speech; and an interpretation decoding processing unit which, when it is determined that there exists a previous speech of the user by the previous sentence input unit, decodes interpretation by using the vector attention information of the extracted voice signal and attention information of the context vector of the extracted previous speech based on a multi-language embedding language model, and outputs an interpretation result text. Therefore, performance can be improved. 본 발명은 문맥 기반 자동 통역 성능 향상 장치에 관한 것이다. 본 발명은 사용자로부터 음성 신호를 입력받는 발화 음성 입력부; 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화가 존재하는지를 판단하는 이전 문장 입력부; 사용자의 이전 발화가 존재하지 않으면 발화 음성 입력부를 통해 음성 신호만을 디코딩하고, 사용자의 이전 발화가 존재하면 음성 신호의 벡터를 추출하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부를 포함한다.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_KR20230106414A</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>KR20230106414A</sourcerecordid><originalsourceid>FETCH-epo_espacenet_KR20230106414A3</originalsourceid><addsrcrecordid>eNqNi7sKAjEQRbexEPUfBqwXsg_sF1EEO9F6GZNZDZjMkMyKn28KP8Dqcg7nLqvbIIIJdc6A0UEgfbKDiRP4IInfPj7AclT6aH3HTA5wVg6o3oIvOkkiLcQRhFL5BYyW1tViwlemzW9X1fZ4uO5PNQmPlAUtRdLxfGlN25nG7PqmH7r_qi88XDsP</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>Apparatus and method for improving context-based automatic interpretation performance</title><source>esp@cenet</source><creator>KIM SANG HUN ; YUN SEUNG ; BANG JEONG UK ; LEE MIN KYU</creator><creatorcontrib>KIM SANG HUN ; YUN SEUNG ; BANG JEONG UK ; LEE MIN KYU</creatorcontrib><description>The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputted by the spoken voice input unit, determines whether there exists a previous speech of the user; a voice encoding processing unit which, if there exists no previous speech of the user, decodes only the voice signal through the speech voice input unit, and if there exists a previous speech of the user, extracts a vector of the voice signal; a context encoding processing unit which, when there exists a previous speech, extracts a context vector from the previous speech, and transmits the extracted context vector of the previous speech; and an interpretation decoding processing unit which, when it is determined that there exists a previous speech of the user by the previous sentence input unit, decodes interpretation by using the vector attention information of the extracted voice signal and attention information of the context vector of the extracted previous speech based on a multi-language embedding language model, and outputs an interpretation result text. Therefore, performance can be improved. 본 발명은 문맥 기반 자동 통역 성능 향상 장치에 관한 것이다. 본 발명은 사용자로부터 음성 신호를 입력받는 발화 음성 입력부; 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화가 존재하는지를 판단하는 이전 문장 입력부; 사용자의 이전 발화가 존재하지 않으면 발화 음성 입력부를 통해 음성 신호만을 디코딩하고, 사용자의 이전 발화가 존재하면 음성 신호의 벡터를 추출하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부를 포함한다.</description><language>eng ; kor</language><subject>ACOUSTICS ; CALCULATING ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; MUSICAL INSTRUMENTS ; PHYSICS ; SPEECH ANALYSIS OR SYNTHESIS ; SPEECH OR AUDIO CODING OR DECODING ; SPEECH OR VOICE PROCESSING ; SPEECH RECOGNITION</subject><creationdate>2023</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20230713&amp;DB=EPODOC&amp;CC=KR&amp;NR=20230106414A$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25564,76547</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20230713&amp;DB=EPODOC&amp;CC=KR&amp;NR=20230106414A$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>KIM SANG HUN</creatorcontrib><creatorcontrib>YUN SEUNG</creatorcontrib><creatorcontrib>BANG JEONG UK</creatorcontrib><creatorcontrib>LEE MIN KYU</creatorcontrib><title>Apparatus and method for improving context-based automatic interpretation performance</title><description>The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputted by the spoken voice input unit, determines whether there exists a previous speech of the user; a voice encoding processing unit which, if there exists no previous speech of the user, decodes only the voice signal through the speech voice input unit, and if there exists a previous speech of the user, extracts a vector of the voice signal; a context encoding processing unit which, when there exists a previous speech, extracts a context vector from the previous speech, and transmits the extracted context vector of the previous speech; and an interpretation decoding processing unit which, when it is determined that there exists a previous speech of the user by the previous sentence input unit, decodes interpretation by using the vector attention information of the extracted voice signal and attention information of the context vector of the extracted previous speech based on a multi-language embedding language model, and outputs an interpretation result text. Therefore, performance can be improved. 본 발명은 문맥 기반 자동 통역 성능 향상 장치에 관한 것이다. 본 발명은 사용자로부터 음성 신호를 입력받는 발화 음성 입력부; 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화가 존재하는지를 판단하는 이전 문장 입력부; 사용자의 이전 발화가 존재하지 않으면 발화 음성 입력부를 통해 음성 신호만을 디코딩하고, 사용자의 이전 발화가 존재하면 음성 신호의 벡터를 추출하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부를 포함한다.</description><subject>ACOUSTICS</subject><subject>CALCULATING</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>MUSICAL INSTRUMENTS</subject><subject>PHYSICS</subject><subject>SPEECH ANALYSIS OR SYNTHESIS</subject><subject>SPEECH OR AUDIO CODING OR DECODING</subject><subject>SPEECH OR VOICE PROCESSING</subject><subject>SPEECH RECOGNITION</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2023</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNqNi7sKAjEQRbexEPUfBqwXsg_sF1EEO9F6GZNZDZjMkMyKn28KP8Dqcg7nLqvbIIIJdc6A0UEgfbKDiRP4IInfPj7AclT6aH3HTA5wVg6o3oIvOkkiLcQRhFL5BYyW1tViwlemzW9X1fZ4uO5PNQmPlAUtRdLxfGlN25nG7PqmH7r_qi88XDsP</recordid><startdate>20230713</startdate><enddate>20230713</enddate><creator>KIM SANG HUN</creator><creator>YUN SEUNG</creator><creator>BANG JEONG UK</creator><creator>LEE MIN KYU</creator><scope>EVB</scope></search><sort><creationdate>20230713</creationdate><title>Apparatus and method for improving context-based automatic interpretation performance</title><author>KIM SANG HUN ; YUN SEUNG ; BANG JEONG UK ; LEE MIN KYU</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_KR20230106414A3</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; kor</language><creationdate>2023</creationdate><topic>ACOUSTICS</topic><topic>CALCULATING</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>MUSICAL INSTRUMENTS</topic><topic>PHYSICS</topic><topic>SPEECH ANALYSIS OR SYNTHESIS</topic><topic>SPEECH OR AUDIO CODING OR DECODING</topic><topic>SPEECH OR VOICE PROCESSING</topic><topic>SPEECH RECOGNITION</topic><toplevel>online_resources</toplevel><creatorcontrib>KIM SANG HUN</creatorcontrib><creatorcontrib>YUN SEUNG</creatorcontrib><creatorcontrib>BANG JEONG UK</creatorcontrib><creatorcontrib>LEE MIN KYU</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>KIM SANG HUN</au><au>YUN SEUNG</au><au>BANG JEONG UK</au><au>LEE MIN KYU</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>Apparatus and method for improving context-based automatic interpretation performance</title><date>2023-07-13</date><risdate>2023</risdate><abstract>The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputted by the spoken voice input unit, determines whether there exists a previous speech of the user; a voice encoding processing unit which, if there exists no previous speech of the user, decodes only the voice signal through the speech voice input unit, and if there exists a previous speech of the user, extracts a vector of the voice signal; a context encoding processing unit which, when there exists a previous speech, extracts a context vector from the previous speech, and transmits the extracted context vector of the previous speech; and an interpretation decoding processing unit which, when it is determined that there exists a previous speech of the user by the previous sentence input unit, decodes interpretation by using the vector attention information of the extracted voice signal and attention information of the context vector of the extracted previous speech based on a multi-language embedding language model, and outputs an interpretation result text. Therefore, performance can be improved. 본 발명은 문맥 기반 자동 통역 성능 향상 장치에 관한 것이다. 본 발명은 사용자로부터 음성 신호를 입력받는 발화 음성 입력부; 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화가 존재하는지를 판단하는 이전 문장 입력부; 사용자의 이전 발화가 존재하지 않으면 발화 음성 입력부를 통해 음성 신호만을 디코딩하고, 사용자의 이전 발화가 존재하면 음성 신호의 벡터를 추출하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부를 포함한다.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; kor
recordid cdi_epo_espacenet_KR20230106414A
source esp@cenet
subjects ACOUSTICS
CALCULATING
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
MUSICAL INSTRUMENTS
PHYSICS
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
title Apparatus and method for improving context-based automatic interpretation performance
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2024-12-25T11%3A09%3A58IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=KIM%20SANG%20HUN&rft.date=2023-07-13&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EKR20230106414A%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true