Apparatus and method for improving context-based automatic interpretation performance
The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputte...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present invention relates to a device for improving context-based automatic interpretation performance. According to the present invention, the device comprises: a spoken voice input unit receiving a voice signal from a user; a previous sentence input unit which, when the voice signal is inputted by the spoken voice input unit, determines whether there exists a previous speech of the user; a voice encoding processing unit which, if there exists no previous speech of the user, decodes only the voice signal through the speech voice input unit, and if there exists a previous speech of the user, extracts a vector of the voice signal; a context encoding processing unit which, when there exists a previous speech, extracts a context vector from the previous speech, and transmits the extracted context vector of the previous speech; and an interpretation decoding processing unit which, when it is determined that there exists a previous speech of the user by the previous sentence input unit, decodes interpretation by using the vector attention information of the extracted voice signal and attention information of the context vector of the extracted previous speech based on a multi-language embedding language model, and outputs an interpretation result text. Therefore, performance can be improved.
본 발명은 문맥 기반 자동 통역 성능 향상 장치에 관한 것이다. 본 발명은 사용자로부터 음성 신호를 입력받는 발화 음성 입력부; 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화가 존재하는지를 판단하는 이전 문장 입력부; 사용자의 이전 발화가 존재하지 않으면 발화 음성 입력부를 통해 음성 신호만을 디코딩하고, 사용자의 이전 발화가 존재하면 음성 신호의 벡터를 추출하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부를 포함한다. |
---|