Sign language translation system and method for converting voice of video into avatar and animation
The present invention relates to sign language translation system and method for converting voice of a video into avatars and animations, which enables an output unit to output the generated avatars and animations to solve problems of translating into sign language only when an existing user directl...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present invention relates to sign language translation system and method for converting voice of a video into avatars and animations, which enables an output unit to output the generated avatars and animations to solve problems of translating into sign language only when an existing user directly enters input data. That is, the system of the present invention comprises: a voice extraction part constructed using number 201 to extract the voice from the video; a text conversion part constructed by extracting features from the extracted voice so that the extracted voice of the video can be converted into text; a text refining part refining the converted text so as to output the text as accurate information and forming morphemes; a sign language translation part composed of a model which translates the refined text into sign language using deep learning technology so that the refined text can be translated into sign language; a sign language animation converting part; an output part configured by placing converted animation at the bottom of a screen so that generated avatars and animations can be output; a signal analysis part configured to extract the voice from the video so that a voice signal can be analyzed; a voice part consists of accurate data from the analyzed voice so that the analyzed voice can be refined; a feature extraction part configured to extract related voice features from voice data; a score extraction part configured to calculate a score for the features extracted from the voice data; a score selection part configured to select the score having the maximum value from the score calculation result; a post-processing part configured to combine elements with the score having the maximum value; and an output part configured to output the combined result on the screen.
본 발명은 영상의 음성을 아바타 및 애니메이션으로 변환하는 수화번역 시스템 및 방법에 관한 것으로서 출력부에 의하여 생성된 아바타 및 애니메이션을 출력할 수 있게 함으로써 사용자가 입력 데이터를 직접 넣어야 수화로 번역을 하는 문제점을 해소하도록 함으로써 기존의 사용자가 입력 데이터를 직접 넣어야 수화로 번역을 하는 문제점을 해소 하도록 한 것이다.즉 본 발명은, 수화 번역 프로그램에 있어서 영상에서 음성을 추출할 수 있게 201번을 이용하여 구성한 음성 추출부, 추출한 영상의 음성을 텍스트로 변환할 수 있게 추출한 음성에서 특징추출하여 구성한 텍스트 변환부, 변환된 텍스트를 정확한 정보를 출력할 수 있게 변환된 텍스트를 정제하여 형태소로 구성한 텍스트 정제부, 정제된 텍스트를 수어로 번역할 수 있게 정제된 텍스트를 딥러닝 기술을 활용하여 수어로 번역한 모델로 구성한 수어 번역부, 번역된 수어를 아바타 및 애니메이션으로 생성할 수 있게 수화에 대한 데이터를 모델에 학습을 시켜 수어를 애니메이션으로 변환하는 것으로 구성한 수화 애니메이션 변환부, 생성된 아바타 및 애니메이션을 출력할 수 있게 변환된 애니메이션을 화면 하단에 위치하는 것으로 구성한 출력부, 음성 신호를 분석할 수 있게 영상의 음성을 추출하는 것으로 구성한 신호 분석부, 분석한 음성을 정제할 수 있게 분석한 음성을 정확한 데이터로 구성한 음성부, |
---|