Method and apparatus for calculating loss used in task-specific adapter learning process
A method for calculating a loss used in a task-specific adapter learning process comprises: a step of generating a second sentence encoder model by adding a task-specific adapter to a first sentence encoder model having a pre-learned transformer structure; a step of inputting an input sentence obtai...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A method for calculating a loss used in a task-specific adapter learning process comprises: a step of generating a second sentence encoder model by adding a task-specific adapter to a first sentence encoder model having a pre-learned transformer structure; a step of inputting an input sentence obtained from a preset learning database into the second sentence encoder model; a step of obtaining a correct answer label and a prediction label based on the input sentence and the second sentence encoder model; a step of setting a first loss function and a second loss function different from each other; a step of setting an adapter learning loss function by adding a first function based on the first loss function and a first weight and a second function based on the second loss function and a second weight; and a step of calculating loss based on the correct answer label, the prediction label, and the adapter learning loss function. Therefore, the present invention is capable of solving a problem of requiring a high-performance resource of a GPU and the like.
기 학습된 트랜스포머(Transformer) 구조를 가지는 제1 문장 인코더 모델에 과제 특화 어댑터를 부가함으로써 제2 문장 인코더 모델을 생성하는 단계; 기 설정된 학습 데이터베이스로부터 획득되는 입력 문장을 상기 제2 문장 인코더 모델에 입력하는 단계; 상기 입력 문장 및 상기 제2 문장 인코더 모델에 기초하여 정답 레이블 및 예측 레이블을 획득하는 단계; 서로 다른 제1 손실함수 및 제2 손실함수를 설정하는 단계; 상기 제1 손실함수 및 제1 가중치에 기초한 제1 함수와 상기 제2 손실함수 및 제2 가중치에 기초한 제2 함수를 합산하여 어댑터 학습 손실함수를 설정하는 단계; 및 상기 정답 레이블, 상기 예측 레이블 및 상기 어댑터 학습 손실함수에 기초하여 손실을 계산하는 단계;를 포함하는, 과제 특화 어댑터 학습 과정에 이용되는 손실을 계산하는 방법. |
---|