Method and apparatus for calculating loss used in task-specific adapter learning process

A method for calculating a loss used in a task-specific adapter learning process comprises: a step of generating a second sentence encoder model by adding a task-specific adapter to a first sentence encoder model having a pre-learned transformer structure; a step of inputting an input sentence obtai...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: YOON YONG SUN, LEE JUNG HOON, KANG JIN BEOM, JOO DONG WON
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method for calculating a loss used in a task-specific adapter learning process comprises: a step of generating a second sentence encoder model by adding a task-specific adapter to a first sentence encoder model having a pre-learned transformer structure; a step of inputting an input sentence obtained from a preset learning database into the second sentence encoder model; a step of obtaining a correct answer label and a prediction label based on the input sentence and the second sentence encoder model; a step of setting a first loss function and a second loss function different from each other; a step of setting an adapter learning loss function by adding a first function based on the first loss function and a first weight and a second function based on the second loss function and a second weight; and a step of calculating loss based on the correct answer label, the prediction label, and the adapter learning loss function. Therefore, the present invention is capable of solving a problem of requiring a high-performance resource of a GPU and the like. 기 학습된 트랜스포머(Transformer) 구조를 가지는 제1 문장 인코더 모델에 과제 특화 어댑터를 부가함으로써 제2 문장 인코더 모델을 생성하는 단계; 기 설정된 학습 데이터베이스로부터 획득되는 입력 문장을 상기 제2 문장 인코더 모델에 입력하는 단계; 상기 입력 문장 및 상기 제2 문장 인코더 모델에 기초하여 정답 레이블 및 예측 레이블을 획득하는 단계; 서로 다른 제1 손실함수 및 제2 손실함수를 설정하는 단계; 상기 제1 손실함수 및 제1 가중치에 기초한 제1 함수와 상기 제2 손실함수 및 제2 가중치에 기초한 제2 함수를 합산하여 어댑터 학습 손실함수를 설정하는 단계; 및 상기 정답 레이블, 상기 예측 레이블 및 상기 어댑터 학습 손실함수에 기초하여 손실을 계산하는 단계;를 포함하는, 과제 특화 어댑터 학습 과정에 이용되는 손실을 계산하는 방법.