METHOD FOR AUTOMATICALLY CREATING TRAINING DATASET AND RETRAINING A GENERATIVE DEEP LEARNING MODEL THAT ANSWERS SPECIFIC DOMAIN-BASED QUESTIONS

본 발명은 특정 도메인 기반 질문에 대한 답변을 생성하는 딥러닝 모델의 학습을 위해 필요한 학습 데이터셋을 자동으로 생성하는 방법에 관한 것으로, 질문에 대한 답변을 생성하는 생성형 딥러닝 모델에 대한 학습 데이터셋 자동 생성 및 모델 재학습 장치에서, 특정 도메인의 인터넷 게시물을 수집하여 본문 텍스트를 추출하는 단계; 상기 본문 텍스트의 내용에 기반하여 질문 및 답변 세트를 생성하는 단계; 생성된 질문 및 답변 세트에 대해 질문에 대한 답변의 정확도를 검증하여 필터링하는 단계; 상기 필터링하는 단계를 거친 질문 및 답변 세트를...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KHO HYEONG SEOG, CHO CHANG HEE, LEE HONG JAE
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:본 발명은 특정 도메인 기반 질문에 대한 답변을 생성하는 딥러닝 모델의 학습을 위해 필요한 학습 데이터셋을 자동으로 생성하는 방법에 관한 것으로, 질문에 대한 답변을 생성하는 생성형 딥러닝 모델에 대한 학습 데이터셋 자동 생성 및 모델 재학습 장치에서, 특정 도메인의 인터넷 게시물을 수집하여 본문 텍스트를 추출하는 단계; 상기 본문 텍스트의 내용에 기반하여 질문 및 답변 세트를 생성하는 단계; 생성된 질문 및 답변 세트에 대해 질문에 대한 답변의 정확도를 검증하여 필터링하는 단계; 상기 필터링하는 단계를 거친 질문 및 답변 세트를 포함하여 학습 데이터셋을 생성하는 단계; 및 질문에 대한 답변을 생성하는 딥러닝 모델의 재학습 조건을 판단하여 상기 학습 데이터셋을 사용하여 상기 딥러닝 모델의 재학습을 수행하는 단계;를 포함한다.