METHOD AND APPARATUS FOR GENERATING QUESTION AND ANSWER DATASET BASED ON INPUT PARAGRAPH
A method for generating a question-answering dataset based on input of a paragraph including a plurality of sentences according to an embodiment of the present invention may include the steps of: generating a machine-readable data representation from an input paragraph through a neural network and s...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A method for generating a question-answering dataset based on input of a paragraph including a plurality of sentences according to an embodiment of the present invention may include the steps of: generating a machine-readable data representation from an input paragraph through a neural network and storing the data representation in memory; performing sampling on the data representation; calculating a similarity of the data representation associated with a query in the data representation of the memory by using the sampled data as the query; generating a response based on the similarity; and generating a query based on the response and the similarity.
본 발명의 실시예를 따르는 복수의 문장이 포함된 문단의 입력에 기초한 질의응답 데이터셋 생성방법은, 상기 입력된 문단으로부터 신경망 네트워크를 통해 기계가 판독가능한 데이터 표현을 생성하여 메모리에 저장하는 단계; 상기 데이터 표현에서 샘플링을 수행하는 단계; 상기 샘플링된 데이터를 쿼리로 하여, 상기 메모리의 상기 데이터 표현에서 상기 쿼리와 연관이 있는 데이터 표현의 유사도를 계산하는 단계; 상기 유사도를 기초로 응답을 생성하는 단계; 및 상기 응답과 상기 유사도를 기초로 질의를 생성하는 단계를 포함하는 것을 특징으로 한다. |
---|