MINUTES SUMMARIZATION METHOD BASED ON ARTIFICIAL INTELLIGENCE

The present invention relates to an artificial intelligence (AI)-based minutes summarization method, which summarizes key agenda items from meeting minutes, which are documents which record what was discussed at a meeting. The method comprises: a data input step of entering minutes data; a preproces...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: YOU JAE AH, CHOI HAN GYUL, KIM JI SU
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention relates to an artificial intelligence (AI)-based minutes summarization method, which summarizes key agenda items from meeting minutes, which are documents which record what was discussed at a meeting. The method comprises: a data input step of entering minutes data; a preprocessing step of preprocessing the entered minutes data; a computational step of generating a summary of the preprocessed minutes data by using a create summary AI model; and an output step of outputting the generated summary. The preprocessing step is to identify the structure and content of the minutes data, and create new necessary data or remove unnecessary data based on the identified structure and content of the data. The create summary AI model uses a KoBART model, which has pre-trained bidirectional and auto-regressive transformers (BART) in Korean. The create summary AI model applies a post-training technique, which is a technique to improve performance by pre-training data similar to data to be used for learning before fine-tuning a pre-trained model. The output step is implemented as a web-based UI which displays the create summary result as an output value on a screen when meeting content is entered. According to the present invention, a summary of meeting minutes with excellent readability and coherence of sentences can be generated by performing a context-based generative summary, and core content can be grasped and organized in a short period of time from the content of conversations between a plurality of speakers over a long period of time in the meeting. 본 발명은 인공지능 기반 회의록 요약 방법에 관한 것으로서, 회의에서 논의된 내용이 문서로 기록된 회의록으로부터 핵심 안건을 요약하는 인공지능 기반 회의록 요약 방법에 있어서, 회의록 데이터를 입력하는 데이터 입력 단계; 입력된 상기 회의록 데이터를 전처리 하는 전처리 단계; 전처리된 상기 회의록 데이터를 생성 요약 AI 모델을 이용하여 요약문을 생성하는 연산 단계; 및 생성된 상기 요약문을 출력하는 출력 단계를 포함하고, 상기 전처리 단계는, 상기 회의록 데이터의 구조 및 내용을 파악하고, 파악된 상기 데이터의 구조 및 내용에 따라 필요한 데이터를 새로 만들거나 불필요한 데이터를 제거하고, 상기 생성 요약 AI 모델은, BART(Bidirectional and Auto-Regressive Transformers)를 한국어로 사전 훈련한 KoBART 모델을 이용하고, 상기 생성 요약 AI 모델은, 사전 훈련된 모델을 미세 조정(fine-tuning) 하기 전에 학습에 사용할 데이터와 유사한 데이터를 미리 훈련시켜 성능을 높이는 기법인 post-training 기법을 적용하고, 상기 출력 단계는, 회의 내용을 입력하면 출력 값인 생성 요약 결과를 화면에 보여주는 웹 기반 UI로 구현되는 것을 특징으로 한다. 본 발명에 따르면, 문맥에 기반한 생성 요약을 함으로써 문장의 가독성과 응집성이 뛰어난 회의록 요약문이 생성될 수 있고, 회의에서 긴 시간 동안 다수의 발화자가 대화한 내용으로부터 핵심 내용을 단시간에 파악하고 정리할 수 있는 효과가 있다.