TRANING APPARATUS AND METHOD FOR DOCUMENT STRUCTURE ANALYSIS APPARATUS AND METHOD FOR DOCUMENT STRUCTURE ANALYSIS
A learning device and method for document structure analysis are disclosed. The document structure analysis learning device according to one embodiment comprises: a metadata generating unit for generating metadata for each of a plurality of document images based on the plurality of document images a...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A learning device and method for document structure analysis are disclosed. The document structure analysis learning device according to one embodiment comprises: a metadata generating unit for generating metadata for each of a plurality of document images based on the plurality of document images and structure information of each of the plurality of document images; a classification unit for classifying a data set including the plurality of document images into a learning data set for each of a plurality of groups based on the metadata; and a first learning unit for learning a document structure analysis model for each of the plurality of groups based on each document image included in the corresponding learning data set among the learning data sets for each of the plurality of groups and the structure information of each document image. Accordingly, the accuracy of document structure analysis can be improved.
문서 구조 분석을 위한 학습 장치 및 방법이 개시된다. 일 실시예에 따른 문서 구조 분석 학습 장치는, 복수의 문서 이미지 및 상기 복수의 문서 이미지 각각에 대한 구조 정보(structure information)에 기초하여 상기 복수의 문서 이미지 각각에 대한 메타 데이터(meta data)를 생성하는 메타 데이터 생성부; 상기 메타 데이터에 기초하여 상기 복수의 문서 이미지를 포함하는 데이터 세트를 복수의 그룹 각각에 대한 학습 데이터 세트로 분류하는 분류부; 및 상기 복수의 그룹 각각에 대한 학습 데이터 세트 중 대응하는 학습 데이터 세트에 포함된 각 문서 이미지 및 상기 각 문서 이미지의 구조 정보에 기초하여 상기 복수의 그룹 각각에 대한 문서 구조 분석 모델을 학습하는 제1 학습부를 포함한다. |
---|