핸드라이팅에서의 구조 분해

본 발명은 핸드라이팅(IN)에서의 목록을 처리하기 위한 방법에 관한 것으로, 방법은, 목록의 일부가 아닌 별개의 텍스트 항목(TI)으로서 복수의 텍스트 라인(LN)의 각각을 초기에 분류하는 단계; 및 사전 결정된 목록 기호(BT)로 시작하는 각각의 텍스트 라인을 목록의 일부인 별개의 목록 항목(LI)으로서 분류하기 위한, 각각의 텍스트 라인(LN)에서의 패턴 검출을 포함하는 분류 프로세스; 기준 위치(30)에 대한 각각의 텍스트 항목(TI)의 항목 들여쓰기(22)를 결정하고 각각의 목록 항목(LI)에 대해, 상기 목록 항목에 포함된...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: VERGNE JULIEN, LORIANT NICOLAS
Format: Patent
Sprache:kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:본 발명은 핸드라이팅(IN)에서의 목록을 처리하기 위한 방법에 관한 것으로, 방법은, 목록의 일부가 아닌 별개의 텍스트 항목(TI)으로서 복수의 텍스트 라인(LN)의 각각을 초기에 분류하는 단계; 및 사전 결정된 목록 기호(BT)로 시작하는 각각의 텍스트 라인을 목록의 일부인 별개의 목록 항목(LI)으로서 분류하기 위한, 각각의 텍스트 라인(LN)에서의 패턴 검출을 포함하는 분류 프로세스; 기준 위치(30)에 대한 각각의 텍스트 항목(TI)의 항목 들여쓰기(22)를 결정하고 각각의 목록 항목(LI)에 대해, 상기 목록 항목에 포함된 텍스트의 들여쓰기를 나타내는 텍스트 들여쓰기(24)를 결정하는 단계; 및 사전 한정된 조건이 충족되면, 동일한 텍스트 항목(TI)의 일부로서 또는 동일한 목록 항목(LI)의 일부로서 병합하기 위한 병합 단계를 포함한다. 텍스트 구조 데이터 모델은 그런 다음 병합 프로세스의 결과에 기초하여 생성될 수 있으며, 이에 의해, 각각의 텍스트 라인(LN)을 텍스트 항목(TI) 또는 목록 항목(LI)의 일부로서 한정할 수 있다. The invention relates to a method for processing lists in handwriting (IN), comprising: initially classifying each of a plurality of text lines (LN) as a distinct text item (TI) which is not part of a list; and a classification process comprising a pattern detection in each text line (LN) for classifying each text line starting with a predetermined list symbol (BT) as a distinct list item (LI) which is part of a list; determining an item indentation (22) of each text item (TI) with respect to a reference position (30) and determining for each list item (LI) a text indentation (24) representing the indentation of text comprised in said list item; and a merging step for merging, as part of a same text item (TI), or as part of a same list item (LI), if predefined conditions are met. A text structure data model may then be generated based on a result of the merging process, thereby defining each text line (LN) as part of either a text item (TI) or a list item (LI).