STRUCTURAL DECOMPOSITION IN HANDWRITING
The invention relates to a method for processing lists in handwriting (IN), comprising: initially classifying each of a plurality of text lines (LN) as a distinct text item (TI) which is not part of a list; and a classification process comprising a pattern detection in each text line (LN) for classi...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The invention relates to a method for processing lists in handwriting (IN), comprising: initially classifying each of a plurality of text lines (LN) as a distinct text item (TI) which is not part of a list; and a classification process comprising a pattern detection in each text line (LN) for classifying each text line starting with a predetermined list symbol (BT) as a distinct list item (LI) which is part of a list; determining an item indentation (22) of each text item (TI) with respect to a reference position (30) and determining for each list item (LI) a text indentation (24) representing the indentation of text comprised in said list item; and a merging step for merging, as part of a same text item (TI), or as part of a same list item (LI), if predefined conditions are met. A text structure data model may then be generated based on a result of the merging process, thereby defining each text line (LN) as part of either a text item (TI) or a list item (LI).
L'invention concerne un procédé de traitement de listes en écriture manuscrite (IN), comprenant : la classification initiale de chacune d'une pluralité de lignes de texte (LN) en tant qu'élément de texte distinct (TI) qui n'est pas une partie d'une liste ; et un processus de classification comprenant une détection de motif dans chaque ligne de texte (LN) pour classifier chaque ligne de texte en commençant par un symbole de liste prédéterminé (BT) en tant qu'élément de liste distinct (LI) qui fait partie d'une liste ; la détermination d'une indentation d'élément (22) de chaque élément de texte (TI) par rapport à une position de référence (30) et la détermination pour chaque élément de liste (LI) d'une indentation de texte (24) représentant l'indentation du texte compris dans ladite liste ; et une étape de fusion pour fusionner, en tant que partie d'un même élément de texte (TI), ou en tant que partie d'un même élément de liste (LI), si des conditions prédéfinies sont satisfaites. Un modèle de données de structure de texte peut ensuite être généré sur la base d'un résultat du processus de fusion, définissant ainsi chaque ligne de texte (LN) en tant que partie d'un élément de texte (TI) ou d'un élément de liste (LI). |
---|