AUTOMATIC TEXT RECOGNITION WITH LAYOUT PRESERVATION
Aspects of the subject technology include accessing, by an electronic device, a plurality of lines of text data and text attributes corresponding to the plurality of lines of the text data. Aspects may also include, for each respective line of the plurality of lines of the text data, determining whe...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Aspects of the subject technology include accessing, by an electronic device, a plurality of lines of text data and text attributes corresponding to the plurality of lines of the text data. Aspects may also include, for each respective line of the plurality of lines of the text data, determining whether the respective line and the subsequent line correspond to separate paragraphs within the text data based on a first of the text attributes that corresponds to the respective line of the plurality of lines with a second of the text attributes that corresponds to a subsequent line of the plurality of lines. Aspects may further include generating output data for the plurality of lines and performing at least one process for the plurality of lines of the text data using the generated output data.
Des aspects de la technologie de l'invention consistent à accéder, par un dispositif électronique, à une pluralité de lignes de données de texte et d'attributs de texte correspondant à la pluralité de lignes des données de texte. Des aspects peuvent également consister, pour chaque ligne respective de la pluralité de lignes des données de texte, à déterminer si la ligne respective et la ligne suivante correspondent à des paragraphes séparés dans les données de texte sur la base d'un premier des attributs de texte qui correspond à la ligne respective de la pluralité de lignes avec un second des attributs de texte qui correspond à une ligne suivante de la pluralité de lignes. Des aspects peuvent en outre consister à générer des données de sortie pour la pluralité de lignes et à effectuer au moins un processus pour la pluralité de lignes des données de texte à l'aide des données de sortie générées. |
---|