TRANSFORMING ENCODINGS OF DOCUMENTS WITH EMBEDDED MATHEMATICAL FORMULAS
Symbol recognition techniques may be applied to documents comprising various forms of content. Documents including both text and mathematical expressions may be problematic, as applying a recognizer that does not match the content may produce anomalous results. Instead, a parser may evaluate the doc...
Gespeichert in:
Hauptverfasser: | , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Symbol recognition techniques may be applied to documents comprising various forms of content. Documents including both text and mathematical expressions may be problematic, as applying a recognizer that does not match the content may produce anomalous results. Instead, a parser may evaluate the document to classify respective regions as one of a text region or a mathematics region, based on the characteristics of each type of content. The recognizer corresponding to the content of each region may be applied to produce a composite document comprising both recognized text expressions and recognized mathematical expressions. Additional functionality may be presented based on the recognized content; e.g., text-based tools such as spell-check and natural-language translation may be applied to the text regions that comprise text expressions, and mathematics-based tools such as mathematical equation editors, mathematical expression solvers, and automated assignment grading may be applied to the mathematics regions that comprise mathematical expressions.
Selon l'invention, des techniques de reconnaissance de symboles peuvent être appliquées à des documents comprenant diverses formes de contenu. Des documents comprenant à la fois du texte et des expressions mathématiques peuvent être problématiques, puisqu'un dispositif de reconnaissance qui ne correspond pas au contenu peut produire des résultats anormaux. Au lieu de cela, un analyseur peut évaluer le document pour classer des régions respectives comme étant une région de texte ou une région mathématique, sur la base des caractéristiques de chaque type de contenu. Le dispositif de reconnaissance correspondant au contenu de chaque région peut être appliqué pour produire un document composite comprenant à la fois des expressions textuelles reconnues et des expressions mathématiques reconnues. Une fonctionnalité supplémentaire peut être présentée sur la base du contenu reconnu ; par exemple, des outils à base de texte tels que la vérification orthographique et la traduction de langage naturel peuvent être appliqués aux régions de texte qui comprennent des expressions de texte, et des outils mathématiques tels que des éditeurs d'équation mathématique, des solveurs d'expression mathématique, et un classement d'attribution automatisé peuvent être appliqués aux régions mathématiques qui comprennent des expressions mathématiques. |
---|