RECOGNIZING HANDWRITTEN TEXT BY COMBINING NEURAL NETWORKS

A method for recognizing handwritten text is disclosed. The method comprises receiving data comprising a sequence of ink points; applying the received data to a neural network-based sequence classifier trained with a Connectionist Temporal Classification (CTC) output layer using forced alignment to...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ARADILLA, Guillermo, CEROVIC, Cyril, MANSON, Gaël, LALLICAN, Pierre-Michel
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method for recognizing handwritten text is disclosed. The method comprises receiving data comprising a sequence of ink points; applying the received data to a neural network-based sequence classifier trained with a Connectionist Temporal Classification (CTC) output layer using forced alignment to generate an output; generating a character hypothesis as a portion of the sequence of ink points; applying the character hypothesis to a character classifier to obtain a first probability corresponding to the probability that the character hypothesis includes the given character; processing the output of the CTC output layer to determine a second probability corresponding to the probability that the given character is observed within the character hypothesis; and combining the first probability and the second probability to obtain a combined probability corresponding to the probability that the character hypothesis includes the given character. L'invention concerne un procédé de reconnaissance de texte manuscrit. Le procédé comprend la réception de données comprenant une séquence de points d'encre; l'application des données reçues à un classificateur de séquences basé sur un réseau neuronal entraîné avec une couche de sortie de classification temporelle connexionniste (CTC) à l'aide d'un alignement forcé pour générer une sortie; la génération d'une hypothèse de caractère en tant que partie de la séquence de points d'encre; l'application de l'hypothèse de caractère à un classificateur de caractères pour obtenir une première probabilité correspondant à la probabilité que l'hypothèse de caractère comprenne le caractère donné; le traitement de la sortie de la couche de sortie CTC pour déterminer une seconde probabilité correspondant à la probabilité que le caractère donné soit observé dans l'hypothèse de caractère; et la combinaison de la première probabilité et de la seconde probabilité pour obtenir une probabilité combinée correspondant à la probabilité que l'hypothèse de caractère comprenne le caractère donné.