COMPUTER SYSTEM AND CHARACTER RECOGNITION METHOD
This computer system comprises: a feature value extraction unit that calculates, from an input image, feature values for time series data of a first number of time steps; an identification candidate output unit that calculates a probability corresponding to each of a plurality of characters in the t...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Patent |
Sprache: | eng ; fre ; jpn |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | This computer system comprises: a feature value extraction unit that calculates, from an input image, feature values for time series data of a first number of time steps; an identification candidate output unit that calculates a probability corresponding to each of a plurality of characters in the time steps on the basis of the feature values for the time series data; and a decoding unit that executes a process for using CTC to generate a first character string configured from the most probable characters in the time steps and output a second character string configured from a second number of characters by deleting a prescribed time step from the first character string, and a process for outputting a third character string configured from a third number of characters by correcting the second character string on the basis of a correction rule using language knowledge and the processing results of the identification candidate output unit.
La présente invention concerne un système informatique qui comprend : une unité d'extraction de valeur de caractéristiques qui calcule, à partir d'une image d'entrée, des valeurs de caractéristiques pour des données de série chronologique d'un premier nombre d'étapes temporelles ; une unité de sortie de candidat d'identification qui calcule une probabilité correspondant à chaque caractère d'une pluralité de caractères dans les étapes temporelles sur la base des valeurs de caractéristiques pour les données de série chronologique ; et une unité de décodage qui exécute un processus pour utiliser des CTC pour générer une première chaîne de caractères configurée à partir des caractères les plus probables dans les étapes temporelles et pour délivrer en sortie une deuxième chaîne de caractères configurée à partir d'un deuxième nombre de caractères par suppression d'une étape temporelle prescrite à partir de la première chaîne de caractères, et un processus pour délivrer en sortie une troisième chaîne de caractères configurée à partir d'un troisième nombre de caractères en corrigeant la deuxième chaîne de caractères sur la base d'une règle de correction à l'aide de connaissances linguistiques et des résultats de traitement de l'unité de sortie de candidat d'identification.
計算機システムは、入力画像から、第一数のタイムステップの時系列データの特徴量を算出する特徴量抽出部と、時系列データの特徴量に基づいて、各タイムステップにおける複数の文字の各々に該当する確率を算出する識別候補出力部と、CTCを用いて、各タイムステップの確率が最大の文字から構成される第一文字列を生成し、第一文字列から所定のタイムステップを削除することによって第二数の文字から構成される第二文字列を出力する処理と、識別候補出力部の処理結果及び言語知識を用いた補正ルールに基づいて第二文字列を補正することによって第三数の文字から構 |
---|