DOCUMENT CLASSIFICATION SYSTEM, DOCUMENT CLASSIFICATION DEVICE, DOCUMENT CLASSIFICATION METHOD, AND DOCUMENT CLASSIFICATION PRORAM
This document classification system 1 comprises: a pre-classification image database 20 for acquiring image data of a document; a first classification unit 30 for classifying the type of document from elements other than the text of the image data of the document; a first assessment unit 31 for asse...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre ; jpn |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | This document classification system 1 comprises: a pre-classification image database 20 for acquiring image data of a document; a first classification unit 30 for classifying the type of document from elements other than the text of the image data of the document; a first assessment unit 31 for assessing whether or not to confirm classification by the first classification unit 30, the assessment being made in accordance with first reliability R1 that is the reliability of classification by the first classification unit; and a second classification unit 32 for recognizing text within the image data for which the classification was not confirmed by the first assessment unit 31, and classifying the type of document from the recognized text.
La présente invention concerne un système de classification de documents 1 comprenant : une base de données d'images de pré-classification 20 pour acquérir des données d'image d'un document ; une première unité de classification 30 pour classer le type de document à partir d'éléments autres que le texte des données d'image du document ; une première unité d'évaluation 31 pour évaluer s'il faut ou non confirmer la classification par la première unité de classification 30, l'évaluation étant effectuée selon une première fiabilité R1 qui est la fiabilité de la classification par la première unité de classification ; et une seconde unité de classification 32 pour reconnaître un texte dans les données d'image pour lesquelles la classification n'a pas été confirmée par la première unité d'évaluation 31, et classer le type de document à partir du texte reconnu.
書類分類システム1は、書類の画像データを取得する分類前画像DB20と、書類の画像データの文字以外の要素から書類の種類を分類する第1分類部30と、第1分類部による分類の信頼度である第1信頼度R1に応じて第1分類部30による分類を確定するか否かの判定を行う第1判定部31と、第1判定部31により分類が確定されなかった画像データについて、当該画像データ内の文字を認識して認識した文字から書類の種類を分類する第2分類部32と、を備える。 |
---|