Accès par le contenu aux documents manuscrits d’archives numérisés

Cet article présente l’accès par le contenu aux documents d’archives manuscrits. Cet accès doit s’appuyer sur des informations (annotations) associées aux images de documents. Nous proposons deux manières complémentaires de produire ces annotations : automatiquement en utilisant la reconnaissance de...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Document numérique 2003, Vol.7 (3-4), p.61-84
Hauptverfasser: Coüasnon, Bertrand, Camillerapp, Jean
Format: Artikel
Sprache:fre
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Cet article présente l’accès par le contenu aux documents d’archives manuscrits. Cet accès doit s’appuyer sur des informations (annotations) associées aux images de documents. Nous proposons deux manières complémentaires de produire ces annotations : automatiquement en utilisant la reconnaissance de documents, et collectivement sur internet par une saisie manuelle effectuée par les lecteurs eux-mêmes. Une plate-forme de gestion de ces annotations est présentée, ainsi que des exemples d’annotations automatiques sur des registres paroissiaux et d’état civil, des formulaires militaires (registres matricules) et des décrets de naturalisation, en utilisant une méthode générique de reconnaissance de documents. Cette méthode a été validé sur plus de 60 000 pages de documents. Des exemples d’annotations collectives construites sur des annotations automatiques sont donnés. This paper presents handwritten archives document retrieval by content. This retrieval is build on information (annotations) associated to document images. We propose two complementary ways of producing those annotations : automatically by using optical document recognition and collectively by using internet and a manual input by users. A platform for managing those annotations is presented as well as examples of automatic annotations on civil status registers, military forms and naturalization decrees, using a generic document recognition method. This method has been tested on more than 60,000 pages of documents. Examples of collective annotations built on automatic annotations are also given.
ISSN:1279-5127
1963-1014
DOI:10.3166/dn.7.3-4.61-84