Desenvolvimento de uma ferramenta computacional para recuperação e correção de textos digitalizados

Atualmente, há diversas ferramentas computacionais voltadas para identificação e reconhecimento de palavras em arquivos digitais, onde um grande problema tem sido o tratamento de ruídos (falhas de aquisição e erros ortográficos). Estas inconveniências fazem com que os algoritmos de reconhecimento ap...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Revista Brasileira de Computação Aplicada. 2013-05, Vol.5 (1), p.71-83
Hauptverfasser: Marlon Marcon, André Luiz Brun, Jorge Bidarra
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Atualmente, há diversas ferramentas computacionais voltadas para identificação e reconhecimento de palavras em arquivos digitais, onde um grande problema tem sido o tratamento de ruídos (falhas de aquisição e erros ortográficos). Estas inconveniências fazem com que os algoritmos de reconhecimento apresentem resultados abaixo do esperado. Este trabalho implementa uma solução para o reconhecimento de palavras com maior qualidade, aplicando algoritmos de remoção de ruído e melhora de contraste, bem como a adoção de um léxico aliado ao módulo de reconhecimento dos caracteres. Os resultados obtidos a partir dos testes de validação e correção das palavras com problemas com taxas de aproveitamento dentro dos limites esperados.
ISSN:2176-6649
DOI:10.5335/rbca.2013.2719