Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe

In this paper, we present two methods for correcting Arabic words generated by text and/or speech recognizers. These techniques operate as post-processors and they are conceived to be adaptable. They correct rejection and substitution word errors. The former one is very linked to the dictionary and...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:ARIMA 2004-10, Vol.2, 2004-2005, p.1-18
Hauptverfasser: Sari, Toufik, Sellami, Mokhtar
Format: Artikel
Sprache:fre
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 18
container_issue
container_start_page 1
container_title ARIMA
container_volume 2, 2004-2005
creator Sari, Toufik
Sellami, Mokhtar
description In this paper, we present two methods for correcting Arabic words generated by text and/or speech recognizers. These techniques operate as post-processors and they are conceived to be adaptable. They correct rejection and substitution word errors. The former one is very linked to the dictionary and is called 'lexicon driven', when the orther is very general exploiting contextual information and called 'context driven'. Arabic language properties are very useful in morpho-lexical analysis and so they were strongly exploited in the development of the second method. Substitution errors are rewritten in rules for being used by a rule based system. The extensions to the other levels of language analysis are considered in perspectives. Nous proposons dans cet article deux méthodes universelles de post-traitement pour la correction des mots arabes issus des systèmes de reconnaissance de textes et de parole arabes. Elles sont conçues à être adaptables. Ces approches corrigent les erreurs de type rejet et substitution. L'une d'elles est étroitement liée au dictionnaire elle est dite guidée par le lexique, l'autre, guidée par le contexte, est plus générale exploitant les information contextuelles. Les propriétés de la langue arabe sont très utiles en analyse morpho-lexicale et par conséquent elles sont fortement exploitées dans le développement de la deuxième méthode. Les erreurs de substitution sont réécrites sous formes de règles de production et utilisées par un système de production. Les extensions aux autres niveaux du traitement du langage sont envisagées en perspectives.
doi_str_mv 10.46298/arima.2555
format Article
fullrecord <record><control><sourceid>hal</sourceid><recordid>TN_cdi_hal_primary_oai_HAL_hal_01261705v1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>oai_HAL_hal_01261705v1</sourcerecordid><originalsourceid>FETCH-LOGICAL-h715-5245365a3ddc55cbe9adaa5fa201434610f885a3c99e2995498822f581c56f223</originalsourceid><addsrcrecordid>eNotkE1OwzAUhC0kJKrSFRfwDrFI8bPzXHtZVfxJldh0H706DgmkcbFTpN4IztGLkRRWo_lGM4th7AbEPNfSmnuKzY7mEhEv2AS0MhkuQF2xWUrvQgilQGmACftYhRi965vQ8dIn7gd3iImH2NfhLdK-bj4PAx-zdEz96Xt3dnwoha6jJiXqnB9Je3v6cbHpD9Fz358J8T3F0HpOkbb-ml1W1CY_-9cp2zw-bFbP2fr16WW1XGf1AjBDmaPSSKosHaLbekslEVYkBeQq1yAqY4bYWeultZhbY6Ss0IBDXUmppuzub7amttiPP8RjEagpnpfrYmQCpIaFwC9Qv3lrXDQ</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe</title><source>Alma/SFX Local Collection</source><creator>Sari, Toufik ; Sellami, Mokhtar</creator><creatorcontrib>Sari, Toufik ; Sellami, Mokhtar</creatorcontrib><description>In this paper, we present two methods for correcting Arabic words generated by text and/or speech recognizers. These techniques operate as post-processors and they are conceived to be adaptable. They correct rejection and substitution word errors. The former one is very linked to the dictionary and is called 'lexicon driven', when the orther is very general exploiting contextual information and called 'context driven'. Arabic language properties are very useful in morpho-lexical analysis and so they were strongly exploited in the development of the second method. Substitution errors are rewritten in rules for being used by a rule based system. The extensions to the other levels of language analysis are considered in perspectives. Nous proposons dans cet article deux méthodes universelles de post-traitement pour la correction des mots arabes issus des systèmes de reconnaissance de textes et de parole arabes. Elles sont conçues à être adaptables. Ces approches corrigent les erreurs de type rejet et substitution. L'une d'elles est étroitement liée au dictionnaire elle est dite guidée par le lexique, l'autre, guidée par le contexte, est plus générale exploitant les information contextuelles. Les propriétés de la langue arabe sont très utiles en analyse morpho-lexicale et par conséquent elles sont fortement exploitées dans le développement de la deuxième méthode. Les erreurs de substitution sont réécrites sous formes de règles de production et utilisées par un système de production. Les extensions aux autres niveaux du traitement du langage sont envisagées en perspectives.</description><identifier>EISSN: 1638-5713</identifier><identifier>DOI: 10.46298/arima.2555</identifier><language>fre</language><publisher>African Society in Digital Science</publisher><subject>Computer Science ; Mathematics</subject><ispartof>ARIMA, 2004-10, Vol.2, 2004-2005, p.1-18</ispartof><rights>Distributed under a Creative Commons Attribution 4.0 International License</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>230,314,776,780,881,27901,27902</link.rule.ids><backlink>$$Uhttps://inria.hal.science/hal-01261705$$DView record in HAL$$Hfree_for_read</backlink></links><search><creatorcontrib>Sari, Toufik</creatorcontrib><creatorcontrib>Sellami, Mokhtar</creatorcontrib><title>Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe</title><title>ARIMA</title><description>In this paper, we present two methods for correcting Arabic words generated by text and/or speech recognizers. These techniques operate as post-processors and they are conceived to be adaptable. They correct rejection and substitution word errors. The former one is very linked to the dictionary and is called 'lexicon driven', when the orther is very general exploiting contextual information and called 'context driven'. Arabic language properties are very useful in morpho-lexical analysis and so they were strongly exploited in the development of the second method. Substitution errors are rewritten in rules for being used by a rule based system. The extensions to the other levels of language analysis are considered in perspectives. Nous proposons dans cet article deux méthodes universelles de post-traitement pour la correction des mots arabes issus des systèmes de reconnaissance de textes et de parole arabes. Elles sont conçues à être adaptables. Ces approches corrigent les erreurs de type rejet et substitution. L'une d'elles est étroitement liée au dictionnaire elle est dite guidée par le lexique, l'autre, guidée par le contexte, est plus générale exploitant les information contextuelles. Les propriétés de la langue arabe sont très utiles en analyse morpho-lexicale et par conséquent elles sont fortement exploitées dans le développement de la deuxième méthode. Les erreurs de substitution sont réécrites sous formes de règles de production et utilisées par un système de production. Les extensions aux autres niveaux du traitement du langage sont envisagées en perspectives.</description><subject>Computer Science</subject><subject>Mathematics</subject><issn>1638-5713</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2004</creationdate><recordtype>article</recordtype><recordid>eNotkE1OwzAUhC0kJKrSFRfwDrFI8bPzXHtZVfxJldh0H706DgmkcbFTpN4IztGLkRRWo_lGM4th7AbEPNfSmnuKzY7mEhEv2AS0MhkuQF2xWUrvQgilQGmACftYhRi965vQ8dIn7gd3iImH2NfhLdK-bj4PAx-zdEz96Xt3dnwoha6jJiXqnB9Je3v6cbHpD9Fz358J8T3F0HpOkbb-ml1W1CY_-9cp2zw-bFbP2fr16WW1XGf1AjBDmaPSSKosHaLbekslEVYkBeQq1yAqY4bYWeultZhbY6Ss0IBDXUmppuzub7amttiPP8RjEagpnpfrYmQCpIaFwC9Qv3lrXDQ</recordid><startdate>20041022</startdate><enddate>20041022</enddate><creator>Sari, Toufik</creator><creator>Sellami, Mokhtar</creator><general>African Society in Digital Science</general><scope>1XC</scope><scope>VOOES</scope></search><sort><creationdate>20041022</creationdate><title>Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe</title><author>Sari, Toufik ; Sellami, Mokhtar</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-h715-5245365a3ddc55cbe9adaa5fa201434610f885a3c99e2995498822f581c56f223</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>fre</language><creationdate>2004</creationdate><topic>Computer Science</topic><topic>Mathematics</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Sari, Toufik</creatorcontrib><creatorcontrib>Sellami, Mokhtar</creatorcontrib><collection>Hyper Article en Ligne (HAL)</collection><collection>Hyper Article en Ligne (HAL) (Open Access)</collection><jtitle>ARIMA</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Sari, Toufik</au><au>Sellami, Mokhtar</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe</atitle><jtitle>ARIMA</jtitle><date>2004-10-22</date><risdate>2004</risdate><volume>2, 2004-2005</volume><spage>1</spage><epage>18</epage><pages>1-18</pages><eissn>1638-5713</eissn><abstract>In this paper, we present two methods for correcting Arabic words generated by text and/or speech recognizers. These techniques operate as post-processors and they are conceived to be adaptable. They correct rejection and substitution word errors. The former one is very linked to the dictionary and is called 'lexicon driven', when the orther is very general exploiting contextual information and called 'context driven'. Arabic language properties are very useful in morpho-lexical analysis and so they were strongly exploited in the development of the second method. Substitution errors are rewritten in rules for being used by a rule based system. The extensions to the other levels of language analysis are considered in perspectives. Nous proposons dans cet article deux méthodes universelles de post-traitement pour la correction des mots arabes issus des systèmes de reconnaissance de textes et de parole arabes. Elles sont conçues à être adaptables. Ces approches corrigent les erreurs de type rejet et substitution. L'une d'elles est étroitement liée au dictionnaire elle est dite guidée par le lexique, l'autre, guidée par le contexte, est plus générale exploitant les information contextuelles. Les propriétés de la langue arabe sont très utiles en analyse morpho-lexicale et par conséquent elles sont fortement exploitées dans le développement de la deuxième méthode. Les erreurs de substitution sont réécrites sous formes de règles de production et utilisées par un système de production. Les extensions aux autres niveaux du traitement du langage sont envisagées en perspectives.</abstract><pub>African Society in Digital Science</pub><doi>10.46298/arima.2555</doi><tpages>18</tpages><oa>free_for_read</oa></addata></record>
fulltext fulltext
identifier EISSN: 1638-5713
ispartof ARIMA, 2004-10, Vol.2, 2004-2005, p.1-18
issn 1638-5713
language fre
recordid cdi_hal_primary_oai_HAL_hal_01261705v1
source Alma/SFX Local Collection
subjects Computer Science
Mathematics
title Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-02T20%3A23%3A51IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-hal&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Correction%20des%20erreurs%20orthographiques%20des%20syst%C3%A8mes%20de%20reconnaissance%20de%20l'%C3%A9criture%20et%20de%20la%20parole%20arabe&rft.jtitle=ARIMA&rft.au=Sari,%20Toufik&rft.date=2004-10-22&rft.volume=2,%202004-2005&rft.spage=1&rft.epage=18&rft.pages=1-18&rft.eissn=1638-5713&rft_id=info:doi/10.46298/arima.2555&rft_dat=%3Chal%3Eoai_HAL_hal_01261705v1%3C/hal%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true