Generating non-native pronunciation variants for lexicon adaptation

Handling non-native speech in automatic speech recognition (ASR) systems is an area of increasing interest. The majority of systems are tailored to native speech only and as a consequence performance for non-native speakers often is not satisfactory. One way to approach the problem is to adapt the a...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Speech communication 2004, Vol.42 (1), p.109-123
Hauptverfasser: Goronzy, Silke, Rapp, Stefan, Kompe, Ralf
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 123
container_issue 1
container_start_page 109
container_title Speech communication
container_volume 42
creator Goronzy, Silke
Rapp, Stefan
Kompe, Ralf
description Handling non-native speech in automatic speech recognition (ASR) systems is an area of increasing interest. The majority of systems are tailored to native speech only and as a consequence performance for non-native speakers often is not satisfactory. One way to approach the problem is to adapt the acoustic models to the new speaker. Another important means to improve performance for non-native speakers is to consider non-native pronunciations in the dictionary. The difficulty here lies in the generation of the non-native variants, especially if various accents are to be considered. Traditional approaches to model pronunciation variation either require phonetic expertise or extensive speech databases. They are too costly, especially if a flexible modelling of several accents is desired. We propose to exclusively use native speech databases to derive non-native pronunciation variants. We use an English phoneme recogniser to generate English pronunciations for German words and use these to train decision trees that are able to predict the respective English-accented variant from the German canonical transcription. Furthermore we combine this approach with online, incremental weighted MLLR speaker adaptation. Using the enhanced dictionary and the speaker adaptation alone improved the word error rate of the baseline system by 5.2% and 16.8%, respectively. When both methods were combined, we achieved an improvement of 18.2%. Die Verarbeitung nicht-muttersprachlicher Sprache in automatischen Spracherkennungssystemen gewinnt immer mehr an Bedeutung. Die meisten aktuellen Systeme sind jedoch darauf zugeschnitten, ausschließlich muttersprachliche Daten zu verarbeiten. Daher fallen die Erkennungsraten für nicht-muttersprachliche Sprecher oftmals sehr unzureichend aus. Eine Möglichkeit zur Lösung dieses Problems ist die Anwendung von Sprecheradaptionsverfahren, die die akustischen Modelle des Systems an den neuen Sprecher adaptieren. Eine weitere Möglichkeit, die Erkennungsraten für nicht-muttersprachliche Sprecher zu verbessern, ist die Berücksichtigung nicht-muttersprachlicher Aussprachevarianten im Lexikon des Erkennungssystems. Die Schwierigkeit bei diesem Verfahren besteht in der Herleitung dieser Varianten, besonders wenn viele verschiedene Akzente berücksichtigt werden sollen. Traditionelle Ansätze zur Aussprachemodellierung benötigen hierzu entweder phonetisches Wissen oder aber umfangreiche Sprachdatenbanken akzentuierter Sprache. Beide Verfahren sind jedoch
doi_str_mv 10.1016/j.specom.2003.09.003
format Article
fullrecord <record><control><sourceid>proquest_cross</sourceid><recordid>TN_cdi_proquest_miscellaneous_85596665</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><els_id>S0167639303001158</els_id><sourcerecordid>85333475</sourcerecordid><originalsourceid>FETCH-LOGICAL-c366t-11f77a26b888c8b9208f8cc14843fa0bfe721792ea8daf14bce49f2c25a7f9413</originalsourceid><addsrcrecordid>eNqNUMtOwzAQtBBIlMIfcMiJW4Ifie1ckFAFBakSFzhbjrNGrlI72GkFf49LOCNOs4-Z0e4gdE1wRTDht9sqjWDCrqIYswq3VYYTtCBS0FIQSU_RItNEyVnLztFFSluMcS0lXaDVGjxEPTn_XvjgS5_LAxRjDH7vjctd8MVBR6f9lAobYjHApzN5qHs9Tj_7S3Rm9ZDg6heX6O3x4XX1VG5e1s-r-01pGOdTSYgVQlPeSSmN7FqKpZXGkFrWzGrcWRCUiJaClr22pO4M1K2lhjZa2LYmbIluZt983cce0qR2LhkYBu0h7JOSTdNyzpt_EBljtTgS65loYkgpglVjdDsdvxTB6hit2qo5WnWMVuFWZciyu1kG-duDg6iSceAN9C6CmVQf3N8G32pghRI</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype><pqid>85333475</pqid></control><display><type>article</type><title>Generating non-native pronunciation variants for lexicon adaptation</title><source>Access via ScienceDirect (Elsevier)</source><creator>Goronzy, Silke ; Rapp, Stefan ; Kompe, Ralf</creator><creatorcontrib>Goronzy, Silke ; Rapp, Stefan ; Kompe, Ralf</creatorcontrib><description>Handling non-native speech in automatic speech recognition (ASR) systems is an area of increasing interest. The majority of systems are tailored to native speech only and as a consequence performance for non-native speakers often is not satisfactory. One way to approach the problem is to adapt the acoustic models to the new speaker. Another important means to improve performance for non-native speakers is to consider non-native pronunciations in the dictionary. The difficulty here lies in the generation of the non-native variants, especially if various accents are to be considered. Traditional approaches to model pronunciation variation either require phonetic expertise or extensive speech databases. They are too costly, especially if a flexible modelling of several accents is desired. We propose to exclusively use native speech databases to derive non-native pronunciation variants. We use an English phoneme recogniser to generate English pronunciations for German words and use these to train decision trees that are able to predict the respective English-accented variant from the German canonical transcription. Furthermore we combine this approach with online, incremental weighted MLLR speaker adaptation. Using the enhanced dictionary and the speaker adaptation alone improved the word error rate of the baseline system by 5.2% and 16.8%, respectively. When both methods were combined, we achieved an improvement of 18.2%. Die Verarbeitung nicht-muttersprachlicher Sprache in automatischen Spracherkennungssystemen gewinnt immer mehr an Bedeutung. Die meisten aktuellen Systeme sind jedoch darauf zugeschnitten, ausschließlich muttersprachliche Daten zu verarbeiten. Daher fallen die Erkennungsraten für nicht-muttersprachliche Sprecher oftmals sehr unzureichend aus. Eine Möglichkeit zur Lösung dieses Problems ist die Anwendung von Sprecheradaptionsverfahren, die die akustischen Modelle des Systems an den neuen Sprecher adaptieren. Eine weitere Möglichkeit, die Erkennungsraten für nicht-muttersprachliche Sprecher zu verbessern, ist die Berücksichtigung nicht-muttersprachlicher Aussprachevarianten im Lexikon des Erkennungssystems. Die Schwierigkeit bei diesem Verfahren besteht in der Herleitung dieser Varianten, besonders wenn viele verschiedene Akzente berücksichtigt werden sollen. Traditionelle Ansätze zur Aussprachemodellierung benötigen hierzu entweder phonetisches Wissen oder aber umfangreiche Sprachdatenbanken akzentuierter Sprache. Beide Verfahren sind jedoch für die Modellierung nicht-muttersprachlicher Aussprachevarianten zu aufwendig, besonders wenn mehrere Akzente berücksichtigt werden sollen. Aus diesen Gründen schlagen wir vor, ausschließlich muttersprachliche Sprachdaten zur Generierung nicht-muttersprachlicher Aussprachevarianten heranzuziehen. Wir setzen einen englischen Phonemerkenner zur Generierung englischer Aussprachevarianten für deutsche Wörter ein und benutzen diese, um einen Entscheidungsbaum zu trainieren, der dann in der Lage ist, englisch-akzentuierte Aussprachen aus kanonischen deutschen Aussprachen vorherzusagen. Wir haben diesen Ansatz zudem mit dem weighted MLLR Sprecheradaptionsverfahren kombiniert. In unseren Experimenten erzielten wir bei der Erkennung nicht-muttersprachlicher Sprache mit einem so erweiterten Lexikon eine Verbesserung von 5.2% der Wortfehlerrate. Die Sprecheradaption alleine erreichte eine Verbesserung von 16.8%. Wurden beide Verfahren kombiniert, konnte das Basissystem um 18.2% verbessert werden. La reconnaissance de langue non-maternelle est un sujet qui prend de plus en plus d’importance dans les systèmes de reconnaissance automatique de la parole. La majorité des systèmes existants sont spécialisés dans la reconnaissance de langue maternelle et par conséquent les résultats de reconnaissance sont insuffisants. Une possibilité pour approcher ce problème est d’adapter les models acoustiques au nouvel orateur. Un autre moyen important est de prendre en considération les variations de prononciation non-maternelle dans le dictionnaire du système. La difficulté ici est la génération de variations de prononciation étrangère, plus particulièrement dans le cas oú plusieurs différents accents seraient à prendre en considération. Les approches traditionnelles pour modeler la prononciation ont besoin soit de connaissance phonétique soit de banques de données de parole volumineuses en langue non-maternelle. Ces deux méthodes sont trop coteuses particulièrement si une modélisation flexible de plusieurs accents est désirée. Nous proposons donc l’utilisation de banque de données de parole en langue maternelle uniquement pour la génération de variations de prononciation en langue non-maternelle. Nous nous servons d’un système de reconnaissance de phonèmes anglais pour générer les variantes anglaises de mots allemands. Celles-ci sont ensuite utilisées pour entraîner des arbres de décision capables de prédire les variations de mots allemands prononcés avec un accent anglais. Nous avons combiné cette méthode avec la méthode d’adaptation de l’orateur MLLR. Nos expériences ont montré que l’utilisation d’un dictionnaire étendu par les variantes produites par cette méthode peut améliorer les resultats de 5.2% word error rate. Pour la méthode d’adaptation de l’orateur MLLR seule, les résultats sont améliorés de 16.8 %. En combinaison nous avons atteinds une amélioration de 18.2% en comparaison avec le dictionnaire normal.</description><identifier>ISSN: 0167-6393</identifier><identifier>EISSN: 1872-7182</identifier><identifier>DOI: 10.1016/j.specom.2003.09.003</identifier><identifier>CODEN: SCOMDH</identifier><language>eng</language><publisher>Elsevier B.V</publisher><subject>Non-native speech ; Pronunciation modelling ; Speaker adaptation</subject><ispartof>Speech communication, 2004, Vol.42 (1), p.109-123</ispartof><rights>2003 Elsevier B.V.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed><citedby>FETCH-LOGICAL-c366t-11f77a26b888c8b9208f8cc14843fa0bfe721792ea8daf14bce49f2c25a7f9413</citedby><cites>FETCH-LOGICAL-c366t-11f77a26b888c8b9208f8cc14843fa0bfe721792ea8daf14bce49f2c25a7f9413</cites></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://dx.doi.org/10.1016/j.specom.2003.09.003$$EHTML$$P50$$Gelsevier$$H</linktohtml><link.rule.ids>314,780,784,3550,4024,27923,27924,27925,45995</link.rule.ids></links><search><creatorcontrib>Goronzy, Silke</creatorcontrib><creatorcontrib>Rapp, Stefan</creatorcontrib><creatorcontrib>Kompe, Ralf</creatorcontrib><title>Generating non-native pronunciation variants for lexicon adaptation</title><title>Speech communication</title><description>Handling non-native speech in automatic speech recognition (ASR) systems is an area of increasing interest. The majority of systems are tailored to native speech only and as a consequence performance for non-native speakers often is not satisfactory. One way to approach the problem is to adapt the acoustic models to the new speaker. Another important means to improve performance for non-native speakers is to consider non-native pronunciations in the dictionary. The difficulty here lies in the generation of the non-native variants, especially if various accents are to be considered. Traditional approaches to model pronunciation variation either require phonetic expertise or extensive speech databases. They are too costly, especially if a flexible modelling of several accents is desired. We propose to exclusively use native speech databases to derive non-native pronunciation variants. We use an English phoneme recogniser to generate English pronunciations for German words and use these to train decision trees that are able to predict the respective English-accented variant from the German canonical transcription. Furthermore we combine this approach with online, incremental weighted MLLR speaker adaptation. Using the enhanced dictionary and the speaker adaptation alone improved the word error rate of the baseline system by 5.2% and 16.8%, respectively. When both methods were combined, we achieved an improvement of 18.2%. Die Verarbeitung nicht-muttersprachlicher Sprache in automatischen Spracherkennungssystemen gewinnt immer mehr an Bedeutung. Die meisten aktuellen Systeme sind jedoch darauf zugeschnitten, ausschließlich muttersprachliche Daten zu verarbeiten. Daher fallen die Erkennungsraten für nicht-muttersprachliche Sprecher oftmals sehr unzureichend aus. Eine Möglichkeit zur Lösung dieses Problems ist die Anwendung von Sprecheradaptionsverfahren, die die akustischen Modelle des Systems an den neuen Sprecher adaptieren. Eine weitere Möglichkeit, die Erkennungsraten für nicht-muttersprachliche Sprecher zu verbessern, ist die Berücksichtigung nicht-muttersprachlicher Aussprachevarianten im Lexikon des Erkennungssystems. Die Schwierigkeit bei diesem Verfahren besteht in der Herleitung dieser Varianten, besonders wenn viele verschiedene Akzente berücksichtigt werden sollen. Traditionelle Ansätze zur Aussprachemodellierung benötigen hierzu entweder phonetisches Wissen oder aber umfangreiche Sprachdatenbanken akzentuierter Sprache. Beide Verfahren sind jedoch für die Modellierung nicht-muttersprachlicher Aussprachevarianten zu aufwendig, besonders wenn mehrere Akzente berücksichtigt werden sollen. Aus diesen Gründen schlagen wir vor, ausschließlich muttersprachliche Sprachdaten zur Generierung nicht-muttersprachlicher Aussprachevarianten heranzuziehen. Wir setzen einen englischen Phonemerkenner zur Generierung englischer Aussprachevarianten für deutsche Wörter ein und benutzen diese, um einen Entscheidungsbaum zu trainieren, der dann in der Lage ist, englisch-akzentuierte Aussprachen aus kanonischen deutschen Aussprachen vorherzusagen. Wir haben diesen Ansatz zudem mit dem weighted MLLR Sprecheradaptionsverfahren kombiniert. In unseren Experimenten erzielten wir bei der Erkennung nicht-muttersprachlicher Sprache mit einem so erweiterten Lexikon eine Verbesserung von 5.2% der Wortfehlerrate. Die Sprecheradaption alleine erreichte eine Verbesserung von 16.8%. Wurden beide Verfahren kombiniert, konnte das Basissystem um 18.2% verbessert werden. La reconnaissance de langue non-maternelle est un sujet qui prend de plus en plus d’importance dans les systèmes de reconnaissance automatique de la parole. La majorité des systèmes existants sont spécialisés dans la reconnaissance de langue maternelle et par conséquent les résultats de reconnaissance sont insuffisants. Une possibilité pour approcher ce problème est d’adapter les models acoustiques au nouvel orateur. Un autre moyen important est de prendre en considération les variations de prononciation non-maternelle dans le dictionnaire du système. La difficulté ici est la génération de variations de prononciation étrangère, plus particulièrement dans le cas oú plusieurs différents accents seraient à prendre en considération. Les approches traditionnelles pour modeler la prononciation ont besoin soit de connaissance phonétique soit de banques de données de parole volumineuses en langue non-maternelle. Ces deux méthodes sont trop coteuses particulièrement si une modélisation flexible de plusieurs accents est désirée. Nous proposons donc l’utilisation de banque de données de parole en langue maternelle uniquement pour la génération de variations de prononciation en langue non-maternelle. Nous nous servons d’un système de reconnaissance de phonèmes anglais pour générer les variantes anglaises de mots allemands. Celles-ci sont ensuite utilisées pour entraîner des arbres de décision capables de prédire les variations de mots allemands prononcés avec un accent anglais. Nous avons combiné cette méthode avec la méthode d’adaptation de l’orateur MLLR. Nos expériences ont montré que l’utilisation d’un dictionnaire étendu par les variantes produites par cette méthode peut améliorer les resultats de 5.2% word error rate. Pour la méthode d’adaptation de l’orateur MLLR seule, les résultats sont améliorés de 16.8 %. En combinaison nous avons atteinds une amélioration de 18.2% en comparaison avec le dictionnaire normal.</description><subject>Non-native speech</subject><subject>Pronunciation modelling</subject><subject>Speaker adaptation</subject><issn>0167-6393</issn><issn>1872-7182</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2004</creationdate><recordtype>article</recordtype><recordid>eNqNUMtOwzAQtBBIlMIfcMiJW4Ifie1ckFAFBakSFzhbjrNGrlI72GkFf49LOCNOs4-Z0e4gdE1wRTDht9sqjWDCrqIYswq3VYYTtCBS0FIQSU_RItNEyVnLztFFSluMcS0lXaDVGjxEPTn_XvjgS5_LAxRjDH7vjctd8MVBR6f9lAobYjHApzN5qHs9Tj_7S3Rm9ZDg6heX6O3x4XX1VG5e1s-r-01pGOdTSYgVQlPeSSmN7FqKpZXGkFrWzGrcWRCUiJaClr22pO4M1K2lhjZa2LYmbIluZt983cce0qR2LhkYBu0h7JOSTdNyzpt_EBljtTgS65loYkgpglVjdDsdvxTB6hit2qo5WnWMVuFWZciyu1kG-duDg6iSceAN9C6CmVQf3N8G32pghRI</recordid><startdate>2004</startdate><enddate>2004</enddate><creator>Goronzy, Silke</creator><creator>Rapp, Stefan</creator><creator>Kompe, Ralf</creator><general>Elsevier B.V</general><scope>AAYXX</scope><scope>CITATION</scope><scope>8BM</scope><scope>7T9</scope></search><sort><creationdate>2004</creationdate><title>Generating non-native pronunciation variants for lexicon adaptation</title><author>Goronzy, Silke ; Rapp, Stefan ; Kompe, Ralf</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c366t-11f77a26b888c8b9208f8cc14843fa0bfe721792ea8daf14bce49f2c25a7f9413</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>eng</language><creationdate>2004</creationdate><topic>Non-native speech</topic><topic>Pronunciation modelling</topic><topic>Speaker adaptation</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Goronzy, Silke</creatorcontrib><creatorcontrib>Rapp, Stefan</creatorcontrib><creatorcontrib>Kompe, Ralf</creatorcontrib><collection>CrossRef</collection><collection>ComDisDome</collection><collection>Linguistics and Language Behavior Abstracts (LLBA)</collection><jtitle>Speech communication</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Goronzy, Silke</au><au>Rapp, Stefan</au><au>Kompe, Ralf</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Generating non-native pronunciation variants for lexicon adaptation</atitle><jtitle>Speech communication</jtitle><date>2004</date><risdate>2004</risdate><volume>42</volume><issue>1</issue><spage>109</spage><epage>123</epage><pages>109-123</pages><issn>0167-6393</issn><eissn>1872-7182</eissn><coden>SCOMDH</coden><abstract>Handling non-native speech in automatic speech recognition (ASR) systems is an area of increasing interest. The majority of systems are tailored to native speech only and as a consequence performance for non-native speakers often is not satisfactory. One way to approach the problem is to adapt the acoustic models to the new speaker. Another important means to improve performance for non-native speakers is to consider non-native pronunciations in the dictionary. The difficulty here lies in the generation of the non-native variants, especially if various accents are to be considered. Traditional approaches to model pronunciation variation either require phonetic expertise or extensive speech databases. They are too costly, especially if a flexible modelling of several accents is desired. We propose to exclusively use native speech databases to derive non-native pronunciation variants. We use an English phoneme recogniser to generate English pronunciations for German words and use these to train decision trees that are able to predict the respective English-accented variant from the German canonical transcription. Furthermore we combine this approach with online, incremental weighted MLLR speaker adaptation. Using the enhanced dictionary and the speaker adaptation alone improved the word error rate of the baseline system by 5.2% and 16.8%, respectively. When both methods were combined, we achieved an improvement of 18.2%. Die Verarbeitung nicht-muttersprachlicher Sprache in automatischen Spracherkennungssystemen gewinnt immer mehr an Bedeutung. Die meisten aktuellen Systeme sind jedoch darauf zugeschnitten, ausschließlich muttersprachliche Daten zu verarbeiten. Daher fallen die Erkennungsraten für nicht-muttersprachliche Sprecher oftmals sehr unzureichend aus. Eine Möglichkeit zur Lösung dieses Problems ist die Anwendung von Sprecheradaptionsverfahren, die die akustischen Modelle des Systems an den neuen Sprecher adaptieren. Eine weitere Möglichkeit, die Erkennungsraten für nicht-muttersprachliche Sprecher zu verbessern, ist die Berücksichtigung nicht-muttersprachlicher Aussprachevarianten im Lexikon des Erkennungssystems. Die Schwierigkeit bei diesem Verfahren besteht in der Herleitung dieser Varianten, besonders wenn viele verschiedene Akzente berücksichtigt werden sollen. Traditionelle Ansätze zur Aussprachemodellierung benötigen hierzu entweder phonetisches Wissen oder aber umfangreiche Sprachdatenbanken akzentuierter Sprache. Beide Verfahren sind jedoch für die Modellierung nicht-muttersprachlicher Aussprachevarianten zu aufwendig, besonders wenn mehrere Akzente berücksichtigt werden sollen. Aus diesen Gründen schlagen wir vor, ausschließlich muttersprachliche Sprachdaten zur Generierung nicht-muttersprachlicher Aussprachevarianten heranzuziehen. Wir setzen einen englischen Phonemerkenner zur Generierung englischer Aussprachevarianten für deutsche Wörter ein und benutzen diese, um einen Entscheidungsbaum zu trainieren, der dann in der Lage ist, englisch-akzentuierte Aussprachen aus kanonischen deutschen Aussprachen vorherzusagen. Wir haben diesen Ansatz zudem mit dem weighted MLLR Sprecheradaptionsverfahren kombiniert. In unseren Experimenten erzielten wir bei der Erkennung nicht-muttersprachlicher Sprache mit einem so erweiterten Lexikon eine Verbesserung von 5.2% der Wortfehlerrate. Die Sprecheradaption alleine erreichte eine Verbesserung von 16.8%. Wurden beide Verfahren kombiniert, konnte das Basissystem um 18.2% verbessert werden. La reconnaissance de langue non-maternelle est un sujet qui prend de plus en plus d’importance dans les systèmes de reconnaissance automatique de la parole. La majorité des systèmes existants sont spécialisés dans la reconnaissance de langue maternelle et par conséquent les résultats de reconnaissance sont insuffisants. Une possibilité pour approcher ce problème est d’adapter les models acoustiques au nouvel orateur. Un autre moyen important est de prendre en considération les variations de prononciation non-maternelle dans le dictionnaire du système. La difficulté ici est la génération de variations de prononciation étrangère, plus particulièrement dans le cas oú plusieurs différents accents seraient à prendre en considération. Les approches traditionnelles pour modeler la prononciation ont besoin soit de connaissance phonétique soit de banques de données de parole volumineuses en langue non-maternelle. Ces deux méthodes sont trop coteuses particulièrement si une modélisation flexible de plusieurs accents est désirée. Nous proposons donc l’utilisation de banque de données de parole en langue maternelle uniquement pour la génération de variations de prononciation en langue non-maternelle. Nous nous servons d’un système de reconnaissance de phonèmes anglais pour générer les variantes anglaises de mots allemands. Celles-ci sont ensuite utilisées pour entraîner des arbres de décision capables de prédire les variations de mots allemands prononcés avec un accent anglais. Nous avons combiné cette méthode avec la méthode d’adaptation de l’orateur MLLR. Nos expériences ont montré que l’utilisation d’un dictionnaire étendu par les variantes produites par cette méthode peut améliorer les resultats de 5.2% word error rate. Pour la méthode d’adaptation de l’orateur MLLR seule, les résultats sont améliorés de 16.8 %. En combinaison nous avons atteinds une amélioration de 18.2% en comparaison avec le dictionnaire normal.</abstract><pub>Elsevier B.V</pub><doi>10.1016/j.specom.2003.09.003</doi><tpages>15</tpages></addata></record>
fulltext fulltext
identifier ISSN: 0167-6393
ispartof Speech communication, 2004, Vol.42 (1), p.109-123
issn 0167-6393
1872-7182
language eng
recordid cdi_proquest_miscellaneous_85596665
source Access via ScienceDirect (Elsevier)
subjects Non-native speech
Pronunciation modelling
Speaker adaptation
title Generating non-native pronunciation variants for lexicon adaptation
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2024-12-20T07%3A46%3A10IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-proquest_cross&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Generating%20non-native%20pronunciation%20variants%20for%20lexicon%20adaptation&rft.jtitle=Speech%20communication&rft.au=Goronzy,%20Silke&rft.date=2004&rft.volume=42&rft.issue=1&rft.spage=109&rft.epage=123&rft.pages=109-123&rft.issn=0167-6393&rft.eissn=1872-7182&rft.coden=SCOMDH&rft_id=info:doi/10.1016/j.specom.2003.09.003&rft_dat=%3Cproquest_cross%3E85333475%3C/proquest_cross%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_pqid=85333475&rft_id=info:pmid/&rft_els_id=S0167639303001158&rfr_iscdi=true