Linear collaborative discriminant regression and cepstra features for Hindi speech recognition

Speech recognition system is one of the significant, yet challenging systems in computer-human interaction. Recognizing Indian languages, especially Hindi, faces many practical difficulties due to its wide grammatical and phonetic features from English. This paper focuses on Hindi speech recognition...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Maǧallaẗ al-abḥath al-handasiyyaẗ 2019, Vol.7 (4), p.96-114
Hauptverfasser: Patil, U. G., Paithane, A. N., Shirbahadurkar, S. D.
Format: Artikel
Sprache:ara ; eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 114
container_issue 4
container_start_page 96
container_title Maǧallaẗ al-abḥath al-handasiyyaẗ
container_volume 7
creator Patil, U. G.
Paithane, A. N.
Shirbahadurkar, S. D.
description Speech recognition system is one of the significant, yet challenging systems in computer-human interaction. Recognizing Indian languages, especially Hindi, faces many practical difficulties due to its wide grammatical and phonetic features from English. This paper focuses on Hindi speech recognition system for which Cepstra features and linear collaborative discriminant regression (LCDR) model are proposed for feature analysis and recognition. For definite audio signals, two models of test speech signals are synthesized and experimental investigations are carried out. The performance of the LCDR methods is analysed using Type I and II error functions and compared with the existing methods such as NN2-cepstra and SVM2-cepstra. Moreover, the best, worst, mean, median, and standard deviation are used for the statistical prediction and the proposed LCDR method is proved as the superior method for recognising Hindi speech. نظام التعرف على الكلام هو أحد الأنظمة الهامة ولكن الصعبة في التفاعل بين الإنسان والحاسوب. يجد التعرف على اللغات الهندية العديد من الصعوبات العملية سبب خصائصها النحوية والصوتية الأكثر توسعا من اللغة الإنجليزية. يركز هذا البحث على نظام التعرف على الكلام باللغة الهندية والذي يقترح ميزات Cepstra وغوذج الانحدار التمييزي التعاوني الخطي (LCDR) لتحليل الكلام والتعرف عليه. بالنسبة لإشارات صوتية محددة، تم جميع غوذجين من إشارات كلامية موضوع الاختبار وتم فحصها تجريبيا. ثم تم تحليل أداء طريقة LCDR باستخدام دوال الخطا من النوع الأول والثاني ومقارنتها بالطرق الحالية مثل cepstra-NN2 و cepstra-SVM2. علاوة على ذلك، تم استخدام الوسط الحسابي والوسيط والانحراف القياسي الأفضل والأسوا للتنبؤ الإحصائي، وتم إثبات طريقة المقترحة كأفضل طريقة للتعرف على الكلام باللغة الهندية.
format Article
fullrecord <record><control><sourceid>emarefa</sourceid><recordid>TN_cdi_emarefa_primary_1494807</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>1494807</sourcerecordid><originalsourceid>FETCH-LOGICAL-e178t-2a4411f237659be9dbe103acf421f369cab1b4f03b8344f2bc86aa027d8c31753</originalsourceid><addsrcrecordid>eNo9js1KxDAUhYMoOIzzCpIXKOS3SZcyqCMU3OjW4Sa9GSOdpCRR8O0tKK7OgcN3-C7IRkhmOm6tvvzvxlyTXa0fjDHOpNJSb8jbGBNCoT7PM7hcoMUvpFOsvsRzTJAaLXgqWGvMiUKaqMeltgI0ILTPdaAhF3qIaYq0Loj-fQV8PqXYVuKGXAWYK-7-ckteH-5f9odufH582t-NHXJjWydAKc6DkKbXg8Nhcrgagg9K8CD7wYPjTgUmnZVKBeG87QGYMJP1khstt-T29xfPUDDAcVn1oXwfuRqUZUb-ACHSUSQ</addsrcrecordid><sourcetype>Publisher</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Linear collaborative discriminant regression and cepstra features for Hindi speech recognition</title><source>DOAJ Directory of Open Access Journals</source><source>Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals</source><source>Springer Nature OA Free Journals</source><creator>Patil, U. G. ; Paithane, A. N. ; Shirbahadurkar, S. D.</creator><creatorcontrib>Patil, U. G. ; Paithane, A. N. ; Shirbahadurkar, S. D.</creatorcontrib><description>Speech recognition system is one of the significant, yet challenging systems in computer-human interaction. Recognizing Indian languages, especially Hindi, faces many practical difficulties due to its wide grammatical and phonetic features from English. This paper focuses on Hindi speech recognition system for which Cepstra features and linear collaborative discriminant regression (LCDR) model are proposed for feature analysis and recognition. For definite audio signals, two models of test speech signals are synthesized and experimental investigations are carried out. The performance of the LCDR methods is analysed using Type I and II error functions and compared with the existing methods such as NN2-cepstra and SVM2-cepstra. Moreover, the best, worst, mean, median, and standard deviation are used for the statistical prediction and the proposed LCDR method is proved as the superior method for recognising Hindi speech. نظام التعرف على الكلام هو أحد الأنظمة الهامة ولكن الصعبة في التفاعل بين الإنسان والحاسوب. يجد التعرف على اللغات الهندية العديد من الصعوبات العملية سبب خصائصها النحوية والصوتية الأكثر توسعا من اللغة الإنجليزية. يركز هذا البحث على نظام التعرف على الكلام باللغة الهندية والذي يقترح ميزات Cepstra وغوذج الانحدار التمييزي التعاوني الخطي (LCDR) لتحليل الكلام والتعرف عليه. بالنسبة لإشارات صوتية محددة، تم جميع غوذجين من إشارات كلامية موضوع الاختبار وتم فحصها تجريبيا. ثم تم تحليل أداء طريقة LCDR باستخدام دوال الخطا من النوع الأول والثاني ومقارنتها بالطرق الحالية مثل cepstra-NN2 و cepstra-SVM2. علاوة على ذلك، تم استخدام الوسط الحسابي والوسيط والانحراف القياسي الأفضل والأسوا للتنبؤ الإحصائي، وتم إثبات طريقة المقترحة كأفضل طريقة للتعرف على الكلام باللغة الهندية.</description><identifier>ISSN: 2307-1877</identifier><identifier>EISSN: 2307-1885</identifier><language>ara ; eng</language><publisher>Kuwait: Kuwait University, Academic Publication Council</publisher><ispartof>Maǧallaẗ al-abḥath al-handasiyyaẗ, 2019, Vol.7 (4), p.96-114</ispartof><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,4010</link.rule.ids></links><search><creatorcontrib>Patil, U. G.</creatorcontrib><creatorcontrib>Paithane, A. N.</creatorcontrib><creatorcontrib>Shirbahadurkar, S. D.</creatorcontrib><title>Linear collaborative discriminant regression and cepstra features for Hindi speech recognition</title><title>Maǧallaẗ al-abḥath al-handasiyyaẗ</title><description>Speech recognition system is one of the significant, yet challenging systems in computer-human interaction. Recognizing Indian languages, especially Hindi, faces many practical difficulties due to its wide grammatical and phonetic features from English. This paper focuses on Hindi speech recognition system for which Cepstra features and linear collaborative discriminant regression (LCDR) model are proposed for feature analysis and recognition. For definite audio signals, two models of test speech signals are synthesized and experimental investigations are carried out. The performance of the LCDR methods is analysed using Type I and II error functions and compared with the existing methods such as NN2-cepstra and SVM2-cepstra. Moreover, the best, worst, mean, median, and standard deviation are used for the statistical prediction and the proposed LCDR method is proved as the superior method for recognising Hindi speech. نظام التعرف على الكلام هو أحد الأنظمة الهامة ولكن الصعبة في التفاعل بين الإنسان والحاسوب. يجد التعرف على اللغات الهندية العديد من الصعوبات العملية سبب خصائصها النحوية والصوتية الأكثر توسعا من اللغة الإنجليزية. يركز هذا البحث على نظام التعرف على الكلام باللغة الهندية والذي يقترح ميزات Cepstra وغوذج الانحدار التمييزي التعاوني الخطي (LCDR) لتحليل الكلام والتعرف عليه. بالنسبة لإشارات صوتية محددة، تم جميع غوذجين من إشارات كلامية موضوع الاختبار وتم فحصها تجريبيا. ثم تم تحليل أداء طريقة LCDR باستخدام دوال الخطا من النوع الأول والثاني ومقارنتها بالطرق الحالية مثل cepstra-NN2 و cepstra-SVM2. علاوة على ذلك، تم استخدام الوسط الحسابي والوسيط والانحراف القياسي الأفضل والأسوا للتنبؤ الإحصائي، وتم إثبات طريقة المقترحة كأفضل طريقة للتعرف على الكلام باللغة الهندية.</description><issn>2307-1877</issn><issn>2307-1885</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2019</creationdate><recordtype>article</recordtype><recordid>eNo9js1KxDAUhYMoOIzzCpIXKOS3SZcyqCMU3OjW4Sa9GSOdpCRR8O0tKK7OgcN3-C7IRkhmOm6tvvzvxlyTXa0fjDHOpNJSb8jbGBNCoT7PM7hcoMUvpFOsvsRzTJAaLXgqWGvMiUKaqMeltgI0ILTPdaAhF3qIaYq0Loj-fQV8PqXYVuKGXAWYK-7-ckteH-5f9odufH582t-NHXJjWydAKc6DkKbXg8Nhcrgagg9K8CD7wYPjTgUmnZVKBeG87QGYMJP1khstt-T29xfPUDDAcVn1oXwfuRqUZUb-ACHSUSQ</recordid><startdate>2019</startdate><enddate>2019</enddate><creator>Patil, U. G.</creator><creator>Paithane, A. N.</creator><creator>Shirbahadurkar, S. D.</creator><general>Kuwait University, Academic Publication Council</general><scope>ADJCN</scope><scope>AHFXO</scope></search><sort><creationdate>2019</creationdate><title>Linear collaborative discriminant regression and cepstra features for Hindi speech recognition</title><author>Patil, U. G. ; Paithane, A. N. ; Shirbahadurkar, S. D.</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-e178t-2a4411f237659be9dbe103acf421f369cab1b4f03b8344f2bc86aa027d8c31753</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>ara ; eng</language><creationdate>2019</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Patil, U. G.</creatorcontrib><creatorcontrib>Paithane, A. N.</creatorcontrib><creatorcontrib>Shirbahadurkar, S. D.</creatorcontrib><collection>الدوريات العلمية والإحصائية - e-Marefa Academic and Statistical Periodicals</collection><collection>معرفة - المحتوى العربي الأكاديمي المتكامل - e-Marefa Academic Complete</collection><jtitle>Maǧallaẗ al-abḥath al-handasiyyaẗ</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Patil, U. G.</au><au>Paithane, A. N.</au><au>Shirbahadurkar, S. D.</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Linear collaborative discriminant regression and cepstra features for Hindi speech recognition</atitle><jtitle>Maǧallaẗ al-abḥath al-handasiyyaẗ</jtitle><date>2019</date><risdate>2019</risdate><volume>7</volume><issue>4</issue><spage>96</spage><epage>114</epage><pages>96-114</pages><issn>2307-1877</issn><eissn>2307-1885</eissn><abstract>Speech recognition system is one of the significant, yet challenging systems in computer-human interaction. Recognizing Indian languages, especially Hindi, faces many practical difficulties due to its wide grammatical and phonetic features from English. This paper focuses on Hindi speech recognition system for which Cepstra features and linear collaborative discriminant regression (LCDR) model are proposed for feature analysis and recognition. For definite audio signals, two models of test speech signals are synthesized and experimental investigations are carried out. The performance of the LCDR methods is analysed using Type I and II error functions and compared with the existing methods such as NN2-cepstra and SVM2-cepstra. Moreover, the best, worst, mean, median, and standard deviation are used for the statistical prediction and the proposed LCDR method is proved as the superior method for recognising Hindi speech. نظام التعرف على الكلام هو أحد الأنظمة الهامة ولكن الصعبة في التفاعل بين الإنسان والحاسوب. يجد التعرف على اللغات الهندية العديد من الصعوبات العملية سبب خصائصها النحوية والصوتية الأكثر توسعا من اللغة الإنجليزية. يركز هذا البحث على نظام التعرف على الكلام باللغة الهندية والذي يقترح ميزات Cepstra وغوذج الانحدار التمييزي التعاوني الخطي (LCDR) لتحليل الكلام والتعرف عليه. بالنسبة لإشارات صوتية محددة، تم جميع غوذجين من إشارات كلامية موضوع الاختبار وتم فحصها تجريبيا. ثم تم تحليل أداء طريقة LCDR باستخدام دوال الخطا من النوع الأول والثاني ومقارنتها بالطرق الحالية مثل cepstra-NN2 و cepstra-SVM2. علاوة على ذلك، تم استخدام الوسط الحسابي والوسيط والانحراف القياسي الأفضل والأسوا للتنبؤ الإحصائي، وتم إثبات طريقة المقترحة كأفضل طريقة للتعرف على الكلام باللغة الهندية.</abstract><cop>Kuwait</cop><pub>Kuwait University, Academic Publication Council</pub><tpages>19</tpages></addata></record>
fulltext fulltext
identifier ISSN: 2307-1877
ispartof Maǧallaẗ al-abḥath al-handasiyyaẗ, 2019, Vol.7 (4), p.96-114
issn 2307-1877
2307-1885
language ara ; eng
recordid cdi_emarefa_primary_1494807
source DOAJ Directory of Open Access Journals; Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals; Springer Nature OA Free Journals
title Linear collaborative discriminant regression and cepstra features for Hindi speech recognition
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-30T14%3A11%3A59IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-emarefa&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Linear%20collaborative%20discriminant%20regression%20and%20cepstra%20features%20for%20Hindi%20speech%20recognition&rft.jtitle=Ma%C7%A7alla%E1%BA%97%20al-ab%E1%B8%A5ath%20al-handasiyya%E1%BA%97&rft.au=Patil,%20U.%20G.&rft.date=2019&rft.volume=7&rft.issue=4&rft.spage=96&rft.epage=114&rft.pages=96-114&rft.issn=2307-1877&rft.eissn=2307-1885&rft_id=info:doi/&rft_dat=%3Cemarefa%3E1494807%3C/emarefa%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true