QSDAS : new Quranic speech database for Arabic speaker recognition

تعد قاعدة البيانات المستعملة في تطوير برامج أو نظام التعرف على الأشخاص من أهم الوحدات المكونة لهذا الأخير. و للاستجابة لكافة متطلبات هذا النظام قمنا بتطوير قاعدة بيانات قرآنية للأشخاص الناطقين بالعربية. تكمن أهمية هذه القاعدة في التمكين من تطوير بحوث التعرف على الأشخاص و البحوث اللغوية، و هي تحتوي ع...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	The Arabian Journal for Science and Engineering. 2010, Vol.35 (2C(s)), p.8-19
Hauptverfasser:	Harrag, A., Muhammadi, T.
Format:	Artikel
Sprache:	ara ; eng
Schlagworte:	Computational linguistics Linguistic analysis (Linguistics) Linguistics Speech processing systems اللسانيات اللسانيات الحاسوبية قواعد البيانات
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	تعد قاعدة البيانات المستعملة في تطوير برامج أو نظام التعرف على الأشخاص من أهم الوحدات المكونة لهذا الأخير. و للاستجابة لكافة متطلبات هذا النظام قمنا بتطوير قاعدة بيانات قرآنية للأشخاص الناطقين بالعربية. تكمن أهمية هذه القاعدة في التمكين من تطوير بحوث التعرف على الأشخاص و البحوث اللغوية، و هي تحتوي على 15.4 جيقابايت تمثل 6489 ملف تحوي في طياتها 1617 ملفا (سورة) مقروءة من طرف 77 شخصا من الذكور. و الملفات الصوتية 1617 قسمت إلى ثلاثة أقسام يحتوي كل قسم منها 77، 770، 770 ملفا على الترتيب. الأول يحوي ملفا لكل شخص و يستعمل للتطوير، و الباقي يحوي كل واحد منهما على 10 ملفات لكل شخص و تستعمل للتجريب. و زيادة على 1617 ملفا صوتيا، تشتمل قاعدة كل ملف صوتي ثلاثة ملفات هي : ملف للاهتزاز الرئيسي للأحبال الصوتية، و ملف لترددات الرنين في الجهاز الصوتي إلى جانب معلومات في المجالين الزمني و الترددي لجعل هذه القاعدة جاهزة للاستعمال حينا في مجال التعرف على الأشخاص. -A speech database is the foundation for developing any speaker processing system or algorithm. To cope with various requirements to speaker recognition technology, the Quranic Speech Database for Arabic Speakers (QSDAS) has been produced. This database is a useful resource to aid in the assessment of Arabic speaker recognition and linguistic research. It consists of 15.4 GB representing 6489 files, including 1617 files (Surahs) read aloud by 77 male speakers. The 1617 audio files (6.4 GB) are partitioned in three sets: SetD, SetS, and SetT with 77, 770, and 770 audio files, respectively. SetD contains one file per speaker used for development, while SetS and SetT contain ten files per speaker and are used for tests purposes. In addition to the 1617 audio files, QSDAS includes for each audio file the corresponding fundamental frequency F0, F1-F2-F3 formants file, and MFCC and Energy file to make it usable immediately for speaker recognition research.
ISSN:	1319-8025 2191-4281