QSDAS : new Quranic speech database for Arabic speaker recognition
تعد قاعدة البيانات المستعملة في تطوير برامج أو نظام التعرف على الأشخاص من أهم الوحدات المكونة لهذا الأخير. و للاستجابة لكافة متطلبات هذا النظام قمنا بتطوير قاعدة بيانات قرآنية للأشخاص الناطقين بالعربية. تكمن أهمية هذه القاعدة في التمكين من تطوير بحوث التعرف على الأشخاص و البحوث اللغوية، و هي تحتوي ع...
Gespeichert in:
Veröffentlicht in: | The Arabian Journal for Science and Engineering. 2010, Vol.35 (2C(s)), p.8-19 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | ara ; eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | تعد قاعدة البيانات المستعملة في تطوير برامج أو نظام التعرف على الأشخاص من أهم الوحدات المكونة لهذا الأخير. و للاستجابة لكافة متطلبات هذا النظام قمنا بتطوير قاعدة بيانات قرآنية للأشخاص الناطقين بالعربية. تكمن أهمية هذه القاعدة في التمكين من تطوير بحوث التعرف على الأشخاص و البحوث اللغوية، و هي تحتوي على 15.4 جيقابايت تمثل 6489 ملف تحوي في طياتها 1617 ملفا (سورة) مقروءة من طرف 77 شخصا من الذكور. و الملفات الصوتية 1617 قسمت إلى ثلاثة أقسام يحتوي كل قسم منها 77، 770، 770 ملفا على الترتيب. الأول يحوي ملفا لكل شخص و يستعمل للتطوير، و الباقي يحوي كل واحد منهما على 10 ملفات لكل شخص و تستعمل للتجريب. و زيادة على 1617 ملفا صوتيا، تشتمل قاعدة كل ملف صوتي ثلاثة ملفات هي : ملف للاهتزاز الرئيسي للأحبال الصوتية، و ملف لترددات الرنين في الجهاز الصوتي إلى جانب معلومات في المجالين الزمني و الترددي لجعل هذه القاعدة جاهزة للاستعمال حينا في مجال التعرف على الأشخاص.
-A speech database is the foundation for developing any speaker processing system or algorithm. To cope with
various requirements to speaker recognition technology, the Quranic Speech Database for Arabic Speakers (QSDAS)
has been produced. This database is a useful resource to aid in the assessment of Arabic speaker recognition and
linguistic research. It consists of 15.4 GB representing 6489 files, including 1617 files (Surahs) read aloud by 77
male speakers. The 1617 audio files (6.4 GB) are partitioned in three sets: SetD, SetS, and SetT with 77, 770, and
770 audio files, respectively. SetD contains one file per speaker used for development, while SetS and SetT contain
ten files per speaker and are used for tests purposes. In addition to the 1617 audio files, QSDAS includes for each
audio file the corresponding fundamental frequency F0, F1-F2-F3 formants file, and MFCC and Energy file to make it
usable immediately for speaker recognition research. |
---|---|
ISSN: | 1319-8025 2191-4281 |