Lipes tracking using active contour method

تمييز الأصوات اعتمادا على المعلومات المرئية مثال شكل الشفة و حركتها أثناء الكلام يعزي قراءة الشفة و تستمد الخواص المرئية طبقا لمعدل أطر المقطع الفديوي. العمل المتبني في هذه البحث ركز على الجزء الأسفل من الوجه البشري لانتزاع ميزات المتكلم الصحيحة ذات العلاقة بدقة و شده من الحافة الداخلية للشفتين استخ...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Engineering and Technology Journal 2011-10, Vol.29 (14), p.2942-2953
Hauptverfasser: Rahmah, Abd al-Munim Salih, Abd al-Karim, Abd al-Hamzah A.
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:تمييز الأصوات اعتمادا على المعلومات المرئية مثال شكل الشفة و حركتها أثناء الكلام يعزي قراءة الشفة و تستمد الخواص المرئية طبقا لمعدل أطر المقطع الفديوي. العمل المتبني في هذه البحث ركز على الجزء الأسفل من الوجه البشري لانتزاع ميزات المتكلم الصحيحة ذات العلاقة بدقة و شده من الحافة الداخلية للشفتين استخدام التقييس الأحيائي للتحقق من هوية الأشخاص وذلك برسم منحنيات الخواص الفيزيائية أو السلوكية لذي العلاقة. تحتوى الشفاه على حجم كبير من الخواص الفريده، النتائج و أعده وعرضت رد فعل جيد (حتى بتقليل عدد الأطر المفحوصة). معدل التمييز باعتماد الصوت لوحده تراوحية بين 86 % إلى 100 %، و باعتماد الصور لوحدها تراوحة بين 73 % إلى 100 % أما باعتماد كلا العاملين (الصوت و الصورة) فكانت النتائج تتراوح بين 92 % إلى 100 %. Speech recognition based on visual information such as the lip shape and its movement is referred to as lip reading. The visual features are derived according to the frame rate of the video sequence. The proposed work adopted in this paper based upon the lower part of human face to extract the speaker sound relevant features accurately and robustly from the inner edge of lips, using biometric to verify a person's identity by drawing their relevant physiological or behavioral characteristics curves. Lips contain a large volume of unique features. The results are promising and offer a good reaction (even with reducing the number of tested frames). The recognition rate with only audio : 86 % - 100 %, with only visual : 73 % -100 %, and with both (audio- visual) recognition rate is: 92 %-100 %.
ISSN:1681-6900
2412-0758
2412-0758
DOI:10.30684/etj.29.14.10