DEEP MULTI-TASK LEARNING FRAMEWORK FOR FACE DETECTION, LANDMARK LOCALIZATION, POSE ESTIMATION, AND GENDER RECOGNITION

Various image processing may benefit from the application deep convolutional neural networks. For example, a deep multi-task learning framework may assist face detection, for example when combined with landmark localization, pose estimation, and gender recognition. An apparatus can include a first m...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: RANJAN, Rajeev, PATEL, Vishal M, CHELLAPPA, Ramalingam, CASTILLO, Carlos D
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Various image processing may benefit from the application deep convolutional neural networks. For example, a deep multi-task learning framework may assist face detection, for example when combined with landmark localization, pose estimation, and gender recognition. An apparatus can include a first module of at least three modules configured to generate class independent region proposals to provide a region. The apparatus can also include a second module of the at least three modules configured to classify the region as face or non-face using a multi-task analysis. The apparatus can further include a third module configured to perform post- processing on the classified region. Selon l'invention, un traitement d'image différent peut bénéficier des réseaux neuronaux à convolution profonde d'application. Par exemple, un cadriciel d'apprentissage multitâche profond peut aider à la détection de visage, par exemple lorsque ce dernier est combiné avec une localisation de point de repère, une estimation de pose, et une reconnaissance de sexe. Un appareil peut comprendre un premier module parmi au moins trois modules configuré pour générer des propositions de région indépendante d'une classe pour fournir une région. L'appareil peut également comprendre un deuxième module parmi les au moins trois modules configuré pour classifier la région comme visage ou non visage à l'aide d'une analyse multitâche. L'appareil peut en outre comprendre un troisième module configuré pour réaliser un post-traitement sur la région classifiée.