Apprentissage des réseaux d'ondelettes bêta basé sur la théorie des frames : application à la détection de visages( Télécharger le fichier original )par Faouzi Hajjem Université de Gabés - Mastère de recherche en informatique 2008 |
c. Approches basées sur les réseaux de neurones:Cette approche repose essentiellement sur la notion d'apprentissage qui est depuis de nombreuses années au coeur de la recherche en intelligence artificielle. Puisque la détection de visages peut être comprise comme problème d'identification de modèle de deux classes (visage ou non-visage), plusieurs méthodes utilisant les réseaux de neurones ont été présentées pour la solution. Un examen des méthodes de détection de visage par réseaux de neurones peut être trouvé dans la recherche de Viennet et al. [4, 36]. La première approche basée sur un réseau de neurones, qui a donné des résultats significatifs sur des données complexes, était présentée par Rowley et al. [1]. Le système incorpore la détection de visages dans un réseau de neurones connecté en rétine (Figure 1.5). Sortie Éclairage Unités cachées Champs réceptifs Histogramme Pyramide d'images d'entrée Fenêtre extraite Réseaux de neurones Prétraitement ... ... Entrée réseau 20*20 Figure 1.5 : le système de Rowley et al. (IEEE1998) Ce réseau de neurones est conçu pour traiter des fenêtres de 20 x 20 pixels avec une couche cachée. La fenêtre d'entrée est prétraitée par la correction d'éclairage et l'égalisation d'histogramme. Lin et al. [4, 2] ont proposé un système d'identification de visages entièrement automatique à décision probabilistes basé sur les réseaux de neurones (PDBNN). Un PDBNN est un réseau de neurones de classification avec une structure modulaire hiérarchique. Au lieu de l'image convertissante d'entrée à un vecteur cru, ils ont préféré employer des traits basés sur l'intensité et le contour. Roth et al. [4, 30] ont proposé une nouvelle architecture d'étude dans le domaine visuel, qui est appliquée à la détection de visages. Le système est un réseau d'étude se composant de deux sous-réseaux pour le Visage et le Non-Visage. Les deux sous-réseaux de cible opèrent un espace d'entrée de dispositifs booléens. Une autre architecture de réseau de neurones a été proposée par F. Boray Tek [4]. Cette architecture est basée sur le système développé par Rowley et al. et permettant de représenter n'importe quelle fonction, par la projection, en utilisant les surfaces arbitraires de décision basées sur des fonctions non-linéaires d'activation. L'avantage de cette approche est le gain de temps considérable. En insérant des zooms différents lors de l'apprentissage, il ne devient plus nécessaire de tester chaque dimension potentielle. Rien n'interdisant la présence d'un visage occupant toute l'image ou uniquement le un dixième dans le coin. Cependant, l'utilisation d'exemples pour apprentissage apporte le risque de ne pouvoir résoudre que des situations déjà rencontrées, où un phénomène de sur-apprentissage qui spécialiserait le réseau uniquement sur les exemples connus sans généraliser. |
|