Apprentissage des réseaux d'ondelettes bêta basé sur la théorie des frames : application à la détection de visages

( Télécharger le fichier original )
par Faouzi Hajjem
Université de Gabés - Mastère de recherche en informatique 2008

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

c. Approches basées sur les réseaux de neurones:

Cette approche repose essentiellement sur la notion d'apprentissage qui est depuis de nombreuses années au coeur de la recherche en intelligence artificielle. Puisque la détection de visages peut être comprise comme problème d'identification de modèle de deux classes (visage ou non-visage), plusieurs méthodes utilisant les réseaux de neurones ont été présentées pour la solution. Un examen des méthodes de détection de visage par réseaux de neurones peut être trouvé dans la recherche de Viennet et al. [4, 36].

La première approche basée sur un réseau de neurones, qui a donné des résultats significatifs sur des données complexes, était présentée par Rowley et al. [1]. Le système incorpore la détection de visages dans un réseau de neurones connecté en rétine (Figure 1.5).

Sortie

Éclairage
corrigé

Unités cachées

Champs réceptifs

Histogramme
égalisé

Pyramide d'images d'entrée

Fenêtre extraite
20*20 pixels

Réseaux de neurones

Prétraitement

...

Entrée réseau

20*20
pixels

Figure 1.5 : le système de Rowley et al. (IEEE1998)

Ce réseau de neurones est conçu pour traiter des fenêtres de 20 x 20 pixels avec une couche cachée. La fenêtre d'entrée est prétraitée par la correction d'éclairage et l'égalisation d'histogramme.

Lin et al. [4, 2] ont proposé un système d'identification de visages entièrement automatique à décision probabilistes basé sur les réseaux de neurones (PDBNN). Un PDBNN est un réseau de neurones de classification avec une structure modulaire hiérarchique. Au lieu de l'image convertissante d'entrée à un vecteur cru, ils ont préféré employer des traits basés sur l'intensité et le contour.

Roth et al. [4, 30] ont proposé une nouvelle architecture d'étude dans le domaine visuel, qui est appliquée à la détection de visages. Le système est un réseau d'étude se composant de deux sous-réseaux pour le Visage et le Non-Visage. Les deux sous-réseaux de cible opèrent un espace d'entrée de dispositifs booléens.

Une autre architecture de réseau de neurones a été proposée par F. Boray Tek [4]. Cette architecture est basée sur le système développé par Rowley et al. et permettant de représenter n'importe quelle fonction, par la projection, en utilisant les surfaces arbitraires de décision basées sur des fonctions non-linéaires d'activation.

L'avantage de cette approche est le gain de temps considérable. En insérant des zooms différents lors de l'apprentissage, il ne devient plus nécessaire de tester chaque dimension potentielle. Rien n'interdisant la présence d'un visage occupant toute l'image ou uniquement le un dixième dans le coin. Cependant, l'utilisation d'exemples pour apprentissage apporte le risque de ne pouvoir résoudre que des situations déjà rencontrées, où un phénomène de sur-apprentissage qui spécialiserait le réseau uniquement sur les exemples connus sans généraliser.

précédent sommaire suivant

"Il faut répondre au mal par la rectitude, au bien par le bien." Confucius