2.3.2) Les paramètres
§ La fonction de transfert de la première
couche est logsigmoïde, la fonction de transfert de la deuxième
couche est la fonction linéaire. Ces fonctions permettent, dans une
architecture de taille suffisante, d'ajuster parfaitement toute fonction
comprenant un nombre fini de discontinuités.
§ L'apprentissage a été
réalisé par rétropropagation de l'erreur. De
façon à éviter les minima locaux dans la surface d'erreur,
nous avons utilisé un taux d'apprentissage variable et un moment.
L'avantage des réseaux multicouches à rétropropagation
réside dans leur faculté d'être très peu restrictifs
quant à la fonction à réaliser et d'être des
estimateurs très faiblement biaisés.
Les paramètres d'apprentissage du réseau sont les
suivants :
- Coefficient d'apprentissage : 0,1 0
- Momentum : 0,5
- Temperature de fonction sigmoide : 0,5
§ Trois critères peuvent être utilisés
pour définir l'arrêt de l'apprentissage (Asselin de
Beauville et Zollinger, 1995) :
1- un seuil d'erreur quadratique cumulée en sortie du
réseau : S.S.E.;
2- un nombre d'itérations préfixées ;
3- un seuil de taux d'efficacité du réseau sur la
base d'apprentissage.
Nous avons fixé la fin de l'apprentissage à une
valeur d'erreur de 0.01, critère numéro 1, à défaut
à un nombre défini d'itérations : 10 000, selon le
critère numéro 2
2.3.3) Apprentissage et généralisation
Deux tests différents ont été
menés, l'un sur les défaillances à un an, l'autre sur les
défaillances à deux ans et trois ans. Dans chacun des deux cas,
le nombre d'entreprises défaillantes a été partagé
en deux, une moitié pour l'apprentissage du réseau et une
moitié pour la phase de généralisation.
Durant la phase d'apprentissage, le caractère
« mauvais payeur » ou « bon payeur »
était donné au réseau et les poids des neurones
s'ajustaient au fur et à mesure des itérations. Puis les poids
des neurones ont été figés et nous avons
vérifié les performances du réseau. Nous avons
présenté au réseau la moitié des entreprises
défaillantes qui n'a pas été retenue pour la phase
d'apprentissage. Pour que le test soit complet, nous avons
présenté au réseau à la fois des entreprises
défaillantes et des entreprises non défaillantes et nous avons
relevé le nombre d'entreprises pour lesquelles le réseau
réalisait un diagnostic exact
|