2.2.1) La technique et l'interprétation
La technique d'analyse des données par correspondances
multiples que nous avons utilisé dans le présent mémoire
respecte les étapes suivantes :
1ère étape : les données sont
codées
· Les données quantitatives sont
découpées en classes
· Les données qualitatives sont codées.
Pour éviter des effectifs de classe trop faibles, on les regroupe des
modalités.
· Dans cette étape, les logiciels demandent
souvent de nommer les différentes modalités.
2ème étape : le tableau codé
est transformé en tableau de contingence
· Cette étape est souvent effectuée par les
logiciels sans intervention
de l'utilisateur.
3ème étape : une analyse des
correspondances est effectuée sur le tableau de contingence
· Réduction et quantification des
données
· Choix du nombre d'axes pertinents
· Sauvegarde des coordonnées factorielles et poids
des individus
· Représentations graphiques : cartes
factorielles et diagrammes interactifs
.
D'un point de vue mathématique, le traitement
opéré sur les données du tableau de contingence lors d'une
AFC nous a permis d'obtenir :
- des axes factoriels associés à des valeurs
propres ;
- pour chaque ligne (ou colonne) du tableau de contingence,
des coordonnées, des contributions à la formation des axes et des
qualités de représentation.
Le tableau de Burt étant symétrique, les profils
lignes et les profils colonnes sont identiques. Il en est de même des
coordonnées des individus-lignes et des individus-colonnes. L'inertie
totale du nuage des modalités a été
déterminée uniquement par le nombre total de modalités
q et le nombre de variables p. L'interprétation s'est
faite essentiellement à partir des modalités qui ont les
meilleures qualités de représentation selon chacun des septs axes
factoriels ou dans le premier plan factoriel. Enfin, l'inertie relative par
rapport à chaque axe nous a permi de retenir les modalités qui
ont le plus fortement contribué à la formation de cet axe.
2.3. Le protocole de prédiction par les
réseaux de neurone
Pour effectuer notre expérimentation par réseaux
neuronaux, nous nous proposons de préciser le type et l'architecture du
réseau, les paramètres caractéristiques et la base
d'apprentissage utilisée.
2.3.1) Le réseau utilisé: Perceptron
multicouches (PMC)
Compte tenu de la complexité des relations pouvant
exister entre les données, et de la dispersion statistique importante
des ratios aussi bien pour les entreprises défaillantes que pour les
entreprises non défaillantes (Malécot, 1997), le
réseau que nous avons utilisé est un réseau
supervisé à rétropropagation à deux couches. La
première couche est composée de 18 neurones. Le nombre de
neurones de la deuxième couche est égal à 2, il est
contraint par les valeurs cibles utilisées : « mauvais
payeur » ou « bon payeur »
|