CHAPITRE IV : PRESENTATION & ANALYSE DES
RESULTATS
« Le Credit Scoring n'approuve, ni ne rejette une
demande de prêt,
il peut plutôt prédire la probabilité
d'occurrence de mauvaise performance (défaut)
telle que définie par le préteur »
(Caire et Kossmann, 2003)
I/ Résultats de l'analyse factorielle des
correspondances principales
Notre analyse va se baser sur nos données
décrivant des individus (clients PME de l'UMECUDEFS) à l'aide de
variables catégorielles (recodées en numériques) et
quantitatives décrivant leurs données démographiques, leur
expérience en matière de crédit, la forme et la nature de
leur activité, les garanties proposées, les indicateurs temporels
et le montant du crédit. Il y'a n=212 individus ou observations, et p=18
variables descriptives + une variable explicative
(rem3mois), la variable nom_entr
identifiant les 212 observations.
Tableau 6: Descriptif des variables initiales
Code
|
Nouveau
Code
|
Etiquette
|
Nombre de
modalités
|
nom_entr
|
Var1
|
Nom de l'entreprise (ou du dirigeant)
|
207
|
sexedir
|
Var2
|
Sexe du dirigeant de l'entreprise
|
2
|
statmat
|
Var3
|
Statut matrimonial du dirigeant de l'entreprise
|
4
|
age
|
Var4
|
Age du dirigeant de l'entreprise
|
11
|
nbenf
|
Var5
|
Nombre d'enfant du dirigeant de l'entreprise
|
2
|
persach
|
Var6
|
Nombre de personnes à charge dans le foyer du dirigeant
d'entreprise
|
3
|
perssal
|
Var7
|
Nombre de personnes salariées dans le foyer du dirigeant
d'entreprise
|
4
|
dom
|
Var8
|
Domicile du dirigeant d'entreprise
|
3
|
nivetude
|
Var9
|
Niveau d'étude du dirigeant de l'entr.
|
5
|
nivrev
|
Var10
|
Niveau de revenu du dirigeant de l'entr.
|
7
|
pretpass
|
Var11
|
Nombre de prêts déjà contractés par le
dirigeant de l'entreprise dans le passé
|
6
|
Sectact
|
Var12
|
Secteur d'activité de l'entreprise
|
10
|
duréexis
|
Var13
|
Durée d'existence de l'entreprise
|
4
|
typgar
|
Var14
|
Type de garantie proposé par le demandeur de
crédit
|
7
|
valgar
|
Var15
|
Valeur de la garantie proposée
|
8
|
durecoul
|
Var16
|
Durée écoulée entre demande de crédit
et réponse de l'UMECUDEFS
|
4
|
montant
|
Var17
|
Montant du crédit octroyé
|
6
|
democt
|
Var18
|
Montant demandé = montant octroyé ?
|
2
|
difdemre
|
Var19
|
Différence entre nombre de versements demandés
et obtenus
|
5
|
rem3mois
|
Var20
|
Le Client a-t-il remboursé intégralement son
crédit au plus 3 mois après la dernière
échéance prévue ?
|
2
|
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
1.1. Dimensions de la solution et valeurs propres
(inerties)
La représentation graphique que l'on souhaite obtenir
de ces données en termes de catégories et d'objets, s'effectue
dans un repère orthonormé dont on doit préciser le nombre
d'axes a, appelé la dimension de la
solution. La dimension maximum du sous-espace de représentation
est égale au nombre de catégories
(m=95) moins le nombre de variables sans
valeurs manquantes (p=19). Cependant pour des raison pratiques, notre
représentation s'appuiera sur une solution à sept dimensions pour
synthétiser les traits essentiels le l'information recherchée.
Pour obtenir une analyse en composantes principales sous
SPSS, nous créons par recodage, à partir du tableau des
données alphanumériques, un tableau numérique comportant
l'ensemble des variables à analyser. Pour ce faire, nous utilisons la
procédure de recodage automatique <Recoder
Automatiquement> du menu de transformation
<Transformer>, créant ainsi la variable Var2
(codage numérique), à partir de
sexedir (codage alphanumérique),
jusqu'à la variable Var20 à partir de
rem3mois, par transformation des catégories
prises dans un ordre lexical croissant.
Après recodage automatique des données, nous
sélectionnons à partir du menu <Analyse>, la
procédure <Analyse Factorielle> du menu
<Factorisation>, en choisissant les options correspondantes
à la syntaxe suivante :
Tableau 7: Fichier de syntaxe de l'analyse factorielle
sous SPSS
FACTOR
/VARIABLES sexedir statmat age nbenf persachg perssal dom
nivetude nivrev
pretpass sectact duréexis typgar valgar durecoul montant
democt difdemre
/MISSING LISTWISE /ANALYSIS sexedir statmat age nbenf persachg
perssal dom
nivetude nivrev pretpass sectact duréexis typgar valgar
durecoul montant
democt difdemre
/PRINT INITIAL EXTRACTION FSCORE
/FORMAT SORT
/PLOT EIGEN
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/ROTATION NOROTATE
/SAVE REG(ALL)
/METHOD=CORRELATION .
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
Le tableau des Eigenvalues ci-dessous rend compte des valeurs
propres (ou inerties) prises par chaque axe factoriel (ou composante), il rend
compte aussi des taux d'inertie (% de la variance) et des taux d'inertie
cumulés (% cumulés). En effet dans la solution initiale, nous
avons autant de composantes que de variables explicatives (au nombre de 18), la
colonne « Total » nous renseignant sur la contribution de
la variance dans chaque variable observée et expliquée par chaque
axe factoriel. Cette valeur est ensuite relativisée par rapport à
l'inertie totale, puis cumulée.
En observant les inerties des 3 premiers axes, on constate que
le premier représente 15,5% de l'inertie totale, le deuxième
représente 10,6% de l'inertie totale et le troisième 9,4%. Leur
cumul est de 35,6%, ce qui signifie qu'en s'appuyant sur une solution à
3 dimensions, nous résumerions 35,6% de l'information totale de
départ. Ce qui est relativement insuffisant pour nous permettre de
continuer. Nous retiendrons donc les sept premiers axes, dont l'inertie
cumulée est de 61,7%.
Tableau 8: Variance expliquée totale
(Eigenvalues)
Source : Recherche de Fred Ntoutoume (logiciel SPSS),
Crefdes, 2007
Le choix que nous faisons de retenir les 7 premiers axes de
l'analyse peut être conforté par le l'analyse du graphique
suivant, où l'on constate qu'après le septième composant,
la contribution reste marginale et décroissante.
Figure 6: Graphique des valeurs propres
Source : Recherche de Fred Ntoutoume
(logiciel SPSS), Crefdes, 2007
1.2 Qualité de représentation (Factor Analisys
Communalities)
La qualité de représentation indique la
contribution de chaque variable expliquée. Les qualités de
représentation initiales estiment la variance de chaque variable
expliquée par l'ensemble des facteurs (composants).
Pour l'ACP la représentation initiale est toujours
égale à 1 (analyse de corrélation) ou à la variance
de la variable (analyse de covariance).
Les extractions étant estimées de la variance de
chaque variable expliquée dans la solution factorielle, les plus petites
valeurs représentent les variables qui ne s'ajustent pas assez à
la solution factorielle, et qui peuvent par conséquent être
supprimées de l'analyse.
Ainsi, on remarque que les 12 premières variances
(inerties) les plus importantes sont, par ordre décroissant :
1-Nombre d'enfants..........................(0,803)
2-Nombre de personnes à charge ......... (0,775)
3-Sexe du dirigeant ......................... (0,697)
4-Secteur d'activité
..........................(0,662)
5-Montant du crédit octroyé
...............(0,654)
6-Durée entre demande et réponse
........(0,641)
7-Niveau de revenus du dirigeant ........(0,640)
8-Valeur estimée de la garantie ............(0,629)
9-Différence versements dem et obt.......(0,621)
10- Montant dem = montant octroyé ?.....(0,618)
11- Durée d'existence de l'entreprise .....(0,579)
12-Age du dirigeant de l'entreprise .......(0,569)
On en déduit que d'autres variables comme le type de
garantie ou le statut matrimonial du dirigeant de l'entreprise n'expliquent pas
assez la solution factorielle.
Tableau 9: Qualité de représentation des
variables
Source : Recherche de Fred Ntoutoume (logiciel SPSS),
Crefdes, 2007
Notre interprétation des inerties peut être
conforté à la lumière de l'analyse la matrice des
composantes, qui renseigne sur la contribution de chaque variable à
l'explication de chacun des 7 axes factoriels retenus.
Nous remarquons en effet, sur la ligne de la variable
« Nombre d'enfants », que les inerties sont assez fortes
pour chaque axe factoriel concerné. De même pour la variable
« Nombre de personnes à charges », qui a d'assez
bonnes contributions sur tous les sept axes. Par contre, la variable
« Type de garantie présentée », qui semble
pourtant bien expliquer l'axe 1, n'est pas assez explicative sur les 6 autres
composantes.
Source : Recherche de Fred Ntoutoume (logiciel SPSS),
Crefdes, 2007
Tableau 10: Matrice des composantes
|