Section 2 : Méthodologie
Notre étude est réalisées sur la base des
données recueillie auprès d'AMEN BANK, ces données seront
traitées et analysées par la méthode d'analyse
discriminante à l'aide du logiciel SPSS 20.
Les étapes de la réalisation de la méthode
sont à l'Annexe 1.
I. Construction de la base de données :
La construction de la base de données s'avère
couteuse en temps (collecte de données) pour de nombreuses raisons
à savoir les raisons techniques mais aussi les raisons de règles
strictes de confidentialité imposée par la banque.
Les deux obstacles que nous avons rencontrés : ? La
carence des données
64
? L'inadaptation du système d'autorisation et de
garanties.
La sélection s'est réalisée sur la base de
données comptable de l'exercice 2018. Et nous avons
considéré comme unité statistique : un dossier de
crédit. 5
La constitution de la base donnée est sous forme d'un
tableau à deux entrées individus-variables. Cette étape
sera automatiquement suivie par celle de la saisie.
Malgré la difficulté de collecte de données
pour raisons de « confidentialité et secret bancaire », nous
avons réussis un total 100 de dossiers de crédit dont 54
crédits octroyé n'était pas remboursé totalement,
en partie, ou même pas remboursé (Dossiers défaillants).
II. Choix de l'échantillon :
Une condition primordiale doit être vérifié
est que le choix des variables doit contribuer au maximum à la
distinction des bons dossiers de crédits des mauvais.
Ces variables doivent alors contenir l'essentiel de l'information
sur le client.
La batterie de critères a été choisie en
coordination avec le maître de stage à Amen Bank qui comporte 4
variables qualitatives et 17 variables quantitatives.
Nous présentons ci-dessous les variables
sélectionnées, détaillés comme suit :
Tableau 18 : Variables retenues
Aspect
|
Codification
|
Intitulé ou formule
|
Variables qualitatives
|
Q1
|
Solvabilité
|
Q2
|
Secteur d'activité
|
Q3
|
Durée de vie de l'entreprise
|
Q4
|
Zone d'implémentation
|
Variables quantitatives
|
R1
|
Résultat net / Capitaux propres
|
R2
|
Résultat net / Total Actifs
|
R3
|
Résultat net / Chiffre d'affaire
|
R4
|
FDR / Total actifs
|
R5
|
Valeur ajoutée / Chiffre d'affaire
|
R6
|
Capitaux propres / Total actifs
|
5 Dossier de crédit : un fichier
électronique où se trouvent toutes les informations comptables et
financières sur un client.
65
|
R7
|
Capitaux propres / Total dettes
|
R8
|
FDR/ BFR
|
R9
|
Capitaux propres / Total Immobilisations
|
R10
|
Actifs circulants / Dettes à CT
|
R11
|
Concours bancaires / Chiffre d'affaire
|
R12
|
(BFR / Chiffre d'affaire)
|
R13
|
(FDR / Chiffre d'affaire)
|
R14
|
Chiffre d'affaire / Total Actifs
|
R15
|
Chiffre d'affaire / Capitaux propres
|
R16
|
Total Immobilisation / Actifs circulants
|
R17
|
Concours bancaires / Chiffre d'affaire
|
Source : Travail personnel
Pour les variables qualitatifs, la codification sur SPSS sera de
la forme :
Tableau 19 : Codification des variables
qualitatifs
Solvabilité
|
0
|
= « Défaillante »
|
|
1 = «Saine »
|
Secteur d'activité
|
1
|
= « Santé »
|
|
2
|
= « Technologie »
|
|
3
|
= « Industrie »
|
|
4
|
= « Services »
|
|
5
|
= « Agroalimentaire »
|
|
6
|
= « Commercial »
|
Durée de vie de l'entreprise
|
1
|
= « Moins que 20 ans »
|
|
2
|
= « Entre 20 ans et 40 ans »
|
|
3
|
= « Entre 41 ans et 60 ans »
|
|
4
|
= « Entre 61 ans et 80 ans »
|
|
5
|
= « Entre 81 ans et 100 ans »
|
|
6
|
= « Plus que 100 ans »
|
Zone d'implémentation de l'entreprise
|
1
|
= « Nord»
|
|
2
|
= « Centre»
|
|
3
|
= « Sud»
|
Source : Travail personnel
66
1. Construction de la fonction score :
Nous allons procéder, comme présenté
précédemment, à l'analyse discriminante :
Méthode STEPWISE (Pas à pas)
1.1 Présentation et objectif de l'analyse discriminante
:
L'analyse discriminante est privilégiée par les
constructeurs de scores. Il est un modèle de classification fondé
sur l'analyse des données, il est une technique statistique qui admet
reclassement des débiteurs en deux groupes (bon payeurs et mauvais
payeurs) et à rechercher l'ensemble des variables (ratios) qui
permettent de prévoir le mieux, qui a fait défaut de paiement
récurrent ou non (dans le passé).6
1.2 Sélection des variables par la méthode de
« STEPWISE PAS A PAS : ASCENDANT » :
a. Approche STEPWISE :
La méthode « Pas à pas »
détermine les meilleures variables prédictives à impliquer
dans un modèle parmi un plus grand ensemble de variables
prédictives potentielles pour les modèles de régression
linéaire, logistique etc.
La méthode peut être mise en pratique
grâce à l'aide du logiciel SPSS. Elle détermine les
variables à retenir de manière « Ascendante ». En
effet, chaque étape consiste au choix de la variable qui a le plus fort
pouvoir discriminant (Lambda de Wilks est statistiquement significatif). En
appliquant cette méthode à notre échantillon, on obtient
ces résultats :
b. Méthode Step Wise Wilks Lambda:
Tableau 20 : Méthode STEPWISE Wilks'
Lambda
Lambda de Wilks
Pas
|
Nombre de variables
|
Lambda
|
ddl1
|
ddl2
|
ddl3
|
F exact
|
Statistique
|
ddl1
|
ddl2
|
Signification
|
1
|
1
|
,791
|
1
|
1
|
66
|
17,472
|
1
|
66,000
|
,000
|
2
|
2
|
,685
|
2
|
1
|
66
|
14,974
|
2
|
65,000
|
,000
|
3
|
3
|
,645
|
3
|
1
|
66
|
11,761
|
3
|
64,000
|
,000
|
4
|
4
|
,595
|
4
|
1
|
66
|
10,718
|
4
|
63,000
|
,000
|
6 Chebil, Z., Bamousse, Z., & ElKaabouri, M.
(2018). Prévision du risque de crédit : Ambition de scoring
Analyse comparative des paratiques de crédit Scoring. International
Journal Of Management & Marketing Reseach (MMR) , pp. 33-37.
67
Interprétation : La
méthode STEPWISE Wilks'Lambda, nous a permis d'obtenir une meilleure
combinaison de variable au bout de la 4ème étape. Le
processus de cette méthode est d'introduire une nouvelle variable
à chaque étape et les classifier afin de maximaliser la
significativité de la fonction, résultant une minimisation de
Lambda de Wilks7.
c. Variables retenues par la méthode :
Tableau 21 : Variables retenues par la méthode
STEPWISE
Variables
|
Signification
|
R2
|
Résultat net / Total Actifs
|
R5
|
Valeur ajoutée / Chiffre d'affaire
|
R7
|
Capitaux propres / Total dettes
|
R15
|
Chiffre d'affaire / Capitaux propres
|
d. Statistique des variables retenues :
? Analyse de la diversité des valeurs prises par les
ratios :
Le tableau 22 nous présente la statistique descriptive
des variables retenues :
Tableau 22 : Statistique descriptive des variables
retenues
Statistiques descriptives
|
N
|
Minimum
|
Maximum
|
Somme
|
Moyenne
|
Ecart type
|
Variance
|
Statistique
|
Statistique
|
Statistique
|
Statistique
|
Statistique
|
Erreur std
|
Statistique
|
Statistique
|
R2
|
100
|
-,536
|
,870
|
5,388
|
,05388
|
,017134
|
,171344
|
,029
|
R5
|
100
|
-,031
|
1,824
|
35,869
|
,35869
|
,030801
|
,308006
|
,095
|
R7
|
100
|
-1,547
|
30,398
|
208,829
|
2,08829
|
,437085
|
4,370847
|
19,104
|
R15
|
100
|
-6,292
|
37,640
|
200,903
|
2,00903
|
,454475
|
4,544746
|
20,655
|
N valide (listwise)
|
100
|
|
|
|
|
|
|
|
7 Lambda de Wilks est un indicateur de valeur maximale
1 et de valeur minimale 0. Plus la valeur de Lambda est faible (Proche de
zéro), plus les groupes sont séparés.
68
1.3 Résultats de l'analyse discriminante :
a. Présentation de la fonction score :
Tableau 23 : Coefficients de la fonction
"SCORE"
Coefficients des fonctions de classement
|
Solvabilité
|
|
saine
|
R2
|
-6,830
|
,642
|
R5
|
3,619
|
6,176
|
R7
|
,129
|
,294
|
R15
|
,430
|
,136
|
(Constante)
|
-1,688
|
-3,007
|
|
Fonctions discriminantes linéaires de Fisher
Alors, nous avons obtenus les fonctions de classements suivantes
:
Z1(Défaillante) = -6.830 R2 + 3.619 R5 + 0.129 R7 +
0.430 R15 - 1.688 Z2(Saine) = 0.642 R2 + 6.176 R5 + 0.294 R7 +
0.136 R15 - 3.007
Les entreprises sont classées suivant un score obtenu,
d'ailleurs elles sont affectées au groupe dont elles obtiennent le score
le plus important.
b. Affectation au groupe :
Tableau 24 : Affectation aux groupes
Fonctions aux barycentres des groupes
Solvabilité
|
Fonction
|
|
1
|
|
défaillante saine
|
|
-,620
1,066
|
Fonctions discriminantes canoniques non standardisées
évaluées aux moyennes des groupes
69
L'affectation des groupes est faite par la comparaison du
score discriminant « Moyen » pour chaque groupe. Il est
calculé à partir de la fonction discriminante en
remplaçant les valeurs individuelles par les valeurs moyennes.
Score moye?? Défailla??t?? = -0.620 Score
moye????ai???? = 1.066
Valeur du score
|
Situation de la firme
|
Z > 1.066
|
Bonne
|
-0.620< Z < 1.066
|
Incertaine
|
Z > -0.620
|
Dangereuse
|
c. Test du modèle élaboré :
Tableau 25 : Corrélation canonique
Valeurs propres
Fonction
|
Valeur propre
|
% de la variance
|
% cumulé
|
Corrélation canonique
|
1
|
,680a
|
100,0
|
100,0
|
,636
|
a. Les 1 premières fonctions discriminantes canoniques ont
été utilisées pour l'analyse.
Interprétation : On a
trouvé, à partir du tableau 25, une corrélation canonique
égale à 63.6%. Ce résultat est satisfaisant car plus la
corrélation canonique est proche de 1, plus le modèle est
meilleur. On peut déduire que la fonction élaborée a un
pouvoir discriminant assez important.
Tableau 26 : Lambda de Wilks Lambda de Wilks
Test de la ou des fonctions
|
Lambda de Wilks
|
Khi-deux
|
ddl
|
Signification
|
1
|
,595
|
33,221
|
4
|
,000
|
Interprétation : On
trouvé, à partir du tableau 26, une valeur de Lambda de Wilks
faible, égale à 0.595 avec un Khi-deux de signification nul.
On peut déduire que la différence entre les
moyennes des groupes est significative.
70
Tableau 27 : Matrice de confusion
Résultats du classementa, b,d
|
Entreprises
|
Classe(s) d'affectation prévue(s)
|
Total
|
défaillante
|
saine
|
défaillante
|
38
|
5
|
43
|
Effectif
|
|
|
|
saine
|
6
|
19
|
25
|
Original
|
|
|
|
défaillante
|
88,4
|
11,6
|
100,0
|
%
|
|
|
|
saine
|
24,0
|
76,0
|
100,0
|
Observations sélectionnées
|
|
|
|
défaillante
|
36
|
7
|
43
|
Effectif
|
|
|
|
saine
|
6
|
19
|
25
|
Validé-croisé
|
|
|
|
défaillante
|
83,7
|
16,3
|
100,0
|
%
|
|
|
|
saine
|
24,0
|
76,0
|
100,0
|
· 83,8% des observations originales
sélectionnées classées correctement.
· 75,0% des observations originales non
sélectionnées classées correctement.
· La validation croisée n'est effectuée que
pour les observations de l'analyse. Dans la validation croisée, chaque
observation est classée par les fonctions dérivées de
toutes les autres observations.
· 80,9% des observations
validées-croisées sélectionnées classées
correctement.
· Pourcentage des observations biens classées pour
les entreprises saines : 19/25 = 76%
· Pourcentage des observations biens classées pour
les entreprises défaillantes : 38/43 = 88.37%
· Taux erreurs (Entreprises mal classées) :
(7+6)/100 = 13%
71
|