2.1. Génération des modalités
« Bon payeur » et « mauvais
payeur »
En posant que :
1 si la TPE est « mauvais
payeur »
Y= probabilité de défaut (variable
endogène), avec Yi=
0 sinon
Définition (Rappel) : une entreprise est
« mauvais payeur » si elle n'a pas intégralement
remboursé son crédit, intérêt et principal, au plus
3 mois après la dernière date d'échéance
prévue.
Tableau 12: Codage de la varible dépendante (Y)
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
On peut donc écrire pour le modèle logit auquel
nous aurons recours :
Probabilité de défaut de remboursement P(Y
=1) = 1- F(S - Xi â),
Avec F : la fonction de répartition du
modèle logit qui est égal à F(x) = 1/(1+e-x)
Xi â : vecteur des variables
exogènes (explicatives)
S : le seuil (constante)
Donc :
1
1 + e -S+Xiâ
§ P (Y=1) = 1 -
2.2. Spécification du modèle logit et
estimation des paramètres prédictifs
Figure 7: Procédure d'estimation du modèle
logistique sous SPSS
Pour obtenir une spécification et une estimation du
modèle par régression logistique sous SPSS, nous
sélectionnons à partir du menu <Analyse>, la
procédure <Logistique Binaire> du menu
<Régression>, en choisissant les options
« Diagramme de classement », « qualité
d'ajustement de Hosmer-Lemeshow », « correlation des
estimations » et « historique des
itérations ».
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
Figure 8: Choix de la méthode logistique
« Descendante par rapport de vraisemblance »
Nous choisissons ensuite d'utiliser la méthode
« descendante par rapport de vraissemblance » de sorte que
SPSS ne sélectionne que les variables réellement significatives
dans le modèle final.
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
Le tableau ci-dessous récapitule le traitement des
observations contenues dans notre base de données. Nous retrouvons nos
212 TPE inclues dans l'analyse.
Tableau 13: Récapitulatif du traitement des
observation
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
Ce récapitulatif établi, il nous permet de
savoir qu'aucune observation n'a été retirée (omise) de
l'analyse suite à une probable valeur aberrante ou manquante. Nous
pouvons dès lors présenter les résultats de l'estimation
des paramètres du modèle Logit, par la méthode du
Maximum Likelihood (descendante):
Tableau 14: Estimation des paramètres du
modèle logistique
|
|
B
|
E.S.
|
Wald
|
ddl
|
Signif.
|
Exp(B)
|
Etape 12
|
AGE
|
0,316
|
0,144
|
4,818
|
1
|
0,028
|
1,372
|
|
NIVREV
|
-0,451
|
0,187
|
5,842
|
1
|
0,016
|
0,637
|
|
DURÉEXIS
|
-0,951
|
0,562
|
2,859
|
1
|
0,091
|
0,386
|
|
VALGAR
|
-0,273
|
0,154
|
3,129
|
1
|
0,077
|
0,761
|
|
MONTANT
|
0,888
|
0,327
|
7,378
|
1
|
0,007
|
2,43
|
|
DEMOCT
|
3,347
|
0,662
|
25,592
|
1
|
0
|
28,418
|
|
DIFDEMRE
|
1,268
|
0,321
|
15,636
|
1
|
0
|
3,554
|
|
Constante
|
-3,586
|
2,373
|
2,283
|
1
|
0,131
|
0,028
|
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
En considérant P comme la
probabilité que la TPE soit un « mauvais payeur »,
l'estimation des paramètres du modèle permet d'aboutir à
la régression (Equation) suivante :
= (-3,586) +0,316.AGE
-0,451.NIVREV -0,951.DUREEXIS
-0,273.VALGAR +0,888.MONTANT
+3,347.DEMOCT + 1,268.DIFDEMRE
P
1-P
ln
D'où le modèle logistique P de
probabilité de défaut de remboursement (ou modèle de
crédit-scoring) dans notre présente étude peut finalement
s'écrire :
1
1+e (- 3,586
+0,316.AGE -0,451.NIVREV
-0,951.DUREEXIS -0,273.VALGAR
+0,888.MONTANT +3,347.DEMOCT
+1,268.DIFDEMRE)
P = 1-
A proprement parler, la valeur numérique des
paramètres estimés en eux même n'ont pas
d'intérêt dans une estimation logistique, dans la mesure où
« ils ne correspondent aux paramètres de d'équation
de la variable latente qu'à une constante multiplicative
près » (Doucouré, 2006).
La seule information réellement utilisable est donc le
signe des paramètres, car ceux-ci donnent une indication sur le sens de
l'influence que la variable associée a sur la probabilité de
non-remboursement à la hausse ou à la baisse. Par ailleurs, il
apparaît après l'estimation des paramètres par le maximum
de vraisemblance que seules sept variables sont réellement
significatives dans notre modèle logistique, au vu des valeurs de leur
probabilité (colonne « Signif. »). Il s'agit des
variable AGE (2,8%), NIVREV (1,6%),
DUREEXIS (« variable forcée »
à 9,1%), VALGAR (« variable
forcée » à 7,7%), MONTANT
(0,7%), DEMOCT (0%) et DIFDEMRE (0%). Pour
mémoire, on accepte l'hypothèse de non nullité du
coefficient dès que la probabilité critique
(significativité) est inférieure à 0,05, soit 5%.
Enfin, le logiciel SPSS indique à son 12e
pas qu'« aucune autre variable ne peut être supprimée ou
rajoutée au modèle en cours » (cf. tableau infra). En
effet, à chaque étape, l'algorithme du modèle logistique
élimine systématiquement les variables dont la
significativité est trop faible quant à la classification des
bons ou mauvais payeurs. Cette spécifié vient de l'option
« régression logistique descendante » pour laquelle
nous avons opté, en complément de notre analyse factorielle.
Ainsi, comme le présente le tableau récapitulatif ci-dessous, la
variable PERSACH a été « out » à
l'étape 1, suivie de la variable TYPGAR à l'étape 3, puis
de la variable NBENF à l'étape 4, et ainsi de suite jusqu'au
12e pas. Pour cette raison, nous ne discuterons infra que des
variables significatives (cf paragraphe 2.6).
Tableau 15: Récapitulatif des étapes de la
régression logistique
Source : Recherche de Fred Ntoutoume, Crefdes, 2007
|
|