Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones( Télécharger le fichier original )par Fred NTOUTOUME OBIANG-NDONG Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006 |
2.3. Qualité du modèle (Test de Significativité globale)
La qualité du modèle est évaluée par le Log likelihood (ou log vraisemblance). Cet indicateur vaut 96,827 à la 12e étape. On en déduit que la significativité globale du modèle est bonne. Tableau 16: Test de Log vraisemblance Source : Recherche de Fred Ntoutoume, Crefdes, 2007 2.4. Test de Hosmer-Lemeshow (test d'ajustement du modèle) Le test de Hosmer-Lemeshow permet de savoir si le modèle spécifié est bon ou mauvais. Il s'appuie sur le test d'hypothèse suivant : H0 : ajustement bon (Goodness of fit) H1 : ajustement mauvais La règle de décision est : § On accepte l'hypothèse H0 si la valeur de la probabilité (Significativité) est supérieure à 5% ; § On refuse l'hypothèse dans le cas contraire.
Le logiciel SPSS nous fourni les résultats ci-dessous : Tableau 17: Test de Hosmer-Lemeshow
Source : Recherche de Fred Ntoutoume, Crefdes, 2007 Interprétation du test : au seuil de 5%, l'ajustement du modèle est bon car la probabilité (ou significativité) du Khi carré à 8 degrés de liberté (ddl) vaut 0,56, soit 56%, d'où on accepte l'hypothèse H0. Ce d'autant plus que la distance entre les fréquences observées et prédites au moyen de la statistique du Khi 2 est petite (6,788). Le modèle est donc bien calibré. 2.5. Qualité de prédiction du modèle (performance de classification)La qualité de prédiction du modèle est donnée par le tableau suivant Tableau 18: Performances de classification du modèle logit
Source : Recherche de Fred Ntoutoume (Logiciel SPSS), Crefdes, 2007 Le modèle logit prédit correctement la défaillance des TPE dans 93,4% des cas. Le présent modèle de crédit scoring présente donc d'excellentes qualités prédictives. Ce d'autant plus qu'il prédit à 97,2 % les mauvais emprunteurs (sensibilité), et à 75% les bons (spécificité). Or les pertes financières issues d'un « mauvais prêt » sont plus importantes que les pertes financières issues du rejet par erreur d'un « bon prêt »29(*). 2.6. Discussions sur les déterminants du risque de crédit du modèle LogistiquePour mémoire, nous rappelons les signes des coefficients dans le tableau qui suit : Tableau 19 : Signe des coefficients et significativité
Source : Recherche de Fred Ntoutoume, Crefdes, 2007 Notre discussion admettra systématiquement un test du Khi 2 de Pearson, afin d'évaluer la relation entre la variable endogène (non remboursement) et la covariable discutée. Le test d'hypothèse généralement admis est le suivant : H0 : La variable exogène et la variable endogène ne sont pas dépendantes (aucun lien) H1 : La variable exogène et la variable endogène sont dépendantes Nous nous baserons sur une signification asymptotique (bilatérale) de 0,05 qui signifie qu'on a 5 chances sur 100 de se tromper en rejetant l'hypothèse nulle, c'est-à-dire en admettant que les colonnes et les lignes du cas traité sont indépendantes. En conséquence, on accepte l'hypothèse d'indépendance des variables si la signification asymptotique est supérieure à 5%.
* 29 En effet, il est bien plus grave d'octroyer un prêt à une personne qui ne le remboursera pas (faux positif - erreur de type 1) que de ne pas octroyer un prêt à une personne fiable (faux négatif - erreur de type 2). |
|