UNIVERSITE CHEIKH ANTA DIOP
FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION
CENTRE DE RECHERCHE ET DE FORMATION POUR LE DEVELOPPEMENT
ECONOMIQUE ET SOCIAL (CREFDES)
Année Universitaire 2006-2007
Mémoire de fin d'études pour l'obtention du
diplôme de :
MASTER II Professionnel de
METHODES STATISTIQUES & ECONOMETRIQUES
Scoring du risque de crédit des PME par la
modélisation
statistique et l'intelligence artificielle chez
l'UMECUDEFS :
Une application comparative de la Régression Logistique
et des Réseaux de Neurones
Présenté par :
Fred NTOUTOUME OBIANG-NDONG
Encadré par :
Octave JOKUNG NGUENA,
Ph. D. en Finance
HDR, 3e cycle en Mathématiques
Professeur à l'Université de Lille, et à
l'EDHEC Business School
Fodiyé Bakary DOUCOURE
Ph. D. en Statistiques
Maître en Econométrie
Maître Assistant à l'Université Cheikh Anta
Diop de Dakar
REMERCIEMENTS
Mes remerciements vont à l'endroit des personnes
suivantes, qui ont de près ou de loin contribué à
l'aboutissement de ce travail de recherche :
· DIEU le Tout Puissant ;
· Monsieur et Mme OBIANG-NDONG mes chers parents;
· Monsieur Octave JOKUNG NGUENA, mon Directeur
Général ;
· Monsieur Wade, Directeur Général de
l'UMECUDEF, associé de Babacar Mbaye ;
· Messieurs Bouna NIANG, Fodiyé Bacary DOUCOURE et
Pape NGOME de l'université Cheikh Anta Diop (UCAD) de Dakar ;
· Mes frères et amis parmi lesquels Francis Mba
Zue ;
· Mlle Ingrid Liliane Mengue Me Doumbeneny.
TABLE DES MATIERES
REMERCIEMENTS II
TABLE DES MATIERES III
LISTE DES TABLEAUX VI
LISTE DES FIGURES & GRAPHIQUES VIII
RESUME ANALYTIQUE IX
INTRODUCTION 1
PREMIERE PARTIE : CADRE DE
REFERENCE 3
CHAPITRE IER : REVUE DE LA LITTÉRATURE 4
I/ Généralités sur le Scoring
4
1.1. Définition, Fondements historiques et
théoriques 4
1.2. Les principales techniques de crédit
scoring 6
1.3. L'utilisation des scores de risque 9
II/ Généralités sur la
régression logistique 10
2.1. Définition de la régression logistique
binaire 10
2.2. Principes et propriétés
mathématiques de la régression logistique binaire 10
III/ Généralités sur les
réseaux de neurone 12
3.1. Définition et historique des réseaux de
neurone 12
3.2. Principes et propriétés
mathématiques des réseaux de neurones 12
3.3. Mode et règles d'apprentissage des réseaux
de neurones 14
3.4. Les principaux réseaux de neurone 15
IV / Enseignements de la revue de littérature
16
4.1- Les limites du Scoring 16
4.2- Les limites de la régression logistique 16
4.3- Les limites des réseaux neuronaux 17
CHAPITRE II : PROBLÉMATIQUE GÉNÉRALE
18
I/ Problématique 18
1.1. Contexte et justification de l'étude 18
1.1.1) Le contexte socio-économique, institutionnel,
sectoriel et technologique 18
1.1.2) La justification pour les managers, les
décideurs politiques
et les chercheurs 20
1.2. Problème de recherche et résultats attendus
21
II/ Cadre Conceptuel 23
2.1. Définition des concepts 23
2.2. Objectifs de recherche 26
2.3. Hypothèses et indicateurs 26
2.3.1) Hypothèses de recherche et cadre
opératoire 26
2.3.2) Outils de collecte, sources d'information et
difficultés rencontrées 28
III/ Cadre de l'étude :
présentation de l'UMECUDEFS 29
3.1. Historique et Activités 29
3.2. Structure organisationnelle 29
3.3. Caractéristiques de l'activité 30
DEUXIEME PARTIE : METHODOLOGIE ET ANALYSE
DES RESULTATS 31
CHAPITRE III : MÉTHODOLOGIE 32
I/ Les préalables au Scoring: Collecte et
préparation des données 32
1.1. L'échantillon 32
1.2. Les paramètres analysés 32
1.3. Le traitement des données 32
II/ Le protocole de recherche 33
2.1. Le protocole général 33
2.2. Le protocole de la réduction des variables par
l'analyse factorielle 34
2.3. Le protocole d'expérimentation par les
réseaux de neurone 35
2.3.1) Le réseau utilisé: Perceptron
multicouches (PMC) 35
2.3.2) Les paramètres 35
2.3.3) Apprentissage et généralisation
35
2.4. Le protocole d'expérimentation par la
régression logistique 36
2.4.1) Génération des modalités
discriminantes 36
2.4.2) Estimation du modèle par le maximum de
vraisemblance 36
2.4.3) Test de significativité globale
(Evaluation de la calibration du modèle :
le test de Hosmer et Lemeshow) 36
2.4.4) Evaluation du pouvoir discriminant du modèle :
sensibilité, spécificité 37
CHAPITRE IV : PRÉSENTATION & ANALYSE DES
RESULTATS DES
CLASSEMENTS PREDICTIFS 38
I/ Résultats de l'Analyse Factorielle des
Correspondances Principales 38
1.1. Dimensions de la solution et valeurs propres (inerties)
38
1.2. Qualité de représentation (Fator Analisys
Communalities) 41
1.3. Les variables explicatives retenues 42
II/ Résultats économétriques de
la modélisation par régression logistique 43
2.1. Génération des modalités
« Bon payeur » et « mauvais payeur »
43
2.2. Spécification du modèle logit et
estimation des paramètres prédictifs 44
2.3. Qualité du modèle (Test de
Significativité globale) 47
2.4. Test de Hosmer-Lemeshow (test d'ajustement du
modèle) 48
2.5. Qualité de prédiction du
modèle (performance de classification) 49
2.6. Discussions sur les déterminants du
risque de crédit du modèle Logistique 50
2.6.1) Probabilité de non-remboursement et âge
du dirigeant de la PME 50
2.6.2) Probabilité de non-remboursement et Niveau de
Revenu
du dirigeant de la PME 51
2.6.3) Probabilité de non-remboursement et
Durée d'existence de la PME 52
2.6.4) Probabilité de non-remboursement et Valeur
de la garantie proposée 52
2.6.5) Probabilité de non-remboursement et Montant du
crédit Octroyé 53
2.6.6) Probabilité de non-remboursement et
sélection adverse 53
2.6.7) Probabilité de non-remboursement et Respect des
échéances 54
2.7. Simulations sur le modèle logistique
55
III/ Résultats de la modélisation par
réseaux de neurones 57
3.1. Identification des données en entrée et en
sortie. 57
3.2. La fixation des paramètres du réseau &
apprentissage 59
3.3. Les résultats de la modélisation par
réseaux de neurones 61
3.4. Le réajustement de la structure du réseau
de neurones et les résultats 62
IV/Comparaison des modèles logistique et
neuronal 62
4.1. Comparaison des matrices de confusion (pourcentage de
classement prédictif) 62
4.2. Choix du modèle de scoring final 63
TROISIEME PARTIE : RECOMMANDATIONS
64
CHAPITRE V : RECOMMANDATIONS 65
I/ Recommandations pour une utilisation du
modèle de score 65
1.1. Implémentation informatique 65
1.2. Formation des utilisateurs du modèle de score
65
1.3. Suivi ponctuel par évaluation des utilisateurs
65
1.4. Suivi en continue par tableau de bord 66
II/ Recommandation sur les aspects organisationnels de
l'UMECUDEFS 67
CONCLUSION 68
BIBLIOGRAPHIE XI
Pour l'analyse des données XI
Pour le scoring XII
Pour la régression logistique et les
réseaux de neurones XII
Webographie XIII
ANNEXES XIV
|