WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones

( Télécharger le fichier original )
par Fred NTOUTOUME OBIANG-NDONG
Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

II / Le protocole de recherche

2.1. Le protocole général

Le protocole général de recherche que nous nous proposons de mettre en oeuvre est présenté dans le schéma suivant :

Figure 5: Schéma du protocole général de recherche

Collecte et préparation des données

(Logiciel SPSS)

Analyse Factorielle

(Logiciel SPSS)

Revue de la littérature, Problématique & Cadre Opératoire

Modélisation et Prédiction par régression logistique (Logiciel SPSS)

Modélisation et Prédiction par réseaux de neurone

(Logiciel SPAD)

(F. B. Doucouré, 2006)

1- Génération des modalités discriminantes

2- Estimation du modèle par le maximum de vraisemblance

3- Test de sigificativité globale

4- Validation du modèle

5- Vérification des taux de prédiction

(Asselin de Beauville et Zollinger, 1995)

1- le choix d'un type de réseau :

2- le choix d'une architecture du réseau ;

3- le choix des fonctions de transfert ;

4- le choix d'un algorithme d'apprentissage ;

5- le choix d'une base d'apprentissage ;

6- la fixation des paramètres du réseau

7- Apprentissage & Validation du modèle prédictif

Comparaison de la performance des 2 modèles prédictifs (Courbes ROC)

MODELE DE SCORING

FINAL

2.2. Le protocole de la réduction des variables par l'analyse factorielle

L'étude de notre population statistique (les clients PME de l'UMECUDEFS) de taille n passe par le recueil d'un nombre élevé p de données quantitatives et qualitatives par élément observé. L'analyse de ces données, dont les qualitatives seront recodées, doit tenir compte de leur caractère multidimensionnel et révéler les liaisons existantes entre leurs composantes.


L'analyse factorielle des correspondances (AFC)27(*), est une méthode très puissante pour explorer la structure de telles données multidimensionnelles. Chaque donnée étant représentée dans un espace à p dimensions, l'ensemble des données forme un "nuage de n points" dans Rp. Le principe de l'AFC est d'obtenir une représentation approchée du nuage dans un sous-espace de dimension faible k par projection sur des axes bien choisis. Les composantes principales sont les n vecteurs ayant pour coordonnées celles des projections orthogonales des n éléments du nuage sur les k axes principaux. On parle de projection des variables de Rp sur R2 ou R3 .

Cette technique factorielle nous permettra surtout de pouvoir réduire les dimensions de notre problème (19 variables explicatives de départ), de sorte que nos modélisations logistique et neuronale ne se fassent que sur la base les variables les plus significatives de la défaillance des clients PME dans leur remboursement de crédit.

* 27 L'ACP a été introduite en 1901 par K. Pearson et développée par H. Hotelling en 1933.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Piètre disciple, qui ne surpasse pas son maitre !"   Léonard de Vinci