WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones

( Télécharger le fichier original )
par Fred NTOUTOUME OBIANG-NDONG
Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE IV : PRESENTATION & ANALYSE DES RESULTATS

« Le Credit Scoring n'approuve, ni ne rejette une demande de prêt,

il peut plutôt prédire la probabilité d'occurrence de mauvaise performance (défaut)

telle que définie par le préteur »

(Caire et Kossmann, 2003)

I/ Résultats de l'analyse factorielle des correspondances principales

Notre analyse va se baser sur nos données décrivant des individus (clients PME de l'UMECUDEFS) à l'aide de variables catégorielles (recodées en numériques) et quantitatives décrivant leurs données démographiques, leur expérience en matière de crédit, la forme et la nature de leur activité, les garanties proposées, les indicateurs temporels et le montant du crédit. Il y'a n=212 individus ou observations, et p=18 variables descriptives + une variable explicative (rem3mois), la variable nom_entr identifiant les 212 observations.

Tableau 6: Descriptif des variables initiales

Code

Nouveau

Code

Etiquette

Nombre de

modalités

nom_entr

Var1

Nom de l'entreprise (ou du dirigeant)

207

sexedir

Var2

Sexe du dirigeant de l'entreprise

2

statmat

Var3

Statut matrimonial du dirigeant de l'entreprise

4

age

Var4

Age du dirigeant de l'entreprise

11

nbenf

Var5

Nombre d'enfant du dirigeant de l'entreprise

2

persach

Var6

Nombre de personnes à charge dans le foyer du dirigeant d'entreprise

3

perssal

Var7

Nombre de personnes salariées dans le foyer du dirigeant d'entreprise

4

dom

Var8

Domicile du dirigeant d'entreprise

3

nivetude

Var9

Niveau d'étude du dirigeant de l'entr.

5

nivrev

Var10

Niveau de revenu du dirigeant de l'entr.

7

pretpass

Var11

Nombre de prêts déjà contractés par le dirigeant de l'entreprise dans le passé

6

Sectact

Var12

Secteur d'activité de l'entreprise

10

duréexis

Var13

Durée d'existence de l'entreprise

4

typgar

Var14

Type de garantie proposé par le demandeur de crédit

7

valgar

Var15

Valeur de la garantie proposée

8

durecoul

Var16

Durée écoulée entre demande de crédit et réponse de l'UMECUDEFS

4

montant

Var17

Montant du crédit octroyé

6

democt

Var18

Montant demandé = montant octroyé ?

2

difdemre

Var19

Différence entre nombre de versements demandés et obtenus

5

rem3mois

Var20

Le Client a-t-il remboursé intégralement son crédit au plus 3 mois après la dernière échéance prévue ?

2

Source : Recherche de Fred Ntoutoume, Crefdes, 2007

1.1. Dimensions de la solution et valeurs propres (inerties)

La représentation graphique que l'on souhaite obtenir de ces données en termes de catégories et d'objets, s'effectue dans un repère orthonormé dont on doit préciser le nombre d'axes a, appelé la dimension de la solution. La dimension maximum du sous-espace de représentation est égale au nombre de catégories (m=95) moins le nombre de variables sans valeurs manquantes (p=19). Cependant pour des raison pratiques, notre représentation s'appuiera sur une solution à sept dimensions pour synthétiser les traits essentiels le l'information recherchée.

Pour obtenir une analyse en composantes principales sous SPSS, nous créons par recodage, à partir du tableau des données alphanumériques, un tableau numérique comportant l'ensemble des variables à analyser. Pour ce faire, nous utilisons la procédure de recodage automatique <Recoder Automatiquement> du menu de transformation <Transformer>, créant ainsi la variable Var2 (codage numérique), à partir de sexedir (codage alphanumérique), jusqu'à la variable Var20 à partir de rem3mois, par transformation des catégories prises dans un ordre lexical croissant.

Après recodage automatique des données, nous sélectionnons à partir du menu <Analyse>, la procédure <Analyse Factorielle> du menu <Factorisation>, en choisissant les options correspondantes à la syntaxe suivante :

Tableau 7: Fichier de syntaxe de l'analyse factorielle sous SPSS

FACTOR

/VARIABLES sexedir statmat age nbenf persachg perssal dom nivetude nivrev

pretpass sectact duréexis typgar valgar durecoul montant democt difdemre

/MISSING LISTWISE /ANALYSIS sexedir statmat age nbenf persachg perssal dom

nivetude nivrev pretpass sectact duréexis typgar valgar durecoul montant

democt difdemre

/PRINT INITIAL EXTRACTION FSCORE

/FORMAT SORT

/PLOT EIGEN

/CRITERIA MINEIGEN(1) ITERATE(25)

/EXTRACTION PC

/ROTATION NOROTATE

/SAVE REG(ALL)

/METHOD=CORRELATION .

Source : Recherche de Fred Ntoutoume, Crefdes, 2007

Le tableau des Eigenvalues ci-dessous rend compte des valeurs propres (ou inerties) prises par chaque axe factoriel (ou composante), il rend compte aussi des taux d'inertie (% de la variance) et des taux d'inertie cumulés (% cumulés). En effet dans la solution initiale, nous avons autant de composantes que de variables explicatives (au nombre de 18), la colonne « Total » nous renseignant sur la contribution de la variance dans chaque variable observée et expliquée par chaque axe factoriel. Cette valeur est ensuite relativisée par rapport à l'inertie totale, puis cumulée.

En observant les inerties des 3 premiers axes, on constate que le premier représente 15,5% de l'inertie totale, le deuxième représente 10,6% de l'inertie totale et le troisième 9,4%. Leur cumul est de 35,6%, ce qui signifie qu'en s'appuyant sur une solution à 3 dimensions, nous résumerions 35,6% de l'information totale de départ. Ce qui est relativement insuffisant pour nous permettre de continuer. Nous retiendrons donc les sept premiers axes, dont l'inertie cumulée est de 61,7%.

Tableau 8: Variance expliquée totale (Eigenvalues)

Source : Recherche de Fred Ntoutoume (logiciel SPSS), Crefdes, 2007

Le choix que nous faisons de retenir les 7 premiers axes de l'analyse peut être conforté par le l'analyse du graphique suivant, où l'on constate qu'après le septième composant, la contribution reste marginale et décroissante.

Figure 6: Graphique des valeurs propres


Source : Recherche de Fred Ntoutoume (logiciel SPSS), Crefdes, 2007

1.2 Qualité de représentation (Factor Analisys Communalities)

La qualité de représentation indique la contribution de chaque variable expliquée. Les qualités de représentation initiales estiment la variance de chaque variable expliquée par l'ensemble des facteurs (composants).

Pour l'ACP la représentation initiale est toujours égale à 1 (analyse de corrélation) ou à la variance de la variable (analyse de covariance).

Les extractions étant estimées de la variance de chaque variable expliquée dans la solution factorielle, les plus petites valeurs représentent les variables qui ne s'ajustent pas assez à la solution factorielle, et qui peuvent par conséquent être supprimées de l'analyse.

Ainsi, on remarque que les 12 premières variances (inerties) les plus importantes sont, par ordre décroissant :

1-Nombre d'enfants..........................(0,803)

2-Nombre de personnes à charge ......... (0,775)

3-Sexe du dirigeant ......................... (0,697)

4-Secteur d'activité ..........................(0,662)

5-Montant du crédit octroyé ...............(0,654)

6-Durée entre demande et réponse ........(0,641)

7-Niveau de revenus du dirigeant ........(0,640)

8-Valeur estimée de la garantie ............(0,629)

9-Différence versements dem et obt.......(0,621)

10- Montant dem = montant octroyé ?.....(0,618)

11- Durée d'existence de l'entreprise .....(0,579)

12-Age du dirigeant de l'entreprise .......(0,569)

On en déduit que d'autres variables comme le type de garantie ou le statut matrimonial du dirigeant de l'entreprise n'expliquent pas assez la solution factorielle.

Tableau 9: Qualité de représentation des variables

Source : Recherche de Fred Ntoutoume (logiciel SPSS),

Crefdes, 2007

Notre interprétation des inerties peut être conforté à la lumière de l'analyse la matrice des composantes, qui renseigne sur la contribution de chaque variable à l'explication de chacun des 7 axes factoriels retenus.

Nous remarquons en effet, sur la ligne de la variable « Nombre d'enfants », que les inerties sont assez fortes pour chaque axe factoriel concerné. De même pour la variable « Nombre de personnes à charges », qui a d'assez bonnes contributions sur tous les sept axes. Par contre, la variable « Type de garantie présentée », qui semble pourtant bien expliquer l'axe 1, n'est pas assez explicative sur les 6 autres composantes.

Source : Recherche de Fred Ntoutoume (logiciel SPSS), Crefdes, 2007

Tableau 10: Matrice des composantes

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Ceux qui rêvent de jour ont conscience de bien des choses qui échappent à ceux qui rêvent de nuit"   Edgar Allan Poe