WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones

( Télécharger le fichier original )
par Fred NTOUTOUME OBIANG-NDONG
Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

2.2.1) La technique et l'interprétation

La technique d'analyse des données par correspondances multiples que nous avons utilisé dans le présent mémoire respecte les étapes suivantes :

1ère étape : les données sont codées

· Les données quantitatives sont découpées en classes

· Les données qualitatives sont codées. Pour éviter des effectifs de classe trop faibles, on les regroupe des modalités.

· Dans cette étape, les logiciels demandent souvent de nommer les différentes modalités.

2ème étape : le tableau codé est transformé en tableau de contingence

· Cette étape est souvent effectuée par les logiciels sans intervention

de l'utilisateur.

3ème étape : une analyse des correspondances est effectuée sur le tableau de contingence

· Réduction et quantification des données

· Choix du nombre d'axes pertinents

· Sauvegarde des coordonnées factorielles et poids des individus

· Représentations graphiques : cartes factorielles et diagrammes interactifs

.

D'un point de vue mathématique, le traitement opéré sur les données du tableau de contingence lors d'une AFC nous a permis d'obtenir :

- des axes factoriels associés à des valeurs propres ;

- pour chaque ligne (ou colonne) du tableau de contingence, des coordonnées, des contributions à la formation des axes et des qualités de représentation.

Le tableau de Burt étant symétrique, les profils lignes et les profils colonnes sont identiques. Il en est de même des coordonnées des individus-lignes et des individus-colonnes. L'inertie totale du nuage des modalités a été déterminée uniquement par le nombre total de modalités q et le nombre de variables p. L'interprétation s'est faite essentiellement à partir des modalités qui ont les meilleures qualités de représentation selon chacun des septs axes factoriels ou dans le premier plan factoriel. Enfin, l'inertie relative par rapport à chaque axe nous a permi de retenir les modalités qui ont le plus fortement contribué à la formation de cet axe.

2.3. Le protocole de prédiction par les réseaux de neurone

Pour effectuer notre expérimentation par réseaux neuronaux, nous nous proposons de préciser le type et l'architecture du réseau, les paramètres caractéristiques et la base d'apprentissage utilisée.

2.3.1) Le réseau utilisé: Perceptron multicouches (PMC)

Compte tenu de la complexité des relations pouvant exister entre les données, et de la dispersion statistique importante des ratios aussi bien pour les entreprises défaillantes que pour les entreprises non défaillantes (Malécot, 1997), le réseau que nous avons utilisé est un réseau supervisé à rétropropagation à deux couches. La première couche est composée de 18 neurones. Le nombre de neurones de la deuxième couche est égal à 2, il est contraint par les valeurs cibles utilisées : « mauvais payeur » ou « bon payeur »

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld