Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones( Télécharger le fichier original )par Fred NTOUTOUME OBIANG-NDONG Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006 |
DEUXIEME PARTIEMETHODOLOGIE&ANALYSE DES RESULTATSCHAPITRE III : MethodologieI/ Les préalables au Scoring: Collecte et préparation des donnéesAvant de présenter les résultats de notre étude, il est nécessaire de préciser les caractéristiques liées à l'échantillonnage utilisé, à la préparation des données recueillies, et au protocole de recherche qui sera mis en oeuvre. 1.1. L'échantillonMalgré les difficultés rencontrées (liées au format des données contenues dans des fiches géographiquement éparpillées à travers les mutuelles du réseau UMECU), nous avons pu renseigner les 20 variables pour 212 entreprises toutes des TPE pour les années 2005, 2006 et 2007. L'échantillon a été sélectionné par la méthode de l'échantillonnage systématique. Tableau 5 : Les 212 entreprises de l'échantillon
Source : Recherche de Fred Ntoutoume, Crefdes, 2007 1.2. Les paramètres analysésL'originalité de notre étude, pour mémoire, est basé sur l'hypothèse selon laquelle dans le contexte africain où les TPE souvent dans l'informelle, présentent la particularité de ne pas disposer de données comptables sur lesquelles se baser pour une quelconque analyse, la prévision des risques de contrepartie pourrait se faire à partir de paramètres qualitatifs. Il s'agit notamment de critères sociaux sur le dirigeant de l'entreprise, couplé aux conditions d'octroi du crédit. Ainsi, les paramètres utilisés, dont les variables constitutives sont présentées plus haut dans le cadre opératoire, sont : Tableau 6: Les paramètres étudiés
Source : Recherche de Fred Ntoutoume, Crefdes, 2007 1.3. Le traitement des donnéesAprès obtention des questionnaires dûment remplis par les agents de crédit de l'UMECUDEFS, les données ont été recueillies sur le logiciel SPSS version 10.0. La stratégie de traitement des données a consisté, dans un premier temps, à une analyse fréquentielle des modalités prises pour chaque variable, afin de déceler des variables non significatives. En effet, comme le recommande Saporta (2006)26(*) «le fichier brut une fois constitué doit d'abord être «nettoyé» pour éliminer erreurs et incohérences. Il comporte alors en général un trop grand nombre de variables». Lors de cet examen dans notre cas, certaines variables retenues au départ ont été supprimées, car les réponses ne présentaient aucun intérêt dans la suite de note étude. C'est le cas pour la question liée à la présentation ou non d'une garantie, dont la réponse est « OUI » pour tous les individus. Il en a été ainsi pour 9 variables, qui ont été supprimées de notre base de données. L'étude s'est donc poursuivie avec 20 variables. Dans un second temps, pour faciliter les étapes d'analyse factorielle et de modélisation/classification/prédiction, les données catégorielles ont fait l'objet d'une codification. L'idée est d'obtenir un tableau de contingence, utile à une analyse factorielle sensée réduire encore plus la dimension des variables. * 26 SAPORTA, Gilbet, « La notation statistique des emprunteurs ou `scoring' », Conservatoire National des Art et Métier, article paru en 2006. (edusol.education.fr) |
|