Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones( Télécharger le fichier original )par Fred NTOUTOUME OBIANG-NDONG Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006 |
1.2. Les principales techniques de crédit scoringLes techniques ou méthodologies utilisées dans la littérature pour mettre en place des modèles de scoring sont assez nombreuses, à cause des systèmes de crédit scoring qui sont eux-mêmes inspirés par de multiples besoins. Selon A. Saunders & L. Allen (2002)6(*) les systèmes de crédit scoring peuvent être retrouvés dans plusieurs types d'analyse de crédit, depuis le crédit de consommation jusqu'aux prêts commerciaux. L'idée centrale en effet ne varie point, puisqu'il s'agit d'identifier dans un premier temps les facteurs qui déterminent la probabilité de défaut, et dans un second temps de pondérer leurs « poids » dans un score quantitatif. Ces systèmes sont mis en place, selon la même source, à partir de quatre principales formes de modélisation multivariée : · le scoring par le modèle linéaire · le scoring par le modèle logit · le scoring par le modèle probit · le scoring par le modèle d'analyse discriminante M. Schreiner (2002)7(*) utilise principalement, dans une étude récente sur les IMF, des techniques de classement et de prédiction par « arbre de décision ». Ces techniques permettent de détecter des critères à même de répartir les individus d'une population en n classes (souvent n=2) prédéfinies. M. Schreiner distingue de ce fait : · le scoring de l'arbre à 4 branches, qui corrèle le taux de remboursement et le croisement de deux facteurs d'analyse : le sexe de l'emprunteur et le fait que le prêt soit un premier prêt ou un renouvellement ; · le scoring de l'arbre à 19 branches, qui prend en considération un beaucoup plus grand nombre de caractéristiques de la candidature du client de l'IMF ( le type de prêt ou le sexe du client, mais aussi l'âge du client, les éventuels retards antérieurs, le type de garanties ou même le nombre de lignes téléphoniques ). Aux techniques présentées ci-dessus, S. Tuffery (2007)8(*) ajoute, en considérant les techniques de classement et de prédiction dans leur ensemble comme potentiel outil de scoring : · le scoring par réseaux de neurones · le scoring par »support vector machine » (SVM) · le scoring par algorithmes génétiques · le scoring par système d'experts Une analyse approfondie de ces approches est disponible dans Caouette, Altman & Narayanan (1998), Sanders (1997), ainsi que dans S. Tuffery (2007). Toutefois, nous accorderons une attention particulière à trois modèles cités supra : le modèle logit, les réseaux de neurones, et l'analyse discriminante. Les deux premiers nous intéresseront plus bas car faisant l'objet du présent mémoire, tandis que le modèle d'analyse discriminante, le plus utilisé dans la littérature, mérite d'être exploré à travers ses principales applications en score. L'analyse discriminante multivariée (ADM) est une technique statistique qui permet de classer des observations dans des sous-groupes homogènes fixés à priori. L'ADM consiste à réduire la dimension du plan dans lequel on travaille en faisant une projection d'un point représenté dans un espace de dimension N, dans un plan de dimension 1 par exemple. Elle traite les variables explicatives qualitatives binaires: pauvre/riche, bon client/mauvais client. La plupart des modèles de crédit-score ont été mis au point à partir de l'ADM. (cf tableau) : Tableau 2 : Comparatif des principaux modèles de Scoring
Source : Recherche de Fred Ntoutoume, Crefdes, 2007 S'il fallait ainsi faire la revue des principaux scores qui ont vu le jour depuis une quarantaine d'années, nous commencerons par évoquer le « Z-score » d'Altman mis au point en 1967. Sur un échantillon de 66 entreprises, 33 ayant connu la faillite et 33 ayant survécu, Altman utilise l'analyse discriminante multivariée comme technique statistique. La fonction discriminante de Altman transforme grâce à l'ADM la valeur des variables individuelles (qui sont les ratios) en un score discriminant appelé "Z-score" qui permettra de classer un client dans le groupe faillite, ou non faillite. Sa fonction discriminante finale est: · Z score = 1,2xX1 + 1,4xX2 + 3,3xX3 + 0,6xX4 + 0,9xX5 Les coefficients du score étant déterminés, il ne reste plus qu'à remplacer les variables (X1, X2, X3, X4 et X5...) par leur valeur pour chaque entreprise à évaluer. Plus le score Z est faible, plus le risque de défaut augmente. D'après l'étude de base de Altman, si >Z2,99 le client ne risque pas de faire défaut et si Z=1, 81 le client risque de faire défaut. Après Altman, le score de CONAN et HOLDER (1979) est venu dix ans plus tard enrichir les modèles de scoring développés auparavant. Comme le « z score » le score calculé par Conan et Holder est une régression par analyse discriminante. Par référence au bilan financier, les deux chercheurs ont étudié les valeurs de 31 ratios applicables à 190 PME et ont obtenu la fonction-score suivante : · Z = 0,24 R1 + 0,22 R2 + 0,16 R3 - 0,87 R4 - 0,10 R5 Plus la valeur du score Z est élevée, plus le risque de défaillance est faible. Le score sectoriel AFDCC10(*) (2008) est un autre outil d'aide à la décision, qui probabilise le risque de défaillance d'une entreprise à partir de données comptables issues des liasses fiscales. Il débouche sur une note comprise entre 1 et 20. AFDCC 2008 accorde une place plus importante aux liquidités et aux cash flows que les précédent scores élaborés en 1997 et 1999. Le score de la Banque de France (BDFI 1995) est aussi une méthodologie célèbre de prévision des risques de défaillances par l'analyse et la prévision statistique. Les scores opérationnels (utilisables par les banques et les entreprises) de première génération ont été mis au point par la Banque de France en 1982. Le score BDFI 1995, s'intéresse plus particulièrement à l'endettement financier (importance, structure et coût de l'endettement). La formule de ce score se présente comme suit : · 100Z = - 1,255 X1 + 2,003 X2 - 0,824 X3 + 5,221 X4 - 0,689 X5 - 1,164 X6 + 0,706 X7 + 1,408 X8 - 85,544 Après tout ce qui précède, on ne recense que de très rares études de scores totalement conçus pour l'Afrique. L'un des tout premiers est dû à Viganô (1993) qui a construit un modèle de crédit scoring pour la Caisse Nationale du Crédit Agricole (CNCA), au Burkina Faso. Une étude plus récente a toutefois été effectuée par Diallo (2006)11(*), pour le compte d'une Mutuelle malienne, et a abouti à la construction d'un score via l'analyse discriminante et la régression logistique. Ce pendant toutes ces études se sont faites sur la base d'hypothèses sur les déterminants du non remboursement. Or les entreprises africaines, à n'en point douter, ont des facteurs de risques sensiblement différents de ceux de leurs consoeurs occidentales. Par exemple, les pesanteurs culturelles, les données socio-économiques, les charges familiales sont des éléments qui peuvent influer de façon significative dans l'érosion des capacités de remboursement pour les dirigeants d'une PME. Malheureusement, ces facteurs "qualitatifs" sont dans la plupart des cas mis en rade dans les scores jusqu'à présent conçus. Le score que nous proposons s'inscrit dans cette rupture. 1.3. L'utilisation des scores de risque La littérature de ces dernières années s'accorde à dire qu'il existe en général 5 types de scores (S. Tuffery, 2007, pp. 401-402) : · Le score d'appétence peut être définit comme la probabilité pour un client d'être intéressé par un produit ou un service donné. · Le score de risque est la probabilité d'un client avec un compte courant, une carte bancaire, une autorisation de découvert ou un crédit, de rencontrer un incident de paiement ou de remboursement. · Le score d'octroi (ou score d'acceptation) est un score de risque calculé pour un client qui est nouveau ou qui à une faible activité avec la banque. Notons qu'on peut aussi calculer un score d'octroi pour un client déjà connu, si l'on veut intégrer au calcul des éléments propres à la demande. · Le score de recouvrement évalue le montant susceptible d'être récupéré sur un compte ou un crédit au contentieux, et peux suggérer les actions de recouvrement les plus efficaces, en évitant des actions disproportionnées pour des clients fidèles, rentables et sans véritable risque. · Le score d'attrition est la probabilité pour un client de quitter la banque. L'utilisation du score de risque, celui qui nous intéresse particulièrement, dans le domaine du crédit, permet d'améliorer : (i) la productivité des analyses de demande de crédit, en traitant assez rapidement les dossiers ; (ii) les possibilités de délégation en impliquant les jeunes analystes crédit ; (iii) le sentiment de sécurité des analystes crédit et des gestionnaires ; (iv) la satisfaction des clients qui voient leur demande traiter avec le maximum de diligence ; (v) l'homogénéité des décisions issues des différentes agences ; (vi) l'homogénéité des décisions issues d'un même analyste de crédit ou gestionnaire ; (vii) l'adaptation de la tarification du crédit au risque effectivement encouru, ou « pricing » ; (viii) une meilleure sécurité dans l'allocation des fonds propres, conformément aux préconisations du comité de Bâle dans la perspective du ratio Cooke, qui a fait place au ratio McDonough depuis le 1er Janvier 2008. Par ailleurs, dans le contexte d'une amélioration de l'accès au crédit des PME, l'utilisation du score de risque permet aussi à la banque de limiter son risque de surendettement grâce à une réduction des impayés, tout en conquérant une frange de clientèle légèrement risquée pour laquelle le score permet d'adapter précisément le montant et le coût (taux d'intérêt, frais de gestion) du crédit, voire des garanties demandées, en fonction du risque encouru. * 6 Antony Saunders & Linda Allen, « Credit Risk Measurement », John Wiley & Son (Ed), 2002, p. 21 * 7 Mark Schreiner « Scoring: the next breakthrough in microcredit ? », CGAP, juin 2002, 102 p. * 8 9 Stéphane Tufféry, « Data Mining et Statistique décisionnelle, l'intelligence des données », Editions Technip (2e Ed), 2007 * 10 L'Association Française des Crédits Managers (AFDCC) calcule elle-même ses propres scores depuis les années 1997. * 11 B. Diallo, « Un modèle de `crédit scoring' pour une institution de micro-finance africaine : le cas de Nyesegisio au Mali », Laboratoire d'Economie d'Orléans (LEO), Mai 2006. |
|