IV.5. Présentation
des données
L'ensemble de données exploitées pour
l'implémentation et interprétation de résultats de notre
modèle prédictif sont issues d'un environnement bancaire en se
basant sur la réalité existante au sein de la Banque Commerciale
Du Congo, sur la politique de gestion des clients précisément
ceux qui souscrivent au crédit (un emprunt, ...). Eu égard
à la réalité, nous avons donc constitué un ensemble
de données servant à la simulation du dit modèle.
Reste à signaler que cet ensemble de données
à simuler contiennent des enregistrements décrivant chacun les
comportements des clients provenant desdifférentes sources des
données. En fin dans cet ensemble de données, nous avons retenus
quelques variables descriptives que nous synthétisons dans le tableau
ci-dessous :
N°
|
NOM VARIABLE
|
DESCRIPTION VARIABLE
|
TYPE
|
CHOIX
|
1
|
CUSTOMER_ID
|
Identifiant du client
|
Numérique
|
-
|
2
|
OLDNESS
|
Ancienneté client
|
Numérique
|
-
|
3
|
AVG_TRANSACT_MONTH
|
Transaction moyenne par mois du client
|
Numérique
|
-
|
4
|
AVG_TRANSACT_YEAR
|
Transaction moyenne par AN du client
|
Numérique
|
-
|
5
|
BALANCE_USD
|
Solde actuel du client en USD
|
Money
|
-
|
6
|
BALANCE_CDF
|
Solde actuel du client en CDF
|
Money
|
-
|
7
|
GENDER
|
Genre du client
|
Boolean
|
Homme or Femme
|
8
|
AGE
|
Age du client
|
Numérique
|
-
|
9
|
TYPE_COUNT
|
Type du compte client
|
Text
|
-
|
10
|
JOB
|
Profession du client
|
Text
|
-
|
11
|
OLDNESS_JOB
|
Ancienneté dans la profession
|
Numérique
|
-
|
12
|
ESTIMATED_SALARY_USD
|
Estimation Salaire en USD
|
Money
|
-
|
13
|
CLAIMS
|
Plaintes
|
Text
|
-
|
14
|
STATUT_CHURN
|
Statut churn du client
|
Text
|
|
Tableau 4.4: Dictionnaire des
variables descriptives utilisées.
IV.5.1. Présentation des
données existantes d'analyse
Étant donné que l'algorithme doit prédire
sur base des données existantes, nous présentons quelques
graphiques qui expriment les comportements des clients dans les
différents cas c'est-à-dire les clients non actifs (churner) et
les clients actifs (non churner). Autrement dit, nous présentons le deux
classes (Churner et Non Churner) d'appartenance à laquelle seront
classifier les nouveaux clients. Pour le statut d'un churner nous
utiliserons1 « Oui »,
quant au statut du Non churner nous utiliserons tout simplement
0« Non ».
a) Présentation du statut churn selon les types
de compte
Ci-dessous nous représentons en histogramme rouge, les
clients qui ont churner ou perdus par rapport au compte ouvert au sein de la
BCDC et en vert, les clients non churner (clients actifs)
Figure 4.39: Statut churn selon
les types de compte.
b) Présentation du statut churn selon le
sexe
Nous représentons dans le graphique ci-dessous en
histogramme rouge, les clients churner et non churner selon le sexe, du coup le
statut churn peut etre interprété par rapport aux couleurs :
rouge pour les clients perdus et vert pour les clients actifs.
Figure 4.40: Statut churn selon
le sexe.
c) Présentation du statut churn selon
l'âge
Selon l'âge des clients, les clients actifs sont
représentés en histogramme vert et en histogramme rouge les
clients perdus.
Figure 4.41:Statut churn selon
l'âge des clients.
d) Présentation du statut churn selon
l'ancienneté
Selon l'ancienneté, les clients actifs sont
représentés en histogramme vert et en histogramme rouge les
clients perdus. Il sied de signaler que le graphique ci-dessous est
réparti sur une période allant de 1 - 5 ans.
Figure 4.42: Statut churn selon
l'ancienneté des clients dans l'institution.
e) Présentation du statut churn selon les
réclamations ou plaintes
Plusieurs clients affichent un statut de churn d'où le
churner. Par rapport aux plaintes nos résolues, la BCDC court un risque
de perte de ses clients d'autant plus que la boite à suggestion ainsi
que celle de réclamations ne sont pas régulièrement mise
à jours. Ci-dessous voici le graphique reprenant en histogramme rouge
les clients perdus quant à ce.
Figure 4.43: Statut churn selon
les réclamations des clients.
f) Présentation du statut churn selon la
profession
Selon la profession, l'institution peut également
perdre ses clients, la BCDC n'est pas exclue. Ci-dessous voici le graphique
reprenant les clients perdus en histogramme rouge, en histogramme vert, les
clients fidélisés malgré leurs professions.
Figure 4.44: Statut churn selon
la profession des clients.
g) Extrait de données d'apprentissage
Ci-dessous nous présentons l'extrait des données
que nous allons s'en servir pour notre système prédictif.
Figure 4.45: Extrait de
données d'apprentissage depuis MongoDB. Vue n°1 [Client Navicat
Premium-MongoDB].
Figure 4.46: Extrait de
données d'apprentissage depuis MongoDB. Vue n°2 [Client Navicat
Premium-MongoDB].
Figure 4.47: Visualisation des
données d'apprentissage.[RStudio]
|