IV.5 Etude de cas et interfaces
de l'application
IV.5.1. Etude de cas
Le cas que nous présenterons concerne
l'analyse de la base de données commerciales. Les tableaux qui suivent
montrent une partie de la structure de la base de données de la Bralima.
Le tableau suivant constitue une partie de la base de données à
la quelle nous travaillons.
Age
|
Revenu
|
Montant
|
Sexe
|
Codeclient
|
25
|
36000
|
50400
|
1
|
1
|
29
|
42000
|
14500
|
0
|
10
|
25
|
35000
|
14500
|
1
|
11
|
28
|
45000
|
5400
|
1
|
12
|
25
|
48000
|
4500
|
1
|
13
|
21
|
65000
|
59500
|
0
|
14
|
29
|
485000
|
29500
|
0
|
15
|
39
|
24000
|
14500
|
1
|
16
|
38
|
68500
|
14500
|
0
|
17
|
30
|
100000
|
54000
|
1
|
18
|
21
|
35000
|
45000
|
0
|
19
|
28
|
45000
|
26000
|
1
|
2
|
28
|
480000
|
45200
|
1
|
20
|
25
|
145000
|
85000
|
1
|
21
|
28
|
145000
|
45000
|
1
|
22
|
30
|
254000
|
45000
|
1
|
23
|
20
|
65800
|
45000
|
0
|
24
|
36
|
24500
|
15000
|
1
|
25
|
35
|
256000
|
299000
|
0
|
26
|
34
|
482000
|
145000
|
1
|
27
|
34
|
685000
|
14500
|
0
|
28
|
21
|
354000
|
145000
|
1
|
29
|
30
|
254000
|
49400
|
0
|
3
|
29
|
452000
|
145000
|
0
|
30
|
25
|
485000
|
45000
|
1
|
31
|
28
|
365000
|
785000
|
0
|
32
|
25
|
65000
|
45000
|
0
|
33
|
21
|
45000
|
75000
|
0
|
34
|
29
|
685000
|
45000
|
1
|
35
|
39
|
45000
|
85000
|
1
|
36
|
38
|
758000
|
75000
|
0
|
37
|
30
|
85000
|
15000
|
1
|
38
|
21
|
485000
|
78500
|
1
|
39
|
20
|
45000
|
25600
|
1
|
4
|
28
|
685000
|
8500
|
1
|
40
|
26
|
45000
|
54000
|
1
|
41
|
36
|
24000
|
25400
|
0
|
5
|
35
|
152000
|
25600
|
1
|
6
|
34
|
254000
|
15200
|
1
|
7
|
34
|
45000
|
14500
|
1
|
8
|
21
|
95000
|
14500
|
0
|
9
|
Le montant correspond au cumul des achats effectués par un
client pendant une période.
IV.5.1.1 Représentation des clients
Les clients sont représentés par des vecteurs de
, où n et le nombre de variables (dimensions) ou les
caractéristiques retenues pour décrire les clients dans notre
module. On associe à chaque client, un vecteur. Nous
considérons que chaque individu est muni d'un poids pi
avec pi > 0 et =1.
Sélection des variables
La première étape consiste à
sélectionner les variables à considérées pour
décrire les clients. Nous retenons l'âge du client, le sexe, le
montant acheté, Revenu et le niveau d'instruction
Nuage d'individus ou des clients
Dans l'espace des individus, l'ensemble N
= est appelé nuages des clients.
Centre de gravité
Le centre de gravité g d'un
nuage N ou encore le « Barycentre »
des points Xi (ou Xi et le
ième client du nuage N)
affectés aux poids pi est
donné par la formule suivante :
G= qui peut être écrit à la manière
suivante :
G= =
D'autres quantités telles qu'inertie totale, inertie
inter classe et inertie intra classe sont définies dans le chapitre
II.
Remarque :
Ø Dans notre travail, nous avons considérer le
point associé à chaque client égale à un.
Ø Seules les variables quantitatives seront
traitées dans notre algorithme parmi les variables
sélectionnées.
Ø Pour la mise en oeuvre de notre algorithme nous avons
utilisé la distance euclidienne qui est donnée par la formule
suivante :
D(x,y)= avec X et Y deux vecteurs de
Principe général :
L'algorithme consiste à grouper les clients selon un
critère bien déterminé par exemple : par catégorie
d'achats (i.e. le vecteur x représentant la quantité
achetée de chaque produit). L'entrée de l'algorithme est le
nombre k de groupes (représentant les catégories de clients). Une
fois le nombre de groupes saisi, l'algorithme choisit arbitrairement k clients
comme centres « initiaux » des k groupes. L'étape suivante
consiste à calculer la distance entre chaque individu (client) et les k
centres ; la plus petite distance est retenue pour inclure cet individu dans le
groupe ayant le centre de gravité le plus proche. Une fois tous les
clients groupés, on aura k sous-nuages disjoints du nuage total. Pour
chaque groupe (sous-nuage), l'algorithme calcule le nouveau centre de
gravité.
L'algorithme s'arrête lorsque les groupes construits
deviennent stables. Dans notre cas, notre algorithme va s'arrêter
lorsque l'inertie intra classe dévient inférieure à notre
seuil fixé à 0.05
IV.5.1.2 Résultats de la segmentation
Premier groupe
Age
|
Revenu
|
Montant
|
sexe
|
codeclient
|
classe
|
25
|
36000
|
50400
|
1
|
1
|
1
|
21
|
65000
|
59500
|
0
|
14
|
1
|
30
|
100000
|
54000
|
1
|
18
|
1
|
21
|
35000
|
45000
|
0
|
19
|
1
|
25
|
145000
|
85000
|
1
|
21
|
1
|
20
|
65800
|
45000
|
0
|
24
|
1
|
35
|
256000
|
299000
|
0
|
26
|
1
|
34
|
482000
|
145000
|
1
|
27
|
1
|
21
|
354000
|
145000
|
1
|
29
|
1
|
29
|
452000
|
145000
|
0
|
30
|
1
|
28
|
365000
|
785000
|
0
|
32
|
1
|
25
|
65000
|
45000
|
0
|
33
|
1
|
21
|
45000
|
75000
|
0
|
34
|
1
|
39
|
45000
|
85000
|
1
|
36
|
1
|
26
|
45000
|
54000
|
1
|
41
|
1
|
Deuxième groupe
Age
|
revenu
|
montant
|
sexe
|
Code client
|
classe
|
29
|
42000
|
14500
|
0
|
10
|
2
|
28
|
45000
|
5400
|
1
|
12
|
2
|
25
|
48000
|
4500
|
1
|
13
|
2
|
29
|
485000
|
29500
|
0
|
15
|
2
|
38
|
68500
|
14500
|
0
|
17
|
2
|
28
|
45000
|
26000
|
1
|
2
|
2
|
28
|
480000
|
45200
|
1
|
20
|
2
|
28
|
145000
|
45000
|
1
|
22
|
2
|
30
|
254000
|
45000
|
1
|
23
|
2
|
34
|
685000
|
14500
|
0
|
28
|
2
|
30
|
254000
|
49400
|
0
|
3
|
2
|
25
|
485000
|
45000
|
1
|
31
|
2
|
29
|
685000
|
45000
|
1
|
35
|
2
|
38
|
758000
|
75000
|
0
|
37
|
2
|
30
|
85000
|
15000
|
1
|
38
|
2
|
21
|
485000
|
78500
|
1
|
39
|
2
|
20
|
45000
|
25600
|
1
|
4
|
2
|
28
|
685000
|
8500
|
1
|
40
|
2
|
35
|
152000
|
25600
|
1
|
6
|
2
|
34
|
254000
|
15200
|
1
|
7
|
2
|
34
|
45000
|
14500
|
1
|
8
|
2
|
21
|
95000
|
14500
|
0
|
9
|
2
|
Troisième groupe
Age
|
Revenu
|
Montant
|
sexe
|
Code client
|
classe
|
25
|
35000
|
14500
|
1
|
11
|
3
|
39
|
24000
|
72500
|
1
|
16
|
3
|
36
|
24500
|
75000
|
1
|
25
|
3
|
36
|
24000
|
127000
|
0
|
5
|
3
|
IV.5.1.3 Analyse des résultats
Après la segmenta le problème reviendra à
étiqueter les classes obtenues c'est-à-dire donner la
signification de chaque groupe de clients. Nous constatons que les clients sont
beaucoup plus influencés par le montant de leur achat et le revenu. En
marketing, un marché est le produit que l'entreprise a mis sur le
marché des biens, nous donnerons une interprétation de ces
classes par rapport au mouvement d'achat effectué par chaque client
vis-à-vis d'un produit.
Produit
|
Classe
|
Description classe
|
Catégorie
|
COCA
|
|
|
|
|
2
|
Cette classe contient des grands Consommateurs de ce produit,
le Marketing ne serait pas opportun
|
Grand
|
|
1
|
Cette Classe contient des consommateurs Moyens du produit, Le
marketing Pourrait aider à accroitre la Rentabilité
|
Moyen
|
|
3
|
Cette Classe contient des faibles consommateurs du produit, Le
marketing Pourrait aider à augmenter leur achat
|
Faible
|
PRIMUS
|
|
|
|
|
1
|
Cette classe contient des grands Consommateurs de ce produit, le
Marketing ne serait pas opportun
|
Grand
|
|
2
|
Cette Classe contient des consommateurs Moyens du produit, Le
marketing Pourrait aider à accroitre la Rentabilité
|
Moyen
|
|
3
|
Cette Classe contient des faibles consommateurs du produit, Le
marketing Pourrait aider à augmenter leur achat
|
Faible
|
TURBO
|
|
|
|
|
1
|
Cette classe contient des grands Consommateurs de ce produit, le
Marketing ne serait pas opportun
|
Grand
|
|
3
|
Cette Classe contient des consommateurs Moyens du produit, Le
marketing Pourrait aider à accroitre la Rentabilité
|
Moyen
|
|
2
|
Cette Classe contient des faibles consommateurs du produit, Le
marketing Pourrait aider à augmenter leur achat
|
Faible
|
Ce tableau regroupe les clients à contacter pour un
marketing ciblé des différents produits.
Produit
|
Code Client
|
Nom du client
|
Avenue
|
Numéro de Contact
|
COCA
|
|
|
|
|
|
11
|
xxxxxx
|
xxxx
|
09985252260
|
|
16
|
xxxxxx
|
xxxxxx
|
0898754521
|
|
25
|
xxxxx
|
xxxxxx
|
09986858752
|
|
5
|
xxxxx
|
xxxxxxxx
|
|
PRIMUS
|
|
|
|
|
|
11
|
xxxxxx
|
xxxx
|
09985252260
|
|
16
|
xxxxxx
|
xxxxxx
|
0898754521
|
|
25
|
xxxxx
|
xxxxxx
|
09986858752
|
|
5
|
xxxxx
|
xxxxxxxx
|
|
TURBO
|
|
|
|
|
|
10
|
xxxxx
|
xxxx
|
0895685120
|
|
12
|
xxxxx
|
xxxxxx
|
0999850254
|
|
13
|
xxxxx
|
x
|
0816535261
|
|
15
|
xxxxxx
|
xxxxxx
|
09966585210
|
|
17
|
xxxxxx
|
xxxxx
|
089542410
|
|
2
|
xxxx
|
xxxxxx
|
0898775654
|
|
20
|
x
|
xxxxxx
|
08965853520
|
|
22
|
xxxxxx
|
xxxxxx
|
0998564251
|
|
23
|
xxxxxx
|
xxxxxx
|
0898754621
|
|
28
|
xxxx
|
xxxxxx
|
0996536325
|
|
3
|
xxxx
|
xxxxxx
|
0998452321
|
|
31
|
xxxxx
|
xxxxxx
|
0897865852
|
|
35
|
xxxx
|
xxxxxx
|
0898658251
|
|
37
|
xxxxxx
|
xxxxxx
|
089582560
|
|
38
|
xxxxxxx
|
xxxxxxx
|
08956253520
|
|
39
|
xxxxxxx
|
xxxxxx
|
0897565412
|
|
4
|
xxxxxxx
|
xxxxxx
|
0856421442
|
|
40
|
xxxxxxxx
|
xxxxx
|
0898542543
|
|
6
|
xxxxxx
|
xxxxxx
|
|
|
7
|
xxxxx
|
xxxxxx
|
|
|
8
|
xxxx
|
xxxxxxx
|
|
|
9
|
xxxxx
|
xxxxx
|
|
Le tableau suivant donne la part de chaque groupe de clients
à la clientèle de l'entreprise
Classe
|
Nombre de Clients
|
Part du Marche en %
|
Total de clients
|
1
|
15
|
31.914893617021278
|
47
|
2
|
22
|
46.808510638297875
|
47
|
3
|
4
|
8.51063829787234
|
47
|
IV.5.1.4. Affectation
Cette tâche consiste à prédire le groupe d'un
nouveau client qui se présente à l'entreprise, la classe est
prédite après que le client ait effectué son premier
achat.
Ce tableau montre les valeurs d'attributs de ce client
code client
|
age
|
revenu
|
montant
|
sexe
|
100
|
45
|
450000
|
2800
|
1
|
Résultat du classifieur Bayésien
Code client
|
P(C1/X)
|
P(C2/X)
|
P(C3/X)
|
Décision ou Classe
|
100
|
0.3967275958099037
|
0.32315485060502985
|
0.2801175535850664
|
1
|
L'individu est affecté dans la classe ou la
probabilité est maximale. Dans ce cas, le client est affecté dans
la classe 1. Le tableau suivant donne la liste des produits à l'offrir
accompagné d'un service de marketing.
PRODUIT
|
COCA
|
PRIMUS
|
TURBO
|
Le logiciel propose d'autres analyses sur le client et sur les
produits fabriqués par l'entreprise.
IV.5.1.5 Analyse des Résultats avec
SPAD
IV.5.1.5.1 Résultats de la segmentation
Hiérarchique de la base de données
Liste des trois meilleure(s) partition(s) entre 3 et 10
classes
Ø partition en 4 classes
Ø partition en 6 classes
Ø partition en 7 classes
Première Coupure de l'arbre en 4
classes
FORMATION DES CLASSES (INDIVIDUS ACTIFS)
| CLASSE
|
EFFECTIF
|
POIDS
|
CONTENU
|
Classe 1
|
7
|
548194
|
1 à 7
|
Classe 2
|
14
|
********
|
8 à 21
|
Classe 3
|
14
|
996316
|
22 à 35
|
Classe 4
|
5
|
325652
|
36 à 40
|
PROGRESSION DE L'INERTIE INTER-CLASSES
ITERATION
|
I.TOTALE
|
| I.INTER
|
QUOTIENT
|
0
|
0.13612
|
0.12706
|
0.93337
|
1
|
0.13612
|
0.12738
|
0.93581
|
2
|
0.13612
|
0.12783
|
0.93912
|
3
|
0.13612
|
0.12815
|
0.94144
|
4
|
0.13612
|
0.12815
|
0.94144
|
5
|
0.13612
|
0.12815
|
0.94144
|
La consolidation de la partition Autour des 4
centres de classes est réalisée par 10 itérations a
centres mobiles.
IV.5.1.5.2 Nuage des points
Interprétation : Les nuages
projetés sur les deux premiers axes montrent un certain regroupement des
individus autour des variables Montant et Revenu, donc ce sont ces deux
variables qui influencent les individus.
IV.5.1.6 Comparaison des résultats
La méthode utilisée par SPAD pour segmenter ces
clients nous donne beaucoup de classes par rapport à chaque coupure que
nous pouvons effectuer de l'arbre, le plus petit nombre de classes est quatre,
mais l'interprétation que nous avons fait des ces classes donne lieu
à un regroupement autour des trois classes, Le critère
utilisé est pour la convergence de cet algorithme pour consolider les
classes est celui de la fixation de nombre d'itérations.
Par contre, notre logiciel à trois groupes d'individus et
le critère de convergence utilisé est celui de la minimisation de
l'inertie intra classe qui explique l'homogénéité entre
les individus d'une même classe, c'est-à-dire la distance qui
sépare chaque individu à son centre de gravité
|