WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Une contribution du datamining àƒÂ la segmentation du marché et au ciblage des offres àƒÂ  l'aide de la statistique de Bayes

( Télécharger le fichier original )
par samuel Kalombo
UNiversité de Kinshasa - Licence 2011
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

IV.5 Etude de cas et interfaces de l'application

IV.5.1. Etude de cas

Le cas que nous présenterons concerne l'analyse de la base de données commerciales. Les tableaux qui suivent montrent une partie de la structure de la base de données de la Bralima. Le tableau suivant constitue une partie de la base de données à la quelle nous travaillons.

Age

Revenu

Montant

Sexe

Codeclient

25

36000

50400

1

1

29

42000

14500

0

10

25

35000

14500

1

11

28

45000

5400

1

12

25

48000

4500

1

13

21

65000

59500

0

14

29

485000

29500

0

15

39

24000

14500

1

16

38

68500

14500

0

17

30

100000

54000

1

18

21

35000

45000

0

19

28

45000

26000

1

2

28

480000

45200

1

20

25

145000

85000

1

21

28

145000

45000

1

22

30

254000

45000

1

23

20

65800

45000

0

24

36

24500

15000

1

25

35

256000

299000

0

26

34

482000

145000

1

27

34

685000

14500

0

28

21

354000

145000

1

29

30

254000

49400

0

3

29

452000

145000

0

30

25

485000

45000

1

31

28

365000

785000

0

32

25

65000

45000

0

33

21

45000

75000

0

34

29

685000

45000

1

35

39

45000

85000

1

36

38

758000

75000

0

37

30

85000

15000

1

38

21

485000

78500

1

39

20

45000

25600

1

4

28

685000

8500

1

40

26

45000

54000

1

41

36

24000

25400

0

5

35

152000

25600

1

6

34

254000

15200

1

7

34

45000

14500

1

8

21

95000

14500

0

9

Le montant correspond au cumul des achats effectués par un client pendant une période.

IV.5.1.1 Représentation des clients

Les clients sont représentés par des vecteurs de , où n et le nombre de variables (dimensions) ou les caractéristiques retenues pour décrire les clients dans notre module. On associe à chaque client, un vecteur. Nous considérons que chaque individu est muni d'un poids pi avec pi > 0 et =1.

Sélection des variables

La première étape consiste à sélectionner les variables à considérées pour décrire les clients. Nous retenons l'âge du client, le sexe, le montant acheté, Revenu et le niveau d'instruction

Nuage d'individus ou des clients

Dans l'espace des individus, l'ensemble N = est appelé nuages des clients.

Centre de gravité

Le centre de gravité g d'un nuage N ou encore le « Barycentre » des points Xi (ou Xi et le ième client du nuage N) affectés aux poids pi est donné par la formule suivante :

G= qui peut être écrit à la manière suivante :

G= =

D'autres quantités telles qu'inertie totale, inertie inter classe et inertie intra classe sont définies dans le chapitre II.

Remarque :

Ø Dans notre travail, nous avons considérer le point associé à chaque client égale à un.

Ø Seules les variables quantitatives seront traitées dans notre algorithme parmi les variables sélectionnées.

Ø Pour la mise en oeuvre de notre algorithme nous avons utilisé la distance euclidienne qui est donnée par la formule suivante :

D(x,y)= avec X et Y deux vecteurs de

Principe général :

L'algorithme consiste à grouper les clients selon un critère bien déterminé par exemple : par catégorie d'achats (i.e. le vecteur x représentant la quantité achetée de chaque produit). L'entrée de l'algorithme est le nombre k de groupes (représentant les catégories de clients). Une fois le nombre de groupes saisi, l'algorithme choisit arbitrairement k clients comme centres « initiaux » des k groupes. L'étape suivante consiste à calculer la distance entre chaque individu (client) et les k centres ; la plus petite distance est retenue pour inclure cet individu dans le groupe ayant le centre de gravité le plus proche. Une fois tous les clients groupés, on aura k sous-nuages disjoints du nuage total. Pour chaque groupe (sous-nuage), l'algorithme calcule le nouveau centre de gravité.

L'algorithme s'arrête lorsque les groupes construits deviennent stables. Dans notre cas, notre algorithme va s'arrêter lorsque l'inertie intra classe dévient inférieure à notre seuil fixé à 0.05

IV.5.1.2 Résultats de la segmentation

Premier groupe

Age

Revenu

Montant

sexe

codeclient

classe

25

36000

50400

1

1

1

21

65000

59500

0

14

1

30

100000

54000

1

18

1

21

35000

45000

0

19

1

25

145000

85000

1

21

1

20

65800

45000

0

24

1

35

256000

299000

0

26

1

34

482000

145000

1

27

1

21

354000

145000

1

29

1

29

452000

145000

0

30

1

28

365000

785000

0

32

1

25

65000

45000

0

33

1

21

45000

75000

0

34

1

39

45000

85000

1

36

1

26

45000

54000

1

41

1

Deuxième groupe

Age

revenu

montant

sexe

Code client

classe

29

42000

14500

0

10

2

28

45000

5400

1

12

2

25

48000

4500

1

13

2

29

485000

29500

0

15

2

38

68500

14500

0

17

2

28

45000

26000

1

2

2

28

480000

45200

1

20

2

28

145000

45000

1

22

2

30

254000

45000

1

23

2

34

685000

14500

0

28

2

30

254000

49400

0

3

2

25

485000

45000

1

31

2

29

685000

45000

1

35

2

38

758000

75000

0

37

2

30

85000

15000

1

38

2

21

485000

78500

1

39

2

20

45000

25600

1

4

2

28

685000

8500

1

40

2

35

152000

25600

1

6

2

34

254000

15200

1

7

2

34

45000

14500

1

8

2

21

95000

14500

0

9

2

Troisième groupe

Age

Revenu

Montant

sexe

Code client

classe

25

35000

14500

1

11

3

39

24000

72500

1

16

3

36

24500

75000

1

25

3

36

24000

127000

0

5

3

IV.5.1.3 Analyse des résultats

Après la segmenta le problème reviendra à étiqueter les classes obtenues c'est-à-dire donner la signification de chaque groupe de clients. Nous constatons que les clients sont beaucoup plus influencés par le montant de leur achat et le revenu. En marketing, un marché est le produit que l'entreprise a mis sur le marché des biens, nous donnerons une interprétation de ces classes par rapport au mouvement d'achat effectué par chaque client vis-à-vis d'un produit.

Produit

Classe

Description classe

Catégorie

COCA

 
 
 
 

2

Cette classe contient des grands
Consommateurs de ce produit, le
Marketing ne serait pas opportun

Grand

 

1

Cette Classe contient des consommateurs Moyens du produit, Le marketing Pourrait aider à  accroitre la
Rentabilité

Moyen

 

3

Cette Classe contient des faibles consommateurs du produit, Le marketing Pourrait aider à  augmenter leur
achat

Faible

PRIMUS

 
 
 
 

1

Cette classe contient des grands Consommateurs de ce produit, le Marketing ne serait pas opportun

Grand

 

2

Cette Classe contient des consommateurs Moyens du produit, Le marketing Pourrait aider à  accroitre la
Rentabilité

Moyen

 

3

Cette Classe contient des faibles consommateurs du produit, Le marketing Pourrait aider à  augmenter leur
achat

Faible

TURBO

 
 
 
 

1

Cette classe contient des grands Consommateurs de ce produit, le Marketing ne serait pas opportun

Grand

 

3

Cette Classe contient des consommateurs Moyens du produit, Le marketing Pourrait aider à  accroitre la
Rentabilité

Moyen

 

2

Cette Classe contient des faibles consommateurs du produit, Le marketing Pourrait aider à  augmenter leur achat

Faible

Ce tableau regroupe les clients à contacter pour un marketing ciblé des différents produits.

Produit

Code Client

Nom du client

Avenue

Numéro de Contact

COCA

 
 
 
 
 

11

xxxxxx

xxxx

09985252260

 

16

xxxxxx

xxxxxx

0898754521

 

25

xxxxx

xxxxxx

09986858752

 

5

xxxxx

xxxxxxxx

 

PRIMUS

 
 
 
 
 

11

xxxxxx

xxxx

09985252260

 

16

xxxxxx

xxxxxx

0898754521

 

25

xxxxx

xxxxxx

09986858752

 

5

xxxxx

xxxxxxxx

 

TURBO

 
 
 
 
 

10

xxxxx

xxxx

0895685120

 

12

xxxxx

xxxxxx

0999850254

 

13

xxxxx

x

0816535261

 

15

xxxxxx

xxxxxx

09966585210

 

17

xxxxxx

xxxxx

089542410

 

2

xxxx

xxxxxx

0898775654

 

20

x

xxxxxx

08965853520

 

22

xxxxxx

xxxxxx

0998564251

 

23

xxxxxx

xxxxxx

0898754621

 

28

xxxx

xxxxxx

0996536325

 

3

xxxx

xxxxxx

0998452321

 

31

xxxxx

xxxxxx

0897865852

 

35

xxxx

xxxxxx

0898658251

 

37

xxxxxx

xxxxxx

089582560

 

38

xxxxxxx

xxxxxxx

08956253520

 

39

xxxxxxx

xxxxxx

0897565412

 

4

xxxxxxx

xxxxxx

0856421442

 

40

xxxxxxxx

xxxxx

0898542543

 

6

xxxxxx

xxxxxx

 
 

7

xxxxx

xxxxxx

 
 

8

xxxx

xxxxxxx

 
 

9

xxxxx

xxxxx

 

Le tableau suivant donne la part de chaque groupe de clients à la clientèle de l'entreprise

Classe

Nombre de Clients

Part du Marche en %

Total de clients

1

15

31.914893617021278

47

2

22

46.808510638297875

47

3

4

8.51063829787234

47

IV.5.1.4. Affectation

Cette tâche consiste à prédire le groupe d'un nouveau client qui se présente à l'entreprise, la classe est prédite après que le client ait effectué son premier achat.

Ce tableau montre les valeurs d'attributs de ce client

code client

age

revenu

montant

sexe

100

45

450000

2800

1

Résultat du classifieur Bayésien

Code client

P(C1/X)

P(C2/X)

P(C3/X)

Décision ou Classe

100

0.3967275958099037

0.32315485060502985

0.2801175535850664

1

L'individu est affecté dans la classe ou la probabilité est maximale. Dans ce cas, le client est affecté dans la classe 1. Le tableau suivant donne la liste des produits à l'offrir accompagné d'un service de marketing.

PRODUIT

COCA

PRIMUS

TURBO

Le logiciel propose d'autres analyses sur le client et sur les produits fabriqués par l'entreprise.

IV.5.1.5 Analyse des Résultats avec SPAD

IV.5.1.5.1 Résultats de la segmentation Hiérarchique de la base de données

Liste des trois meilleure(s) partition(s) entre 3 et 10 classes

Ø partition en 4 classes

Ø partition en 6 classes

Ø partition en 7 classes

Première Coupure de l'arbre en 4 classes

FORMATION DES CLASSES (INDIVIDUS ACTIFS)

| CLASSE

EFFECTIF

POIDS

CONTENU

Classe 1

7

548194

1 à 7

Classe 2

14

********

8 à 21

Classe 3

14

996316

22 à 35

Classe 4

5

325652

36 à 40

PROGRESSION DE L'INERTIE INTER-CLASSES

ITERATION

I.TOTALE

| I.INTER

QUOTIENT

0

0.13612

0.12706

0.93337

1

0.13612

0.12738

0.93581

2

0.13612

0.12783

0.93912

3

0.13612

0.12815

0.94144

4

0.13612

0.12815

0.94144

5

0.13612

0.12815

0.94144

La consolidation de la partition Autour des 4 centres de classes est réalisée par 10 itérations a centres mobiles.

IV.5.1.5.2 Nuage des points

Interprétation : Les nuages projetés sur les deux premiers axes montrent un certain regroupement des individus autour des variables Montant et Revenu, donc ce sont ces deux variables qui influencent les individus.

IV.5.1.6 Comparaison des résultats

La méthode utilisée par SPAD pour segmenter ces clients nous donne beaucoup de classes par rapport à chaque coupure que nous pouvons effectuer de l'arbre, le plus petit nombre de classes est quatre, mais l'interprétation que nous avons fait des ces classes donne lieu à un regroupement autour des trois classes, Le critère utilisé est pour la convergence de cet algorithme pour consolider les classes est celui de la fixation de nombre d'itérations.

Par contre, notre logiciel à trois groupes d'individus et le critère de convergence utilisé est celui de la minimisation de l'inertie intra classe qui explique l'homogénéité entre les individus d'une même classe, c'est-à-dire la distance qui sépare chaque individu à son centre de gravité

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Piètre disciple, qui ne surpasse pas son maitre !"   Léonard de Vinci