II.1.1 Définition
Soit I un ensemble fini non vide.
H est une hiérarchie de I s'il satisfait aux axiomes
suivants :
Hi : axiome d'intersection
![](Une-contribution-du-datamining-la-segmentation-du-march-et-au-ciblage-des-offres--l-aide127.png)
![](Une-contribution-du-datamining-la-segmentation-du-march-et-au-ciblage-des-offres--l-aide128.png)
L'ensemble I tout entier, ainsi que toutes les parties
réduites à un élément appartiennent à H.
I H
![](Une-contribution-du-datamining-la-segmentation-du-march-et-au-ciblage-des-offres--l-aide129.png)
Une hiérarchie peut être vue comme un ensemble de
partitions emboitées. Graphiquement, une hiérarchie est souvent
représentée par une structure arborescente
représentée par un arbre hiérarchique dit aussi
dendrogramme
Partitions emboitées
e
d
c
f
b
a
g
Dendrogramme
f,g
d,e
b,a
c
Il existe deux types de familles de méthodes : une
descendante, dite divisive, et une ascendante dite agglomérative. La
première moins utilisée, consiste à partir d'une seule
classe regroupant tous les objets, à partager celle-ci en deux. Cette
opération est répétée à chaque
itération jusqu'à ce que toutes les classes soient
réduites à des singletons. La seconde qui est la plus couramment
utilisée consiste, à partir des objets (chacun est dans sa propre
classe), à agglomérer les classes les plus proches,
jusqu'à obtenir une classe qui contient tous les objets.
II.1.3. Construction d'une
hiérarchie
II.1.3.1. Indice d'agrégation
La construction d'une hiérarchie nécessite la
connaissance d'une mesure de ressemblance entre groupes ; cette mesure est
appelée indice d'agrégation. Il existe plusieurs sorte d'indice
d'agrégation ; les plus utilisées sont : indice
d'agrégation du lien minium, indice d'agrégation de la moyenne de
distance, indice d'agrégation de centre de gravité, l'indice
d'agrégation de Ward (ou indice de moment centré d'ordre 2)
II.1.3.2. Proposition
En agrégation deux classes h1,
h2, l'inertie intra classe augmente de : (1.9)
II.1.3.3 Algorithme général de la
classification ascendante hiérarchique
1) Partir de la partition P0
2) Construire une nouvelle partition minimisant ä
(h1, h2)
3) Recommencer les classes pour qu'elles soient réunies
en une seule.
II.1.4. La Classification
Descendante Hiérarchique
Les méthodes de classification descendante
hiérarchique sont itératives et procèdent à chaque
itération au choix du segment de l'arbre hiérarchique à
diviser, et au partitionnement de ce segment. La différence entre les
méthodes divisives, développées jusqu'à
présent dans la littérature, figure dans les critères
qu'elles utilisent pour choisir le segment à diviser ainsi dans la
manière dont elles divisent le segment. Le choix de tels critères
dépend généralement de la nature des variables
caractérisant les individus à classer.
|