II.4.2 Estimation
Contrairement à la classification, le résultat
d'une estimation permet d'obtenir une variable continue. Celle-ci est obtenue
par une ou plusieurs fonctions combinant les données en entrée.
Le résultat d'une estimation permet de procéder aux
classifications grâce à un barème. Par exemple, on peut
estimer le revenu d'un ménage selon divers critères (type de
véhicule et nombre, profession ou catégorie socioprofessionnelle,
type d'habitation, etc ...). Il sera ensuite possible de définir des
tranches de revenus pour classifier les individus.
Un des intérêts de l'estimation est de pouvoir
ordonner les résultats pour ne retenir si on le désire que les n
meilleures valeurs. Cette technique sera souvent utilisée en marketing,
combinée à d'autres, pour proposer des offres aux meilleurs
clients potentiels. Enfin, il est facile de mesurer la position d'un
élément dans sa classe si celui-ci a été
estimé, ce qui peut être particulièrement important pour
les cas limitrophes.
La technique la plus appropriée à l'estimation
est : les réseaux de neurones.
II.4.3 La prédiction
La prédiction ressemble à la classification et
à l'estimation mais dans une échelle temporelle
différente. Tout comme les tâches précédentes, elle
s'appuie sur le passé et le présent mais son résultat se
situe dans un futur généralement précisé. La seule
méthode pour mesurer la qualité de la prédiction est
d'attendre !
Les techniques les plus appropriées à la
prédiction sont :
Ø L'analyse du panier de la ménagère
Ø Le raisonnement basé sur la mémoire
Ø Les arbres de décision
Ø les réseaux de neurones
II.4.4 Le regroupement par
similitude
Le regroupement par similitudes consiste à grouper les
éléments qui vont naturellement ensembles. La technique la plus
appropriée au regroupement par similitudes est : L'analyse du panier de
la ménagère
II.4.5 L' Analyse des
clusters
L'analyse des clusters consiste à segmenter une
population hétérogène en sous-populations
homogènes. Contrairement à la classification, les sous
populations ne sont pas préétablies.
La technique la plus appropriée à la
clustérisation est : L'analyse des clusters
II.4.6 La description
C'est souvent l'une des premières tâches
demandées à un outil de data mining. On lui demande de
décrire les données d'une base complexe. Cela engendre souvent
une exploitation supplémentaire en vue de fournir des explications.
La technique la plus appropriée à la description
est : L'analyse du panier de la ménagère
|