CHAPITRE II: LES TECHNIQUES DE
DATA MINING [1], [8], [11], [10],[12], [14]
II.1 INTRODUCTION
Le terme Data mining est souvent employé pour
désigner un ensemble d'outils permettant aux utilisateurs
d'accéder aux données de l'entreprise et des analyses. Les
outils d'aide à la décision, qu'ils soient relationnels ou OLAP,
laissent l'initiative à l'utilisateur de choisir les
éléments qu'il veut observer ou analyser. Au contraire, dans le
cas du data mining, le système a l'initiative et découvre
lui-même les associations entre les données, sans que
l'utilisateur ait à lui dire de rechercher plutôt dans telle ou
telle direction ou à poser des hypothèses. Les modèles
classiques de recherche d'informations ne sont pas adaptés pour traiter
des masses gigantesques de données, souvent
hétérogènes. C'est ce constat qui a permis au data mining
d'émerger et vulgariser les méthodes d'analyse.
Le data mining (ou la fouille de données) a pour objet
l'extraction d'un savoir à partir de grandes quantités de
données, par des méthodes automatiques ou semi-automatiques. La
fouille de données repose sur un ensemble de fonctions mais aussi sur
une méthodologie de travail.
Le terme de data mining signifie littéralement
exploitation des données. Comme dans toute exploitation, le but
recherché est de pouvoir extraire de la richesse. Ici, la richesse est
la connaissance de l'entreprise. Fort du constat qu'il existe au sein des bases
de données de chaque entreprise une ressource de données
cachées et surtout inexploitée, le data Mining permet de faire
les apparaître, et cela grâce à un certain nombre de
techniques spécifiques. Nous appellerons data mining l'ensemble des
techniques qui permettent de transformer les données en connaissances.
Le périmètre d'exploitation du data mining ne se limite pas
à l'exploitation des Data warehouse. Il veut d'être capable
d'exploiter toutes bases de données contenant de grandes
quantités de données telles que des bases relationnelles, des
entrepôts de données mais également des sources plus ou
moins structurées comme internet. Dans ces cas, il faut néanmoins
construire une base de données ou un entrepôt de données
qui sera dédié à l'analyse.
Le data mining est un processus itératif qui met en
oeuvre un ensemble de techniques hétéroclites tel que le data
warehouse , de la statistique, de l'intelligence artificielle, de l'analyse des
données et des interfaces de communication homme - machine. Le
résultat du datamining peut se présenter sous différent
format : texte plat, tableau, graphique...
Le datamining est un ensemble d'outils d'analyse
d'entrepôt de données et de cube apportant aux décideurs
des éléments supplémentaire de prise de décisions
qui ne sont pas forcement visible aux premiers abords.
|