2.2.1 Entrepôt de données (Data Warehouse)
2.2.1.1 Définition
Le créateur du concept, Bill Inmon, le
définit comme suit : « Un Data Warehouse est une
collection de données orientées sujets, intégrées,
non volatiles et historiées, organisées pour le support d'un
processus d'aide à la décision».
Orienté sujet : le Data
Warehouse est organisé autour des sujets majeurs de l'entreprise,
contrairement à l'approche transactionnelle utilisée dans les
systèmes opérationnels, qui sont conçus autour
d'applications et de fonctions telles que : cartes bancaires,
solvabilité client..., les Data Warehouse sont organisés autour
de sujets majeurs de l'entreprise tels que : clientèle, ventes,
produits.... Cette organisation affecte forcément la conception et
l'implémentation des données contenues dans le Data Warehouse. Le
contenu en données et en relations entre elles diffère aussi.
Dans un système opérationnel, les données sont
essentiellement destinées à satisfaire un processus fonctionnel
et obéit à des règles de gestion, alors que celles d'un
Data Warehouse sont destinées à un processus analytique.
Intégrée : le Data
Warehouse va intégrer des données en provenance de
différentes sources. Cela nécessite la gestion de toute
incohérence.
Evolutives dans le temps : Dans un
système décisionnel il est important de conserver les
différentes valeurs d'une donnée, cela permet les comparaisons et
le suivi de l'évolution des valeurs dans le temps, alors que dans un
système opérationnel la valeur d'une donnée est simplement
mise à jour. Dans un Data Warehouse chaque valeur est associée
à un moment « Every key structure in the data warehouse contains -
implicitly or explicitly -an element of time » [Inmon, 2000] .
Non volatiles : c'est ce qui est, en
quelque sorte la conséquence de l'historisation décrite
précédemment. Une donnée dans un environnement
opérationnel peut être mise à jour ou supprimée, de
telles opérations n'existent pas dans un environnement Data
Warehouse.
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016 Page | 18
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
Organisées pour le support d'un processus
d'aide à la décision : Les données du Data
Warehouse sont organisées de manière à permettre
l'exécution des processus d'aide à la décision (Reporting,
Data Mining...).
2.2.1.2 Bref aperçu
Le concept de Data Warehouse, tel que connu aujourd'hui, est
apparu pour la première fois en 1980.
L'idée consistait alors à réaliser une
base de données destinée exclusivement au processus
décisionnel. Les nouveaux besoins de l'entreprise, les quantités
importantes de données produites par les systèmes
opérationnels et l'apparition des technologies aptes à sa mise en
oeuvre ont contribué à l'apparition du concept« Data
Warehouse » comme support aux systèmes décisionnels.
Un entrepôt de données, ou data Warehouse, est
une vision centralisée et universelle de toutes les informations de
l'entreprise. C'est une structure (comme une base de données) qui a pour
but, contrairement aux bases de données, de regrouper les données
de l'entreprise pour des fins analytiques et pour aider à la
décision stratégique. La décision stratégique
étant une action entreprise par les décideurs de l'entreprise et
qui vise à améliorer, quantitativement ou qualitativement, la
performance de l'entreprise. En gros, c'est un gigantesque tas d'informations
épurées, organisées, historisées et provenant de
plusieurs sources de données, servant aux analyses et à l'aide
à la décision. L'entrepôt de données est
l'élément central de l'informatique décisionnelle à
l'heure actuelle. En effet, l'entrepôt de données est le meilleur
moyen (jusqu'à nos jours) que les professionnels ont trouvé pour
modéliser de l'information pour des fins d'analyse.
Le Data Warehouse peut être subdivisé en des
sous-ensembles appelés data mart. Le data mart est un sous-ensemble d'un
Data Warehouse destiné à fournir des données aux
utilisateurs, et souvent spécialisé vers un groupe ou un type
d'affaire. Techniquement, c'est une base de données relationnelle
utilisée en informatique décisionnelle et exploitée en
entreprise pour restituer des informations ciblées sur un métier
spécifique, constituant pour ce dernier un ensemble d'indicateurs
utilisés pour le pilotage de l'activité et l'aide à la
décision. Un magasin de données peut constituer un extrait de
l'entrepôt, où les données sont préparées de
manière spécifique pour faciliter leur analyse et leur
exploitation par un groupe d'utilisateurs, en fonction par exemple d'une
orientation métier.
Les possibilités d'analyse des données
sélectionnées sont très variées. Elles
dépendent des besoins des utilisateurs et font appel à des
techniques différentes :
le reporting avec la construction de tableaux de bord,
d'indicateurs, de graphiques ;
la navigation multidimensionnelle dans les données avec la
technologie OLAP ; la fouille dans les données à l'aide des
méthodes de Data Mining.
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016 Page | 19
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
|