6.3 Implémentation
de l'entrepôt de données
6.3.1 Modélisation
multidimensionnelle
6.3.1.1 Les dimensions
Les données du réseau routier seront analysables
par les utilisateurs suivant cinq dimensions, il s'agit :
Ø Dimension Route
Ø Dimension Province
Ø Dimension Inspecteur
Ø Dimension Entreprise
Ø Dimension Temps
6.3.1.2 Les faits
Selon les problématiques posent nous sommes abouti au
choix des mesures suivantes sur lesquelles seront portés les analyses.
Ø Coût
Ø La taille
Ø La durée
6.3.1.3 Modèle
Dim_Province
Id_DW_province
Id_nat_province
nomprovince
Dim_Inspecteur
Id_DW_Inspecteur
Id_nat_Inspecteur
Nominspecteur
Numphone
Dim_Route
Id_DW_Route
Id_nat_Route
Nomroute
Nomaxeroutier
Comm_route
Comm_axe
Type_route
Entreprise
Id_DW_Entreprise
Id_nat_Entreprise
Nomentreprise
Fait
Id_DW
Id_DW_Province
Id_DW_Temps
Id_DW_Entreprise
Id_DW_Inspecteur
Id_DW_Route
Cout
Duree
Taille
Dim_Temps
Id_DW_temps
Id_nat_temps
Année
Mois
Trimestre
Semestre
Figure 26Modèle en étoile de notre
entrepôt de données
6.3.1 6.3.2 Architecture
type du data warehouse
Tableau croisé dynamique de Excel
Figure 27 Architecture globale du système
décisionnel.
6.3.3
Implémentation de la base de données du data
Warehouse
Outils utilisé : Microsoft SQL Server 2008
Ø SQL Server Management Studio
Dictionnaire des données
Tables
|
Attributs
|
Type de données
|
Rôle
|
Dim_Route
|
Id_DW_Route
Id_nat_Route
Nomroute
Nomaxeroutier
Type_route
Date_debut
Date_fin_fin
|
bigint
float
nvarchar(50)
nvarchar(50)
nvarchar(10)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Dim_Inspecteur
|
Id_DW_Inspecteur
Id_nat_Inspecteur
Nominspecteur
Post_nom
Numphone
Date_debut
Date_fin
|
bigint
float
nvarchar(30)
nvarchar(30)
nvarchar(30)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Dim_Entreprise
|
Id_DW_Entreprise
Id_nat_Entreprise
Nomentreprise
Date_debut
Date_fin
|
bigint
float
nvarchar(30)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Dim_Temps
|
Id_DW_temps
Id_nat_temps
Date
Année
Trimestre
Mois
|
bigint
float
smalldatetime
nvarchar(4)
nvarchar(4)
nvarchar(12)
|
Clé de l'entrepôt
Clé d'entreprise
|
Dim_Province
|
Id_DW_province
Id_nat_province
nomprovince
Date_debut
Date_fin
|
bigint
float
nvarchar(50)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Tableau 4 Tableau de dictionnaire de
données
6.3.4 Chargement de
données dans les dimensions
Outils utilisé :
Ø Microsoft SQL Server 2008
· SQL Server Integration Services
Ø Microsoft Office
· Microsoft Office Excel 2007
Procédure
Toutes les dimensions, excepté la dimension temps, sont
des dimensions à variation lente. Les sources de données sont des
fichiers Excel que nous avons exportés de notre base de données
MySQL. Nous avons utilisé le processus d'intégration des ETL tel
qu'implémenté dans SQL Server Intégration Services.
Exemple d'un processus de chargement pour la dimension
route :
Figure 28 Processus de chargement de
données
Chargement de la dimension Temps
Une particularité pour cette dimension, nous l'avons
généré automatiquement en fixant notre plage
d'étude entre 2007 et 2013. Car nos données test correspondent
à cette plage.
6.3.5 Construction de la
base de préparation
Ø Outils: MySQL, Microsoft Office Excel 2007, SQL
Server Integration Services
- Création de la vue de préparation pour
extraire les données qui correspondant aux clés d'entreprise et
les mesures.
MySQL
- Nettoyage de données
- Requête SQL pour l'ajout des champs
- Vérification de la cohérence
Excel
Chargement des données dans la table T_Préparation
de la base de données du Data warehouse avec le processus de copie de
colonne après mappage.
SQL Server Integration Services
Figure 29: Schémas de construction de la base
de préparation des données.
6.3.6 Chargement de la
table fait
La tâche, à ce niveau est facilitée par la
base de préparation déjà chargée de données.
La source de donnée est le résultat d'une requête SQL. Ce
dernier est alors copié dans la table des faits après mappage des
colonnes.
SELECT DISTINCT
dbo.Dim_Inspecteur.id_DW_inspecteur,
dbo.Dim_Route.id_DW_route, dbo.Dim_Temps.id_DW_temps,
dbo.Dim_Province.id_DW_province,
dbo.Dim_entreprise.id_DW_entreprise, dbo.T_Preparation.cout,
dbo.T_Preparation.duree, dbo.T_Preparation.taille_axe
FROM dbo.Dim_InspecteurINNER JOIN
dbo.T_Preparation ON dbo.Dim_Inspecteur.id_nat_inspecteur =
dbo.T_Preparation.id_nat_inspecteurINNER JOIN
dbo.Dim_Province ON dbo.T_Preparation.id_nat_province =
dbo.Dim_Province.id_nat_provinceINNER JOIN
dbo.Dim_entreprise ON dbo.T_Preparation.id_nat_entreprise =
dbo.Dim_entreprise.id_nat_entrepriseINNER JOIN
dbo.Dim_Temps ON dbo.T_Preparation.id_nat_temps =
dbo.Dim_Temps.id_nat_tempsINNER JOIN
dbo.Dim_Route ON dbo.T_Preparation.id_nat_route =
dbo.Dim_Route.id_nat_route
Ce script SQL nous a permis de charger la table de fait en
faisant le mappage entre les clés d'entrepôts.
6.3.7 Déploiement
du cube et analyse
Nous avons procédé à quelques analyses
test pour évaluer les performances de notre système
décisionnel, après le déploiement du cube avec Microsoft
SQL Server Analysis Services.
Figure 25 : Présentation du cube
Figure 30 Présentation du cube
6.3.7.1 Analyse de performance
Le cube ainsi déployé constitue un
véritable tableau de bord. En effet, il permet de présenter une
vue claire et synthétique de l'ensemble des activités sur les
infrastructures. Comme illustration simple, en un moindre instant, nous
obtenons dans un rapport l'ensemble des entreprises de construction
croisées avec les provinces où elles ont effectué des
travaux, avec la possibilité de creuser d'avantage et obtenir les divers
axes routiers. A cette présentation s'adjoint le nombre de
kilomètres pour les axes, la durée des travaux et le cout
détaillé et global.
Tableau 18: Extrait de la navigation du
cube
Tableau 5 Présentation d'un tableau de bord
Départ notre tableau de bord, nous pouvons constater
qu'au niveau de l'axe Gare Central et Socimaxdeux entreprises ont eu à
intervenir.Nous pouvons alors prendre une décision en fonction de
différentesmesures.
Présentation de résultat sur
l'entreprise SAFRICAS
Ø tableau de synthétique
Tableau 6 Tableau de résultat SAFRICAS
Ce tableau nous représente la synthèse statique
de SAFRICAS par rapport à nos trois mesures.
Ø Histogramme
Figure 31Histogramme de coût de SAFRICAS
Sur cette figure nous pouvons constater que la grande partie
de l'argent attribue à SAFRICAS pour les infrastructures
routières fut utilisé à KINSHASA.
6.3.7.2 Représentation des quelques
statistiques
Tableau 7 Tableau croisé sous Analysis Services
pour la présentation des statistiques.
Figure 32 Histogramme de coût par province
|