JUILLET 2018
UNIVERSITE LIBERTE
FACULTE DES SCIENCES INFORMATIQUES
ETUDE ET CONCEPTION D'UN DATA WAREHOUSE ET L'IMPACT DU
DEPLOIEMENT D'UN SYSTEME DECISIONNEL DANS UNE SOCIETE DE VENTE ET DE
PRODUCTION (CAS DE LA BRASIMBA)
Par MASSAMBA SENDWE Cédric
Travail présenté et défendu en vue
de l'obtention du grade d'Ingénieur en Sciences
Informatiques.
Option : Ingénierie des Systèmes
d'Information
ANNEE ACADEMIQUE 2017-2018
UNIVERSITE LIBERTE
FACULTE DES SCIENCES INFORMATIQUES
ETUDE ET CONCEPTION D'UN DATA WAREHOUSE ET L'IMPACT DU
DEPLOIEMENT D'UN SYSTEME DECISIONNEL DANS UNE SOCIETE DE VENTE ET DE
PRODUCTION (CAS DE LA BRASIMBA)
Par MASSAMBA SENDWE Cédric
Dirigé par Prof. Blaise FYAMA, PhD Codirecteur:
Ass. Ruphin NYAMI
I
EPIGRAPHE
«L'invention scientifique réside dans la
création d'une hypothèse heureuse et féconde ; elle est
donnée par le sentiment ou le génie même du savant qui l'a
créée.»
Claude Bernard
II
DEDICACE
A tout chercheur scientifique, particulièrement
celui du domaine informatique ayant la passion de bien vouloir
appréhender, améliorer ou approfondir le sujet traité
dans ce travail [...]
III
AVANT-PROPOS
A toi Dieu source de toute créativité,
créateur de l'univers, Père de notre Seigneur
Jésus-Christ, me voici devant ta face pour exprimer ma gratitude et mes
vifs remerciements suite à la bienveillance et ta grâce
m'accordées depuis mon enfance jusqu'à aujourd'hui, reçois
bien mon obligeance.
Monsieur le Doyen de la Faculté des Sciences
Informatiques, le Professeur Blaise FYAMA, veuillez trouver ici l'expression de
notre reconnaissance pour avoir dirigé ce travail avec amour
malgré ce pain sur la planche qui guette quotidiennement votre
porte.
Nous remercions toutes les autorités de
l'Université Liberté plus particulièrement le
Secrétaire Général Académique ainsi que le Doyen de
la faculté des Sciences Informatiques pour leur encadrement tout au long
de notre parcours académique.
Chers parents, MASSAMBA WA MASSAMBA Ferdinand et BANZE
MOMA Anastasie, voici l'expression de ma parfaite reconnaissance pour le devoir
que vous avez accompli et je vous demande de savourer dès maintenant le
fruit de votre patience.
Nous n'oublierons pas d'expédier nos sentiments de
remerciements à nos chers collègues, amis et compagnons de lutte
de deuxième Grade ISI 2018, à l'Université
Liberté.
A vous tous qui nous avez soutenu de loin ou de
près, veuillez trouver ici l'expression de notre parfaite
reconnaissance.
IV
LISTE DES FIGURES
Figure 1: Architecture globale d'un système
décisionnel 11
Figure 2: Composants du DWH refermant la boucle 15
Figure 3: Architecture d'un Data Warehouse 16
Figure 4: Diagramme du cycle de vie d'un modèle
dimensionnel 22
Figure 5: Modèle logique de données ventes
(sources opérationnelles) 34
Figure 6 : Diagramme de cas d'utilisation du
système décisionnel 39
Figure 7:DSS DU CU « S'authentifier » 40
Figure 8 : DSS DU CU « Alimenter l'entrepôt
» 41
Figure 9: DSS DU CU "Gérer comptes utilisateurs"
43
Figure 10: DSS DU CU « Analyser les données
» 45
Figure 11 : DSS DU CU « Visualiser les cubes des
données » 46
Figure 12:DCP du CU « S'authentifier »
47
Figure 13: DCP du CU « alimenter entrepôt
» 48
Figure 14: DCP du CU « Gérer comptes
utilisateurs » 48
Figure 15: DCP du CU « Analyser les données
» 49
Figure 16: DCP du CU « Visualiser les cubes des
données » 50
Figure 17 : Diagramme de classes de conception 51
Figure 18: Modèle logique des données
51
Figure 19: Modèle dimensionnel en flocon 53
Figure 20 : Modèle dimensionnel en étoile du
fait Vente 59
Figure 21: Représentation des sources Excel
61
Figure 22: Représentation des sources Access
62
Figure 23: Représentation des sources MySQL
62
Figure 24: Architecture technique proposée
67
Figure 25: Importation des fichiers sources 69
Figure 26 : Création de connexion pour les sources
externes 1ère étape 69
Figure 27: Création de connexion pour les sources
externes 2e étape 70
Figure 28 : Récupération du schéma :
1ère étape 70
Figure 29: Récupération du schéma :
2e étape 71
Figure 30: Création des Jobs 71
Figure 31: Extraction et transformation des données
sources 72
Figure 32: Correspondance des champs 72
Figure 33: Chargement des données dans
l'entrepôt 73
Figure 34: Connexion à l'entrepôt 1ère
étape 73
Figure 35: Création des dimensions et des mesures
74
V
Figure 36: Connexion à l'entrepôt 2e
étape 74
Figure 37: Les clients autour de toutes les zones
commerciales de Lubumbashi 75
Figure 38: La liste de clients autour d'une commune
(Commune de Ruashi) 75
Figure 39: Le comportement du produit SIMBA 73CL autours
de toutes les communes de la ville 76
Figure 40: Tableau de bord du comportement de tous les
produits 76
Figure 41: Tableau de bord du comportement de tous les
produits vendus dans la commune de Katuba 77 Figure 42: Statistiques de tous
les produits dans toutes les zones commerciales 77
VI
LISTE DES TABLEAUX
Tableau 1: Comparaison entre les systèmes
transactionnels et systèmes décisionnels 18
Tableau 2: Eléments constitutifs d'un modèle
relationnel 29
Tableau 3 : Liste de tous les produits de la Brasimba
32
Tableau 4: Exemple de la fiche de ventes pour le secteur
Ville-Est 33
Tableau 5: Tableau des acteurs 38
Tableau 6: Liste de propriétés de la
dimension Produit 55
Tableau 7: Liste de propriétés de la
dimension Client 55
Tableau 8 : Liste de propriétés de la
dimension Periode 55
Tableau 9: Liste de propriétés de la
dimension ZoneCommerciale 56
Tableau 10: Liste des propriétés de la table
des faits Vente 56
Tableau 11: Outils du décisionnel utilisés
68
Tableau 12: Environnement d'exécution 68
VII
LISTE DES SIGLES ET ABREVIATIONS
AS400 : Application System/400
BD : Base de données
CRM : Customer Relationship Management
CSV : Comma-separated values
CU : Cas d'utilisation
DBA : Database administrator
DCU : Diagramme de cas d'utilisation
DCP : Diagramme de classes participantes
DM : Data mart
DSS : Diagramme de séquence
système
DWH : Data warehouse
EAI : Echange de données
Inter-Applications
ERP : Entreprise Ressources Planing
ESB : Enterprise Service Bus
ETC : Extraction, transformation et
Chargement
ETL : Extract-Transform-Load
FK : Foreign key
FTP : File Transfert Protocol
GB : Gigabyte
GPL : General Public License
HTML : Hypet Text Markup Language
HTTP : Hypertext Transfer Protocol
KPI : Key Performance Indicator
MLD : Modèle logique de
données
ODBC : Open Database Connectivity
OLAP : OnLine Analytical Processing
OLTP : OnLine Transaction Processing
OS : Operating System
PHP : Hypertext Preprocessor
PK : Primary Key
QBE : Query by Example
SAP : Systems, Applications and Products for
data processing
SGBD : Système de gestion de base de
données
SGBDR : Système de gestion de bases de
données relationnelles
SI : Système d'information
VIII
SID : Système d'information
décisionnel
SQL : Structured Query Language
SSH : Secure Shell
TB : Terabyte
TCD : Tableau croisé dynamique
TOS : Talend Open Studio
TOS DI : Talend Open Studio for Data
Integration
TXT : Text
VBA : Visual Basic for Applications
UML : Unified Modeling Language
UP : Unified Process
URL : Uniform Resource Locator
WWW : World Wide Web
XAMPP : X (cross) apache MariaDB Perl PHP
XML : eXtensible Markup Language
1
INTRODUCTION GENERALE
« L'une des plus grandes richesses d'une entreprise est son
information. » [1]
La conservation et le stockage de celle-ci se base sur la
structuration et la normalisation des données sur un support, c'est
l'objectif premier des bases de données.
Dans une entreprise de grande envergure, l'information est
stockée sous diverses formes et de manière
éparpillée, éparse et hétérogène car
chaque service peut éventuellement utiliser plusieurs applications dont
les données sont structurées et codifiées de
manière différente par rapport aux autres services.
Cette approche ne facilite pas la tâche aux
décideurs qui doivent prendre des décisions stratégiques
et pertinentes dans un temps aussi court que raisonnable car ils ne peuvent
avoir la vision globale de l'entreprise vu que ces données sont
collectées pour un objectif purement transactionnel et non pas
décisionnel.
Or, les dirigeants des entreprises, quel qu'en soit le domaine
d'activités d'ailleurs, doivent être en mesure de mener à
bien les missions qui leur incombent en la matière et doivent prendre
notamment les décisions les plus opportunes.
Ces décisions qui influeront grandement sur la
stratégie de l'entreprise, et donc sur son devenir, ne doivent pas
être prises ni à la légère, ni de manière
trop hâtive, compte tenu de leurs conséquences sur la survie de
l'entreprise. Il s'agira de prendre des décisions fondées,
basées sur des informations claires, fiables et pertinentes.
Pour avoir une vision globale de l'entreprise, il est
nécessaire de réunir toutes ces informations provenant des
sources transactionnelles ou opérationnelles.
Ces données seront alors transformées,
filtrées, croisées et reclassées afin de les
intégrer dans un endroit spécifique pour que les responsables et
analystes des entreprises aient une connaissance de ces données à
un niveau global et ainsi leur permettre la prise des décisions de
façon sûre en se basant sur les faits.
Or, pour avoir une meilleure vue de ces données, sous
plusieurs axes, afin de permettre aussi une meilleure analyse, la solution
consistera à l'utilisation et la réutilisation de ces
données collectées, qui malheureusement ne peuvent plus
être gérées à l'aide des bases de données
classiques en fonction de leur volume et de leur éventuelle
hétérogénéité.
En voulant répondre aux besoins de ses consommateurs,
aux attentes du marché et en observant parallèlement la crise
économique qui frappe l'humanité actuellement,
2
C'est dans ce contexte que les « systèmes
décisionnels » ont vu le jour. Ils offrent aux décideurs des
informations de qualité sur lesquelles ils pourront s'appuyer pour
arrêter leurs choix décisionnels.
Ces systèmes utilisent un large éventail de
technologies et de méthodes, dont les «Entrepôts de
données » ou « Data warehouses » représentent
l'élément principal et incontournable pour la mise en place d'un
bon système décisionnel, permettant ainsi une analyse claire et
pertinente de données de l'entreprise.
La Brasimba est une société de production, de
vente, et de distribution des boissons installée au numéro 1200,
avenue N'Djamena à Lubumbashi en République Démocratique
du Congo.
Filiale du groupe CASTEL, leader dans l'industrie brassicole
sur le marché d'Afrique Francophone, cette société a pour
vision d'être leader en industrie et en distribution des boissons dans le
cadre d'une production moderne, efficace, performante, et citoyenne dans notre
pays.
Elle est une société commerciale qui a aussi
pour mission d'assurer la distribution et la qualité constante des
produits aux meilleurs prix tout en perpétuant son savoir-faire
brassicole, et ne cesse de cultiver sa passion pour l'innovation d'une gamme
variée de boissons d'une extrême qualité pour le goût
des consommateurs.
Cette société s'est inscrite dans la production
et dans la commercialisation de ses marques et de ses gammes entre autres : la
bière, l'alcool mix, les boissons gazeuses, les boissons
énergisantes ainsi que de l'eau minérale. La chaine
Marketing-Vente-Distribution assure l'écoulement de ses produits.
Evoluant dans un environnement fortement complexe et hautement
concurrentiel, ce climat de forte concurrence exige de cette entreprise une
surveillance très étroite du marché afin de ne pas se
laisser distancer par les concurrents et cela en répondant, le plus
rapidement possible, aux attentes du marché, de sa clientèle et
de ses partenaires.
3
l'utilisation du principe de ne privilégier que
l'essentiel doit être de mise pour espérer toujours une croissance
et une stabilité économique.
La question est : Comment arriver à
homogénéiser ces informations naturellement
hétérogènes afin d'effectuer des analyses pour la prise
des décisions ?
Cette question est la préoccupation majeure des
responsables d'entreprise qui ont besoin de :
+ Savoir le comportement d'une marque par rapport aux
critères temporel, géographique, et démographique ;
+ Trouver toutes les marques de produits vendues au cours
d'une certaine période ; + Détailler les ventes totales des
marques par secteur, par commune, ou par région ; + Connaître le
coût et le chiffre d'affaires...
Eu égard à ce qui précède, la
société procédera à se poser les questions
suivantes :
+ Qu'a-t-on vendu ?
+ Quel est le total des ventes d'une marque en une certaine
période ?
+ Quel est le total des ventes d'une marque par secteur, par
commune ?
+ Quelles sont les marques les plus vendues dans un secteur, dans
une commune, dans
une ville, dans une région ?
Voilà quelques-unes des préoccupations qui
retiennent l'esprit du décideur qui désire améliorer ses
performances décisionnelles sur base des données pouvant lui
éclairer et lui faciliter une prise de décision prompte en
connaissance des causes et des faits.
La résolution à ce problème serait donc
de modéliser un système qui requiert la mise en place d'un
entrepôt de données fiable, contenant les informations
nécessaires à l'accomplissement des processus décisionnels
pour permettre aux décideurs de savoir cibler plus
précisément les consommateurs d'une marque dans un secteur et
à une période donnés.
Le présent projet tendra à donner réponse
à toutes ces questions car nous concevrons un système capable de
consolider les données issues des systèmes transactionnels, et
d'offrir aux décideurs des informations fiables.
Etant donné qu'un entrepôt de données est
un type de base orienté sujet, les données collectées
seront orientées `métier' et donc triées par
thème.
4
L'objectif attendu de ce projet est de concevoir un Data
warehouse, l'élément primordial de tout système
décisionnel qui permettra de donner accès aux données
existantes de l'organisation, sous une forme intégrée, de
faciliter leur interrogation croisée et massive pour les fins
d'analyse.
Ce système servira d'interface entre les
systèmes échangeant des données. Des données
contenues dans des fichiers soit Excel, soit Access, ou MySQL seront
chargées dans un entrepôt grâce à un outil
d'extraction, de transformation et de chargement appelé ETL.
Nous rendons hommage à notre prédécesseur
KAHLOULA BOUBAKAR qui a parlé sur le « Chargement de données
XML dans un data warehouse : Approche pour l'automatisation du Schema Matching
» pour l'obtention de son diplôme de Master en Informatique et
Automatique, Université d'Oran en République Algérienne
Démocratique et Populaire.
La différence entre nous est que lui, avait la
tâche de charger dans le data warehouse les données XML
uniquement, contrairement à nous qui irons à charger des
différents formats de données tels que Excel, Access, MySQL,
etc.
« Les sciences informatiques comme toutes les autres
branches des sciences possèdent des méthodes et des techniques
intrinsèques et inhérentes propres à leur nature. Leur
permettant ainsi d'apporter des réponses à leurs diverses
problématiques et d'évoluer en tant que domaine porteur des
nouvelles sciences et technologies.» [2]
En Ingénierie, il existe des méthodes et des
techniques répondant à une problématique
particulière, à la réutilisation des composants logiciels
ou à la construction des systèmes et infrastructures à
base des logiciels.
C'est pourquoi nous appréhenderons la démarche
de l'Unified Process (UP), une méthode générique,
incrémentale et itérative qui nous permettra bien-sûr de
mettre en évidence certains diagrammes et compléter la
systématique des modèles UML (Unified Modeling Language) pour la
conception de notre système.
Voilà que nous avons évoqué les mobiles
de notre choix sur ce projet. A présent, nous essayerons dans le
chapitre qui suit, de nous marteler sur le domaine du décisionnel en
5
Notre projet se focalisera au niveau de la vente, qui fera
l'objet ou le soubassement de décider sur la fabrication ou la
production d'un produit, d'une gamme au sein de la Brasimba.
En dehors de l'introduction générale et de la
conclusion générale, la structuration et l'organisation de nos
idées pour aboutir aux résultats, se tourneront autour de quatre
chapitres notamment :
? Chapitre I . Introduction au domaine du
décisionnel
Ce chapitre portera sur les aspects théoriques du domaine
des systèmes d'information d'aide à la décision, en
évoquant les définitions et les concepts relatifs aux
Entrepôts de données ou aux `Data warehouses' et à la
modélisation dimensionnelle.
? Chapitre II . Le stockage de données à la
Brasimba
Cette partie aura pour tâche de mettre en exergue
l'existant, la manière dont l'information est sauvegardée dans
l'entreprise, les types de bases opérationnelles utilisés, pour
en fait recenser les informations nécessaires à intégrer
dans l'entrepôt qui sera construit plus tard.
? Chapitre III . Analyse fonctionnelle
La modélisation du système, la conception d'un
entrepôt de données et l'analyse décisionnelle seront les
éléments-clefs de cette partie du t ravail.
? Chapitre IV . Architecture Logicielle
La description de l'architecture, l'implémentation
d'outils d'exploitation et la présentation des interfaces
hommes-machines de notre solution feront l'objet de ce chapitre.
A ce niveau, nous aurons à présenter et à
démonter l'outil d'intégration de données depuis une base
transactionnelle vers une base décisionnelle, celui de rapports, de
tableaux de bord et/ou de l'analyse décisionnelle.
La précision sur l'impact du déploiement des
systèmes décisionnels dans nos entreprises actuelles sera aussi
de mise dans cette dernière partie de notre travail.
6
passant bien évidemment par la connaissance de termes
et de concepts liés aux systèmes d'aide à la
décision.
7
CHAPITRE I : INTRODUCTION AU DOMAINE DU
DECISIONNEL
I.1. Introduction
Dans ce chapitre, il est question de nous accoutumer aux
systèmes décisionnels. Les concepts qui caractérisent ce
domaine, sa place et son enjeu dans des entreprises, certaines notions sur
l'architecture des data warehouses et l'introduction à la
modélisation dimensionnelle.
I.2. Les systèmes décisionnels I.2.1. Le
décisionnel
L'Informatique décisionnelle (Business Intelligence,
parfois appelée tout simplement le Décisionnel) est un ensemble
de moyens, d'outils et de méthodes permettant de collecter, de
consolider, de modéliser et de restituer les données d'une
entreprise en vue d'offrir une aide à la décision.
Jean-François PILLOU et Pascal CAILLEREZ qualifient
d'Informatique décisionnelle comme: « une exploitation des
données de l'entreprise dans le but de faciliter la prise des
décisions par les décideurs, c'est-à-dire la
compréhension du fonctionnement actuel et l'anticipation des actions
pour un pilotage éclairé de l'entreprise.» [3]
Nous disons donc qu'un système décisionnel est
un ensemble de solutions informatiques, un ensemble d'outils qui permettent une
prise de décisions tactiques ou stratégiques d'une
organisation.
Ce système est issu à la recherche de la nuance
du point de vue fonctionnel entre le système de pilotage et le
système opérationnel. Ces vraies différences seront
clairement définies dans les lignes qui suivent.
I.2.2. La place du décisionnel dans
l'entreprise
Un système de décision ou de pilotage est un
ensemble de personnel constituant le chapeau de l'organisation, car c'est ici
où se passe l'activité décisionnelle la plus importante
dans une organisation. Le décisionnel occupe évidemment une place
à ce niveau car il est certainement dédié au pilotage et
au management de l'entreprise.
Remarque : Les sources de
données internes et/ou externes étant souvent
hétérogènes tant sur le plan technique que sur le plan
sémantique, cette fonction occupe le trois-quarts d'un
8
I.2.3. L'enjeu du décisionnel
La prise de décisions stratégiques dans une
organisation nécessite le recours et le croisement de multiples
informations qui concernent plusieurs départements : Production,
Distribution, Ressources humaines, Achats, Ventes, Marketing, Service
après-vente, Maintenance, ... Or ces données sont
généralement :
? Eparpillées au sein des départements et non
connectées entre elles ;
? Hétérogènes dans leurs formats
techniques et leurs organisations structurelles, voire leurs sémantiques
;
? Implémentées pour l'action (par construction) et
non pour l'analyse.
? Volatiles, au sens où leur mise à jour peut
conduire à oublier des informations obsolètes.
L'enjeu des systèmes décisionnels est de donner
accès à ces données existantes dans l'organisation, sous
une forme intégrée, afin de faciliter leur interrogation massive
et croisée.
|