WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Etude et conception d'un datawarehouse et l'impact du déploiement d'un système décisionnel dans une société de vente et de production


par Cédric MASSAMBA SENDWE
Université protestante de Lubumbashi - Licence 2018
  

sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

JUILLET 2018

UNIVERSITE LIBERTE

FACULTE DES SCIENCES INFORMATIQUES

ETUDE ET CONCEPTION D'UN DATA WAREHOUSE ET
L'IMPACT DU DEPLOIEMENT D'UN SYSTEME DECISIONNEL
DANS UNE SOCIETE DE VENTE ET DE PRODUCTION
(CAS DE LA BRASIMBA)

Par MASSAMBA SENDWE Cédric

Travail présenté et défendu en vue de l'obtention du grade d'Ingénieur en Sciences Informatiques.

Option : Ingénierie des Systèmes d'Information

ANNEE ACADEMIQUE 2017-2018

UNIVERSITE LIBERTE

FACULTE DES SCIENCES INFORMATIQUES

ETUDE ET CONCEPTION D'UN DATA WAREHOUSE ET
L'IMPACT DU DEPLOIEMENT D'UN SYSTEME DECISIONNEL
DANS UNE SOCIETE DE VENTE ET DE PRODUCTION
(CAS DE LA BRASIMBA)

Par MASSAMBA SENDWE Cédric

Dirigé par Prof. Blaise FYAMA, PhD Codirecteur: Ass. Ruphin NYAMI

I

EPIGRAPHE

«L'invention scientifique réside dans la création d'une hypothèse heureuse et féconde ; elle est donnée par le sentiment ou le génie même du savant qui l'a créée.»

Claude Bernard

II

DEDICACE

A tout chercheur scientifique, particulièrement celui du domaine informatique
ayant la passion de bien vouloir appréhender, améliorer ou approfondir le sujet
traité dans ce travail [...]

III

AVANT-PROPOS

A toi Dieu source de toute créativité, créateur de l'univers, Père de notre Seigneur Jésus-Christ, me voici devant ta face pour exprimer ma gratitude et mes vifs remerciements suite à la bienveillance et ta grâce m'accordées depuis mon enfance jusqu'à aujourd'hui, reçois bien mon obligeance.

Monsieur le Doyen de la Faculté des Sciences Informatiques, le Professeur Blaise FYAMA, veuillez trouver ici l'expression de notre reconnaissance pour avoir dirigé ce travail avec amour malgré ce pain sur la planche qui guette quotidiennement votre porte.

Nous remercions toutes les autorités de l'Université Liberté plus particulièrement le Secrétaire Général Académique ainsi que le Doyen de la faculté des Sciences Informatiques pour leur encadrement tout au long de notre parcours académique.

Chers parents, MASSAMBA WA MASSAMBA Ferdinand et BANZE MOMA Anastasie, voici l'expression de ma parfaite reconnaissance pour le devoir que vous avez accompli et je vous demande de savourer dès maintenant le fruit de votre patience.

Nous n'oublierons pas d'expédier nos sentiments de remerciements à nos chers collègues, amis et compagnons de lutte de deuxième Grade ISI 2018, à l'Université Liberté.

A vous tous qui nous avez soutenu de loin ou de près, veuillez trouver ici l'expression de notre parfaite reconnaissance.

IV

LISTE DES FIGURES

Figure 1: Architecture globale d'un système décisionnel 11

Figure 2: Composants du DWH refermant la boucle 15

Figure 3: Architecture d'un Data Warehouse 16

Figure 4: Diagramme du cycle de vie d'un modèle dimensionnel 22

Figure 5: Modèle logique de données ventes (sources opérationnelles) 34

Figure 6 : Diagramme de cas d'utilisation du système décisionnel 39

Figure 7:DSS DU CU « S'authentifier » 40

Figure 8 : DSS DU CU « Alimenter l'entrepôt » 41

Figure 9: DSS DU CU "Gérer comptes utilisateurs" 43

Figure 10: DSS DU CU « Analyser les données » 45

Figure 11 : DSS DU CU « Visualiser les cubes des données » 46

Figure 12:DCP du CU « S'authentifier » 47

Figure 13: DCP du CU « alimenter entrepôt » 48

Figure 14: DCP du CU « Gérer comptes utilisateurs » 48

Figure 15: DCP du CU « Analyser les données » 49

Figure 16: DCP du CU « Visualiser les cubes des données » 50

Figure 17 : Diagramme de classes de conception 51

Figure 18: Modèle logique des données 51

Figure 19: Modèle dimensionnel en flocon 53

Figure 20 : Modèle dimensionnel en étoile du fait Vente 59

Figure 21: Représentation des sources Excel 61

Figure 22: Représentation des sources Access 62

Figure 23: Représentation des sources MySQL 62

Figure 24: Architecture technique proposée 67

Figure 25: Importation des fichiers sources 69

Figure 26 : Création de connexion pour les sources externes 1ère étape 69

Figure 27: Création de connexion pour les sources externes 2e étape 70

Figure 28 : Récupération du schéma : 1ère étape 70

Figure 29: Récupération du schéma : 2e étape 71

Figure 30: Création des Jobs 71

Figure 31: Extraction et transformation des données sources 72

Figure 32: Correspondance des champs 72

Figure 33: Chargement des données dans l'entrepôt 73

Figure 34: Connexion à l'entrepôt 1ère étape 73

Figure 35: Création des dimensions et des mesures 74

V

Figure 36: Connexion à l'entrepôt 2e étape 74

Figure 37: Les clients autour de toutes les zones commerciales de Lubumbashi 75

Figure 38: La liste de clients autour d'une commune (Commune de Ruashi) 75

Figure 39: Le comportement du produit SIMBA 73CL autours de toutes les communes de la ville 76

Figure 40: Tableau de bord du comportement de tous les produits 76

Figure 41: Tableau de bord du comportement de tous les produits vendus dans la commune de Katuba 77 Figure 42: Statistiques de tous les produits dans toutes les zones commerciales 77

VI

LISTE DES TABLEAUX

Tableau 1: Comparaison entre les systèmes transactionnels et systèmes décisionnels 18

Tableau 2: Eléments constitutifs d'un modèle relationnel 29

Tableau 3 : Liste de tous les produits de la Brasimba 32

Tableau 4: Exemple de la fiche de ventes pour le secteur Ville-Est 33

Tableau 5: Tableau des acteurs 38

Tableau 6: Liste de propriétés de la dimension Produit 55

Tableau 7: Liste de propriétés de la dimension Client 55

Tableau 8 : Liste de propriétés de la dimension Periode 55

Tableau 9: Liste de propriétés de la dimension ZoneCommerciale 56

Tableau 10: Liste des propriétés de la table des faits Vente 56

Tableau 11: Outils du décisionnel utilisés 68

Tableau 12: Environnement d'exécution 68

VII

LISTE DES SIGLES ET ABREVIATIONS

AS400 : Application System/400

BD : Base de données

CRM : Customer Relationship Management

CSV : Comma-separated values

CU : Cas d'utilisation

DBA : Database administrator

DCU : Diagramme de cas d'utilisation

DCP : Diagramme de classes participantes

DM : Data mart

DSS : Diagramme de séquence système

DWH : Data warehouse

EAI : Echange de données Inter-Applications

ERP : Entreprise Ressources Planing

ESB : Enterprise Service Bus

ETC : Extraction, transformation et Chargement

ETL : Extract-Transform-Load

FK : Foreign key

FTP : File Transfert Protocol

GB : Gigabyte

GPL : General Public License

HTML : Hypet Text Markup Language

HTTP : Hypertext Transfer Protocol

KPI : Key Performance Indicator

MLD : Modèle logique de données

ODBC : Open Database Connectivity

OLAP : OnLine Analytical Processing

OLTP : OnLine Transaction Processing

OS : Operating System

PHP : Hypertext Preprocessor

PK : Primary Key

QBE : Query by Example

SAP : Systems, Applications and Products for data processing

SGBD : Système de gestion de base de données

SGBDR : Système de gestion de bases de données relationnelles

SI : Système d'information

VIII

SID : Système d'information décisionnel

SQL : Structured Query Language

SSH : Secure Shell

TB : Terabyte

TCD : Tableau croisé dynamique

TOS : Talend Open Studio

TOS DI : Talend Open Studio for Data Integration

TXT : Text

VBA : Visual Basic for Applications

UML : Unified Modeling Language

UP : Unified Process

URL : Uniform Resource Locator

WWW : World Wide Web

XAMPP : X (cross) apache MariaDB Perl PHP

XML : eXtensible Markup Language

1

INTRODUCTION GENERALE

« L'une des plus grandes richesses d'une entreprise est son information. » [1]

La conservation et le stockage de celle-ci se base sur la structuration et la normalisation des données sur un support, c'est l'objectif premier des bases de données.

Dans une entreprise de grande envergure, l'information est stockée sous diverses formes et de manière éparpillée, éparse et hétérogène car chaque service peut éventuellement utiliser plusieurs applications dont les données sont structurées et codifiées de manière différente par rapport aux autres services.

Cette approche ne facilite pas la tâche aux décideurs qui doivent prendre des décisions stratégiques et pertinentes dans un temps aussi court que raisonnable car ils ne peuvent avoir la vision globale de l'entreprise vu que ces données sont collectées pour un objectif purement transactionnel et non pas décisionnel.

Or, les dirigeants des entreprises, quel qu'en soit le domaine d'activités d'ailleurs, doivent être en mesure de mener à bien les missions qui leur incombent en la matière et doivent prendre notamment les décisions les plus opportunes.

Ces décisions qui influeront grandement sur la stratégie de l'entreprise, et donc sur son devenir, ne doivent pas être prises ni à la légère, ni de manière trop hâtive, compte tenu de leurs conséquences sur la survie de l'entreprise. Il s'agira de prendre des décisions fondées, basées sur des informations claires, fiables et pertinentes.

Pour avoir une vision globale de l'entreprise, il est nécessaire de réunir toutes ces informations provenant des sources transactionnelles ou opérationnelles.

Ces données seront alors transformées, filtrées, croisées et reclassées afin de les intégrer dans un endroit spécifique pour que les responsables et analystes des entreprises aient une connaissance de ces données à un niveau global et ainsi leur permettre la prise des décisions de façon sûre en se basant sur les faits.

Or, pour avoir une meilleure vue de ces données, sous plusieurs axes, afin de permettre aussi une meilleure analyse, la solution consistera à l'utilisation et la réutilisation de ces données collectées, qui malheureusement ne peuvent plus être gérées à l'aide des bases de données classiques en fonction de leur volume et de leur éventuelle hétérogénéité.

En voulant répondre aux besoins de ses consommateurs, aux attentes du marché et en observant parallèlement la crise économique qui frappe l'humanité actuellement,

2

C'est dans ce contexte que les « systèmes décisionnels » ont vu le jour. Ils offrent aux décideurs des informations de qualité sur lesquelles ils pourront s'appuyer pour arrêter leurs choix décisionnels.

Ces systèmes utilisent un large éventail de technologies et de méthodes, dont les «Entrepôts de données » ou « Data warehouses » représentent l'élément principal et incontournable pour la mise en place d'un bon système décisionnel, permettant ainsi une analyse claire et pertinente de données de l'entreprise.

La Brasimba est une société de production, de vente, et de distribution des boissons installée au numéro 1200, avenue N'Djamena à Lubumbashi en République Démocratique du Congo.

Filiale du groupe CASTEL, leader dans l'industrie brassicole sur le marché d'Afrique Francophone, cette société a pour vision d'être leader en industrie et en distribution des boissons dans le cadre d'une production moderne, efficace, performante, et citoyenne dans notre pays.

Elle est une société commerciale qui a aussi pour mission d'assurer la distribution et la qualité constante des produits aux meilleurs prix tout en perpétuant son savoir-faire brassicole, et ne cesse de cultiver sa passion pour l'innovation d'une gamme variée de boissons d'une extrême qualité pour le goût des consommateurs.

Cette société s'est inscrite dans la production et dans la commercialisation de ses marques et de ses gammes entre autres : la bière, l'alcool mix, les boissons gazeuses, les boissons énergisantes ainsi que de l'eau minérale. La chaine Marketing-Vente-Distribution assure l'écoulement de ses produits.

Evoluant dans un environnement fortement complexe et hautement concurrentiel, ce climat de forte concurrence exige de cette entreprise une surveillance très étroite du marché afin de ne pas se laisser distancer par les concurrents et cela en répondant, le plus rapidement possible, aux attentes du marché, de sa clientèle et de ses partenaires.

3

l'utilisation du principe de ne privilégier que l'essentiel doit être de mise pour espérer toujours une croissance et une stabilité économique.

La question est : Comment arriver à homogénéiser ces informations naturellement hétérogènes afin d'effectuer des analyses pour la prise des décisions ?

Cette question est la préoccupation majeure des responsables d'entreprise qui ont besoin de :

+ Savoir le comportement d'une marque par rapport aux critères temporel, géographique, et démographique ;

+ Trouver toutes les marques de produits vendues au cours d'une certaine période ; + Détailler les ventes totales des marques par secteur, par commune, ou par région ; + Connaître le coût et le chiffre d'affaires...

Eu égard à ce qui précède, la société procédera à se poser les questions suivantes :

+ Qu'a-t-on vendu ?

+ Quel est le total des ventes d'une marque en une certaine période ?

+ Quel est le total des ventes d'une marque par secteur, par commune ?

+ Quelles sont les marques les plus vendues dans un secteur, dans une commune, dans

une ville, dans une région ?

Voilà quelques-unes des préoccupations qui retiennent l'esprit du décideur qui désire améliorer ses performances décisionnelles sur base des données pouvant lui éclairer et lui faciliter une prise de décision prompte en connaissance des causes et des faits.

La résolution à ce problème serait donc de modéliser un système qui requiert la mise en place d'un entrepôt de données fiable, contenant les informations nécessaires à l'accomplissement des processus décisionnels pour permettre aux décideurs de savoir cibler plus précisément les consommateurs d'une marque dans un secteur et à une période donnés.

Le présent projet tendra à donner réponse à toutes ces questions car nous concevrons un système capable de consolider les données issues des systèmes transactionnels, et d'offrir aux décideurs des informations fiables.

Etant donné qu'un entrepôt de données est un type de base orienté sujet, les données collectées seront orientées `métier' et donc triées par thème.

4

L'objectif attendu de ce projet est de concevoir un Data warehouse, l'élément primordial de tout système décisionnel qui permettra de donner accès aux données existantes de l'organisation, sous une forme intégrée, de faciliter leur interrogation croisée et massive pour les fins d'analyse.

Ce système servira d'interface entre les systèmes échangeant des données. Des données contenues dans des fichiers soit Excel, soit Access, ou MySQL seront chargées dans un entrepôt grâce à un outil d'extraction, de transformation et de chargement appelé ETL.

Nous rendons hommage à notre prédécesseur KAHLOULA BOUBAKAR qui a parlé sur le « Chargement de données XML dans un data warehouse : Approche pour l'automatisation du Schema Matching » pour l'obtention de son diplôme de Master en Informatique et Automatique, Université d'Oran en République Algérienne Démocratique et Populaire.

La différence entre nous est que lui, avait la tâche de charger dans le data warehouse les données XML uniquement, contrairement à nous qui irons à charger des différents formats de données tels que Excel, Access, MySQL, etc.

« Les sciences informatiques comme toutes les autres branches des sciences possèdent des méthodes et des techniques intrinsèques et inhérentes propres à leur nature. Leur permettant ainsi d'apporter des réponses à leurs diverses problématiques et d'évoluer en tant que domaine porteur des nouvelles sciences et technologies.» [2]

En Ingénierie, il existe des méthodes et des techniques répondant à une problématique particulière, à la réutilisation des composants logiciels ou à la construction des systèmes et infrastructures à base des logiciels.

C'est pourquoi nous appréhenderons la démarche de l'Unified Process (UP), une méthode générique, incrémentale et itérative qui nous permettra bien-sûr de mettre en évidence certains diagrammes et compléter la systématique des modèles UML (Unified Modeling Language) pour la conception de notre système.

Voilà que nous avons évoqué les mobiles de notre choix sur ce projet. A présent, nous essayerons dans le chapitre qui suit, de nous marteler sur le domaine du décisionnel en

5

Notre projet se focalisera au niveau de la vente, qui fera l'objet ou le soubassement de décider sur la fabrication ou la production d'un produit, d'une gamme au sein de la Brasimba.

En dehors de l'introduction générale et de la conclusion générale, la structuration et l'organisation de nos idées pour aboutir aux résultats, se tourneront autour de quatre chapitres notamment :

? Chapitre I . Introduction au domaine du décisionnel

Ce chapitre portera sur les aspects théoriques du domaine des systèmes d'information d'aide à la décision, en évoquant les définitions et les concepts relatifs aux Entrepôts de données ou aux `Data warehouses' et à la modélisation dimensionnelle.

? Chapitre II . Le stockage de données à la Brasimba

Cette partie aura pour tâche de mettre en exergue l'existant, la manière dont l'information est sauvegardée dans l'entreprise, les types de bases opérationnelles utilisés, pour en fait recenser les informations nécessaires à intégrer dans l'entrepôt qui sera construit plus tard.

? Chapitre III . Analyse fonctionnelle

La modélisation du système, la conception d'un entrepôt de données et l'analyse décisionnelle seront les éléments-clefs de cette partie du t ravail.

? Chapitre IV . Architecture Logicielle

La description de l'architecture, l'implémentation d'outils d'exploitation et la présentation des interfaces hommes-machines de notre solution feront l'objet de ce chapitre.

A ce niveau, nous aurons à présenter et à démonter l'outil d'intégration de données depuis une base transactionnelle vers une base décisionnelle, celui de rapports, de tableaux de bord et/ou de l'analyse décisionnelle.

La précision sur l'impact du déploiement des systèmes décisionnels dans nos entreprises actuelles sera aussi de mise dans cette dernière partie de notre travail.

6

passant bien évidemment par la connaissance de termes et de concepts liés aux systèmes d'aide à la décision.

7

CHAPITRE I : INTRODUCTION AU DOMAINE DU DECISIONNEL

I.1. Introduction

Dans ce chapitre, il est question de nous accoutumer aux systèmes décisionnels. Les concepts qui caractérisent ce domaine, sa place et son enjeu dans des entreprises, certaines notions sur l'architecture des data warehouses et l'introduction à la modélisation dimensionnelle.

I.2. Les systèmes décisionnels I.2.1. Le décisionnel

L'Informatique décisionnelle (Business Intelligence, parfois appelée tout simplement le Décisionnel) est un ensemble de moyens, d'outils et de méthodes permettant de collecter, de consolider, de modéliser et de restituer les données d'une entreprise en vue d'offrir une aide à la décision.

Jean-François PILLOU et Pascal CAILLEREZ qualifient d'Informatique décisionnelle comme: « une exploitation des données de l'entreprise dans le but de faciliter la prise des décisions par les décideurs, c'est-à-dire la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de l'entreprise.» [3]

Nous disons donc qu'un système décisionnel est un ensemble de solutions informatiques, un ensemble d'outils qui permettent une prise de décisions tactiques ou stratégiques d'une organisation.

Ce système est issu à la recherche de la nuance du point de vue fonctionnel entre le système de pilotage et le système opérationnel. Ces vraies différences seront clairement définies dans les lignes qui suivent.

I.2.2. La place du décisionnel dans l'entreprise

Un système de décision ou de pilotage est un ensemble de personnel constituant le chapeau de l'organisation, car c'est ici où se passe l'activité décisionnelle la plus importante dans une organisation. Le décisionnel occupe évidemment une place à ce niveau car il est certainement dédié au pilotage et au management de l'entreprise.

Remarque : Les sources de données internes et/ou externes étant souvent hétérogènes tant sur le plan technique que sur le plan sémantique, cette fonction occupe le trois-quarts d'un

8

I.2.3. L'enjeu du décisionnel

La prise de décisions stratégiques dans une organisation nécessite le recours et le croisement de multiples informations qui concernent plusieurs départements : Production, Distribution, Ressources humaines, Achats, Ventes, Marketing, Service après-vente, Maintenance, ... Or ces données sont généralement :

? Eparpillées au sein des départements et non connectées entre elles ;

? Hétérogènes dans leurs formats techniques et leurs organisations structurelles, voire leurs sémantiques ;

? Implémentées pour l'action (par construction) et non pour l'analyse.

? Volatiles, au sens où leur mise à jour peut conduire à oublier des informations obsolètes.

L'enjeu des systèmes décisionnels est de donner accès à ces données existantes dans l'organisation, sous une forme intégrée, afin de faciliter leur interrogation massive et croisée.

sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Nous devons apprendre à vivre ensemble comme des frères sinon nous allons mourir tous ensemble comme des idiots"   Martin Luther King