WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Etude et conception d'un datawarehouse et l'impact du déploiement d'un système décisionnel dans une société de vente et de production


par Cédric MASSAMBA SENDWE
Université protestante de Lubumbashi - Licence 2018
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

IV.3.1.2. Caractéristiques [11]

L'une des grandes forces de Talend réside dans le fait de pouvoir se connecter à quasiment toutes les sources de données, applications métier et types de fichiers existants. Et, c'est grâce, à plus de 250 composants Talend utilisables par les développeurs. Parmi ses composants, on trouve différentes familles :

· Applications Métier (Mode Ecriture, Lecture) : Microsoft CRM, SAP, Sage CRM, Salesforce, SugarCRM, ...

· Base de données (Mode Ecriture, Lecture) : AS400, MS SQL, Oracle, DB2, MySQL, PostgreSQL, Access, ODBC, ...

· Fichier (Mode Ecriture, Lecture) : Excel, CSV, TXT, ...

· Internet : FTP, WebServices, HTTP, SSH, ...

· Orchestration. : Fusion des flux, Réplication des flux, mise en attente de l'exécution, itération sur l'ensemble du contenu d'un répertoire, ...

· Qualité de données : Unicité des données, remplacement de caractère dans une chaîne, changement de l'encodage d'un fichier, ...

· Transformation : Agrégation, Conversion de type, Filtre, Tri, Mappage.

· XML.

IV.3.1.3. Avantages de Talend Open Studio

· Portabilité de l'espace de travail optimisé grâce au référentiel sous forme de fichier ;

· Talend tire parti des avantages de Java : portabilité, puissance,...

· Interface intuitive basée sur Eclipse ;

· Vue graphique des jobs grâce aux interfaces graphiques élaborées des composants ;

· Possibilité de créer de nouveaux composants ;

64

· Communauté active ;

· Talend est compatible quel que soit l'OS car le résultat des développements est en fait un compilé JAVA ;

· Talend Open Studio est gratuit pour un utilisateur sur le référentiel.

IV.3.1.4.Les composants Talend utilisés

Ci-dessous est reprise la liste des composants de Talend Open Studio for data Integration que nous avons utilisés :

+ Job : Ce composant constitue la couche d'exécution ou l'implémentation technique

d'un Business Model. Il est la représentation graphique d'un ou plusieurs composants connectés, permettant de définir et d'exécuter les processus de gestion de flux de données. Il traduit les besoins métier en code, en routines ou en programmes, puis se charge d'exécuter ces derniers.

En bref, le Job permet de mettre en place le flux de données.

+ TMap : est un composant avancé qui s'intègre au Studio Talend comme un plug-in,

qui transforme et qui dirige les données à partir d'une ou plusieurs source (s) et vers une ou plusieurs destination(s). [12]

Le Mapper est l'éditeur du tMap qui permet de définir les propriétés d'aiguillage et de transformation des données.

+ TFileInputExcel : Ce composant lit les fichiers Excel ou un flux de données ligne

par ligne pour le scinder en champs et envoie les champs tels que définis dans le schéma au composant suivant du Job via une connexion Row.

+ TDBAccessInput/ TDBInput(MySQL) : est un composant qui exécute une requête

en base de données selon un ordre strict et qui doit correspondre à celui défini dans le schéma. La liste des champs récupérée est ensuite transmise au composant suivant une connexion de flux (Main row).

+ TDBOutput(MySQL) : Ce composant écrit, met à jour, modifie ou supprime les

données d'une base de données. Son objectif est d'exécuter l'action définie sur les ordres d'une table, en fonction du flux entrant provenant du composant précédent.

L'étape d'extraction, de nettoyage et de transformation de données se termine par le chargement de ces données homogénéisées dans un environnement de stockage. [13]

65

IV.3.2. Outil de navigation dans les données : OlapCube Writer

La construction des cubes sur les données de notre base est assurée par OlapCube. OlapCube est un outil conçu pour concevoir des modèles dimensionnels ou multidimensionnels, basés essentiellement sur la création des dimensions, et des faits et ainsi naviguer dans les données d'une base décisionnelle.

Les raisons qui ont motivé notre choix sur l'utilisation de cet outil sont les suivantes :

? A l'aide de OlapCube Writer, la création (design) et la construction (build) des cubes sont aisées car cet outil se connecte directement à plusieurs sources de données comme Oracle, PostgreSQL, MySQL, Access, MariaDB, etc ;

? permet de lire ou de naviguer un cube grâce à certaines
opérations OLAP incorporées sous forme de boutons ;

? Il est facile à utiliser même pour tout utilisateur légèrement averti.

La version utilisée dans le cadre de notre travail est 3.0.3.0 et est téléchargeable sur https://www.softpedia.com/get/Internet/Servers/Database-Utils/OlapCube.

IV.3.3. Outil de reporting : OlapCube Dashboard

OlapCube Dashboard est un module intégré dans OlapCube Writer qui permet de générer une synthèse et de grouper des données selon les axes ou plusieurs de ses propres catégories.

Nous utilisons cet outil dans ce travail pour la synthèse, l'analyse, exploration et la présentation de données de l'entrepôt.

Nous avons mis notre choix sur outil pour son utilisation facile par les analystes, la production de tableaux de bord et le rapport.

IV.4. Serveur des données du Data warehouse

66

Le lieu de stockage utilisé pour notre entrepôt est le MariaDB, le type de serveur de bases de données inclu dans le logiciel XAMPP.

XAMPP est un ensemble de logiciels permettant de mettre facilement en place un serveur Web local, un serveur FTP et un serveur de messagerie électronique. Il s'agit d'une distribution de logiciels libres offrant une bonne souplesse d'utilisation, réputée pour son installation simple et rapide.

Notre choix est porté sur ce logiciel parce qu'il héberge en son sein MariaDB, un serveur de bases de données libre.

MariaDB est un système de gestion de base de données édité sous licence GPL. Il s'agit d'un projet s'inscrivant dans la démarche visant à remplacer MySQL à la suite du rachat de ce dernier par Oracle Corporation.

Nous avons porté notre choix sur ce serveur non seulement parce qu'il est libre mais aussi facile et simple à utiliser sur tous les systèmes d'exploitation.

La version 10.1.31 de MariaDB est celle que nous avons utilisée pour le stockage de données de notre Data warehouse dans le cadre de ce travail.

67

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"L'ignorant affirme, le savant doute, le sage réfléchit"   Aristote