Etude et conception d'un datawarehouse et l'impact du déploiement d'un système décisionnel dans une société de vente et de productionpar Cédric MASSAMBA SENDWE Université protestante de Lubumbashi - Licence 2018 |
IV.3.1.2. Caractéristiques [11]L'une des grandes forces de Talend réside dans le fait de pouvoir se connecter à quasiment toutes les sources de données, applications métier et types de fichiers existants. Et, c'est grâce, à plus de 250 composants Talend utilisables par les développeurs. Parmi ses composants, on trouve différentes familles :
IV.3.1.4.Les composants Talend utilisésCi-dessous est reprise la liste des composants de Talend Open Studio for data Integration que nous avons utilisés : + Job : Ce composant constitue la couche d'exécution ou l'implémentation technique d'un Business Model. Il est la représentation graphique d'un ou plusieurs composants connectés, permettant de définir et d'exécuter les processus de gestion de flux de données. Il traduit les besoins métier en code, en routines ou en programmes, puis se charge d'exécuter ces derniers. En bref, le Job permet de mettre en place le flux de données. + TMap : est un composant avancé qui s'intègre au Studio Talend comme un plug-in, qui transforme et qui dirige les données à partir d'une ou plusieurs source (s) et vers une ou plusieurs destination(s). [12] Le Mapper est l'éditeur du tMap qui permet de définir les propriétés d'aiguillage et de transformation des données. + TFileInputExcel : Ce composant lit les fichiers Excel ou un flux de données ligne par ligne pour le scinder en champs et envoie les champs tels que définis dans le schéma au composant suivant du Job via une connexion Row. + TDBAccessInput/ TDBInput(MySQL) : est un composant qui exécute une requête en base de données selon un ordre strict et qui doit correspondre à celui défini dans le schéma. La liste des champs récupérée est ensuite transmise au composant suivant une connexion de flux (Main row). + TDBOutput(MySQL) : Ce composant écrit, met à jour, modifie ou supprime les données d'une base de données. Son objectif est d'exécuter l'action définie sur les ordres d'une table, en fonction du flux entrant provenant du composant précédent. L'étape d'extraction, de nettoyage et de transformation de données se termine par le chargement de ces données homogénéisées dans un environnement de stockage. [13] 65 IV.3.2. Outil de navigation dans les données : OlapCube Writer La construction des cubes sur les données de notre base est assurée par OlapCube. OlapCube est un outil conçu pour concevoir des modèles dimensionnels ou multidimensionnels, basés essentiellement sur la création des dimensions, et des faits et ainsi naviguer dans les données d'une base décisionnelle. Les raisons qui ont motivé notre choix sur l'utilisation de cet outil sont les suivantes : ? A l'aide de OlapCube Writer, la création (design) et la construction (build) des cubes sont aisées car cet outil se connecte directement à plusieurs sources de données comme Oracle, PostgreSQL, MySQL, Access, MariaDB, etc ; ? permet de lire ou de naviguer un cube grâce à
certaines ? Il est facile à utiliser même pour tout utilisateur légèrement averti. La version utilisée dans le cadre de notre travail est 3.0.3.0 et est téléchargeable sur https://www.softpedia.com/get/Internet/Servers/Database-Utils/OlapCube. IV.3.3. Outil de reporting : OlapCube Dashboard OlapCube Dashboard est un module intégré dans OlapCube Writer qui permet de générer une synthèse et de grouper des données selon les axes ou plusieurs de ses propres catégories. Nous utilisons cet outil dans ce travail pour la synthèse, l'analyse, exploration et la présentation de données de l'entrepôt. Nous avons mis notre choix sur outil pour son utilisation facile par les analystes, la production de tableaux de bord et le rapport. IV.4. Serveur des données du Data warehouse 66 Le lieu de stockage utilisé pour notre entrepôt est le MariaDB, le type de serveur de bases de données inclu dans le logiciel XAMPP. XAMPP est un ensemble de logiciels permettant de mettre facilement en place un serveur Web local, un serveur FTP et un serveur de messagerie électronique. Il s'agit d'une distribution de logiciels libres offrant une bonne souplesse d'utilisation, réputée pour son installation simple et rapide. Notre choix est porté sur ce logiciel parce qu'il héberge en son sein MariaDB, un serveur de bases de données libre. MariaDB est un système de gestion de base de données édité sous licence GPL. Il s'agit d'un projet s'inscrivant dans la démarche visant à remplacer MySQL à la suite du rachat de ce dernier par Oracle Corporation. Nous avons porté notre choix sur ce serveur non seulement parce qu'il est libre mais aussi facile et simple à utiliser sur tous les systèmes d'exploitation. La version 10.1.31 de MariaDB est celle que nous avons utilisée pour le stockage de données de notre Data warehouse dans le cadre de ce travail. 67 |
|