WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Conception d'un datamart pour le pilotage du système de gestion des impôts. Cas de la direction générale des impôts.

( Télécharger le fichier original )
par Héritier KIAKA MUSITU
Université Pédagogique Nationale - Licence 2011
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

REPUBLIQUE DEMOCRATIQUE DU CONGO
MINISTERE DE L'ENSEIGNEMENT SUPERIEUR ET UNIVERSITAIRE

UNIVERSITE PEDAGOGIQUE NATIONALE

FACULTE DES SCIENCES

DEPARTEMENT DE MATHEMATIQUE ET INFORMATIQUE

B.P. 8815

KINSHASA / NGALIEMA

CONCEPTION D'UN DATAMART POUR LE PILOTAGE DU SYSTEME DE GESTION DES IMPOTS

« CAS DE LA DIRECTION GENERALE DES IMPOTS »

KIAKA MUSITU Héritier

Mémoire présenté et défendu en vu de l'obtention du titre de Licencié en sciences Option : Mathématique - Informatique Orientation : Conception des Systèmes

d'Informations

Directeur : ENGOMBE WEDI Boniface

Professeur

Co-directeur : Jean-Louis KAZADI

Chef de Travaux

Année Académique 2010 - 2011

Page 2 sur 91

O. INTRODUCTION

0.1. PROBLEMATIQUE ET HYPOTHESE

Dans les entreprises, actuellement l'informatique est devenue une discipline à part entière souvent organisée. Cela est l'aboutissement logique de l'évolution et de l'importance de cette discipline dans les différents domaines scientifique, commercial, et autres. Il est actuellement un fait établi que l'informatique peut être considérée comme l'élément moteur principal du développement des entreprises car la performance d'une entreprise dépend aussi de sa qualité de prise de décision.

Les entreprises sont confrontées à une concurrence de plus en plus forte, des clients de plus en plus exigeants, dans un contexte organisationnel de plus en plus complexe et mouvant.

Pour faire face aux nouveaux enjeux, l'entreprise doit collecter, traiter, analyser les informations de son environnement pour anticiper les stratégies. Mais cette information produite par l'entreprise est surabondante, non organisée et éparpillée dans de multiples systèmes opérationnels hétérogènes et peut provenir de toutes les places de marchés (mondialisation des échanges).

Il devient fondamental de rassembler et d'homogénéiser les données afin de permettre l'analyse des indicateurs pertinents pour faciliter la prise de décisions.

Pour répondre aux besoins de nos entreprises le cas cité ici la Direction Générale des Impôts (DGI), le nouveau rôle de l'informatique décisionnelle est de définir et d'intégrer une architecture qui serve de fondation aux applications décisionnelle : le datamart qui résoudra les difficultés de l'analyser de la masse d'informations à la D.G.I

Mémoire KIAKA MUSITU Héritier Page 2

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 3 sur 91

Nous pensons que l'informatique décisionnelle dans son aspect « entrepôt de données» est une solution au problème de prise de décision de l'organisation au vu de son contexte, de ses contraintes, de ses objectifs poursuivis sur les plans sécurité, développement et rentabilité ou encore performance.

C'est ainsi que la conception d'un datamart pour l'analyse multidimensionnelle des ressources financières, semble être la solution idoine (adéquate) aux problèmes ci-haut évoqués.

0.2. CHOIX ET INTERET DU SUJET

L'intérêt qui nous a conduits à rédiger ce mémoire et à choisir ce thème d'étude « Conception d'un datamart pour le pilotage des systèmes de gestion des impôts cas de la direction générale des impôts» est justifié par les raisons suivantes :

Les entreprises, après avoir informatisé les principales activités ou secteur pour leur survie journalière (gestion de recette, facturation, comptabilité, gestion de stocks et vente, et autres) se trouvent en face de nombreuses difficultés de regrouper les données de l'entreprise pour des fins analytiques et pour aider à la décision stratégique. La décision stratégique est une action entreprise par les décideurs de l'entreprise et qui vise à améliorer, quantitativement ou qualitativement la performance de l'entreprise. L'entrepôt de données est la seule alternative pour modéliser de l'information pour des fins analytiques. D'où l'importance de renseigner nos lecteurs intéressés sur la conception d'un datamart (magasin de données).

Mémoire KIAKA MUSITU Héritier Page 3

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 4 sur 91

0. 3. DELIMITATION DU SUJET

La conception d'un entrepôt de données pour l'analyse multidimensionnelle de la masse d'argent payé par les contribuables de la DGI constitue une matière très vaste et complexe à développer. Ainsi, compte tenu du temps qui nous est imparti, nous nous sommes limités à la conception d'un datamart pour l'analyse multidimensionnelle des mouvements de paiement d'impôts. Celui-ci servira à l'analyse de différents faits suivant des dimensions variées.

0.4. METHODES ET TECHNIQUES UTILISEES

Tout travail scientifique doit se soumettre à des exigences méthodologiques afin de rendre sa démarche intelligible et logique.

0.4.1. Méthodes

Définition :

R. Pinto et Madeleine Grawitz disent que la méthode est l'ensemble des opérations intellectuelles par les quelles une discipline cherche à atteindre les vérités qu'elle poursuit, les démontrent, les vérifient. Ainsi, la réalisation d'un travail scientifique ne peut se faire sans l'utilisation systématique de méthode de recherche. Elle est une voie rationnelle de traitement de données relative à l'objet étudié.

En ce qui nous concerne, la méthode historique nous a permis de connaitre l'évolution des différentes notions de base sur l'informatique décisionnelle et la méthode d'analytique nous a sévi à l'examen de plusieurs cas d'analyse multidimensionnelle des données.

Mémoire KIAKA MUSITU Héritier Page 4

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 5 sur 91

0.4.2. Techniques

Nul n'ignore le rôle que jouent les techniques pour toute investigation scientifique. En effet, nous la définissons comme un outil que le chercheur utilise pour recueillir les données indispensable à l'élaboration d'un travail scientifique.

Nous avons recouru essentiellement à la technique documentaire, elle a constitué la base et le soubassement de notre étude du fait qu'elle est précise et rigoureuse. Il a été pour nous opportun de consulter les livres, les revues, les mémoires, les notes, les cours, internet et etc.

Mémoire KIAKA MUSITU Héritier Page 5

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 6 sur 91

Chapitre Premier : GENERALITES SUR L'INFORMATIQUE DECISIONNELLE

I.1. INTRODUCTION

Le développement et l'intégration de diverses applications au sein des entreprises génèrent un patrimoine de données éparses et hétérogènes. Dans un monde où l'informatique apparait comme une donnée stratégique, retrouver toutes les données associées à un sujet particulier (un contribuable, un consommateur, un vendeur, un produit, ou une autre activité) est capital pour l'entreprise.

Il ne s'agit pas seulement, d'obtenir un accès rapide, unifié et fiable à l'information, mais beaucoup plus permettre une analyse fine des données contenues dans un système d'information (évaluation, des bilans, des rapports, etc.). C'est dans cette lancée que les entreprises puisent toute leur compétitivité face à une concurrence effrénée.

I.2. SYSTEME D'INFORMATION

L'information est représentée par les données. C'est-à-dire des formes écrites (textes, nombres ...), picturales (graphique, dessin, photos, vidéo ...), sonore, etc.

Ces données sont matérialisées sur des supports (papier, écrans, bandes magnétiques, disquettes. CD ...). A ces représentations, un être humain, une organisation ou une machine (ordinateur, robot ...) attache une signification susceptible d'entrainer une modification immédiate ou différée de son comportement.

L'exemple 1 : Un automobiliste voyant les lettres STOP sur un panneau rouge octogonal (données) arrête sa voiture (comportement).

Mémoire KIAKA MUSITU Héritier Page 6

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 7 sur 91

Exemple 2 : Un client ayant reçu une facture (données) prend son téléphone (comportement) pour donner un ordre de virement à sa banque (données) ; l'ordinateur de la banque recevant de la ligne téléphonique les chiffres composant le virement (données) effectue diverses opérations (comportement).

On peut définir une information comme étant l'accroissement de connaissance découlant de l'interprétation d'un ensemble de données. Cette interprétation est le fait d'un acteur humain ou mécanique. D'ailleurs l'application de l'informatique à la gestion des organisations humaines manipule de l'information : devis, commandes, factures, ordres de paiement, fiches de paie, fiche fiscales : écritures comptables : planning ; etc. Cette information reflète les flux de matières (fabrications, achats, ventes ...). Les flux financiers, les échanges de services qui forment la matière de l'activité de l'entreprise, reçue par les acteurs de l'organisation, elle commande leur comportement échantillonnée et synthétisée. Elle éclaire et supporte les décisions aux différents niveaux de responsabilité dans l'organisation.

SYSTEME DE
DECISION/PILOTAGE

Si, d'après J. de ROSNAY. « Un système est un ensemble d'éléments en interaction dynamique, organisés en fonction d'un but » [2], on peut, à la suite notamment des acteurs de la méthode MERISE distinguer au sein du système qu'est toute entreprise ou organisation les trois sous-systèmes schématisés sur la figure suivante.

SYSTEME
D'INFORMATION

SYSTEME OPERANT

Figure. n°1 Système d'Information

Mémoire KIAKA MUSITU Héritier Page 7

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 8 sur 91

Les fonctions d'un système d'information sont de conserver (mémoriser), créer (transformer) et communiquer (diffuser) de l'information, plus précisément : des données que les acteurs interprètent.

De nos jours, les acteurs du traitement de l'information sont les hommes et les machines, et un système d'information est partiellement autorisé ; les opérations sont « programmées )) sur des ordinateurs. «Manuelles )) ou « interactives » (c'est -à-dire mettant en communication immédiate les acteurs humains et mécanique) ... Nous appellerons applications informatiques. « Application de l'informatique )) serait plus correct, les parties automatisées d'un système d'information.

I.3. L'INFORMATION DECISIONNELLE

L'informatique décisionnelle ou BI (Business Intelligence) désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la décision et de permettre aux décideurs de la stratégie d'entreprise d'avoir une vue globale de l'activité traitée au sein de l'entreprise.

Généralement lorsqu'on parle de l'informatique décisionnelle ; une entreprise est généralement composée de plusieurs services tels que les ressources humaines, les services comptabilité, marketing, commercial, technique... Tous conservent des informations propres à leurs fonctions : listes des clients ou contribuables, des employés, chiffres, emplois du temps... L'accumulation de ces données nécessite donc leur sauvegarde dans le but d'une future exploitation. On constate ainsi régulièrement que chaque service possède son tableau de bord, ce qui lui permet de mesurer ou encore évaluer les indicateurs de performance de l'entreprise (chiffre d'affaire, calculs de bénéfices de l'année...). Cependant, chaque service a bien souvent sa façon de stocker ses informations peut être aussi dans différents formats (par exemple dans un fichier Excel, une base de données MySQL, Access, SQL Serveur...), et

Mémoire KIAKA MUSITU Héritier Page 8

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 9 sur 91

sa manière de calculer les indicateurs, avec sa vérité et ses critères. Ainsi, si l'on veut considérer les données de l'entreprise dans son ensemble, la tâche s'avère rude voire parfois impossible.

Pourtant, cela constituerait une utilité évidente et un réel apport à la société. En effet, une mise en relation et une analyse de toutes les données permettraient de réaliser des études et des prévisions sur le comportement et la santé de l'entreprise.

Le monde décisionnel analyse des données agrégées pour mieux apprécier l'ensemble de l'activité de l'entreprise. L'aide à la prise de décision est la responsabilité de quelques personnes dans l'entreprise (décideurs). En effet, les décideurs s'intéressent à l'ensemble de l'activité et souhaitent avoir une vue globale de la société.

Dans le monde décisionnel, on ne supprime jamais des données, on archive. Les outils de BI (business intelligent) permettent une exploitation rationnelle et coopérative des données (contrairement à l'informatique de gestion ou l'on produit de l'information pour la majorité des cas grâce aux bases de données relationnelles).

Retenons que le but de l'informatique décisionnelle est d'apporter une vision globale des données de l'entreprise, afin de répondre aux problématiques de celle-ci, ou tout simplement, afin de l'évaluer, et non de prendre décision au sein de l'entreprise. Mais c'est un outil d'aide afin de permettre aux décideurs d'avoir une vue globale sous plusieurs dimensions de l'entreprise en un temps record pour analyser les indicateurs ou axes de performances.

Mémoire KIAKA MUSITU Héritier Page 9

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 10 sur 91

Le schéma ci-dessous illustre cela :

Figure. n°2 Solution Business Intelligence

I.3.I. Business intelligente dans le système d'information

Ce que nous appelons aujourd'hui système d'information est un ensemble organisé mais hétérogène de composants automatiques et / ou semi - automatiques de traitement de données dont chacun est prioritairement destiné à soutenir une activité opérationnelle particulière.

Incidemment, chacun de ces composants peut produire des informations de contrôle très détaillées sur l'activité à la quelle il est lié. Mais ces informations restent « au ras des pâquerettes » ; elles ne sont pas directement exploitables à des fins d'analyse et de prévision. De cette limitation congénitale est venue l'idée d'un autre système d'information, spécialement et exclusivement conçu pour l'aide à la décision, et découplé des opérations. Pour essayer de préciser le rôle du SID dans une organisation, on peut partir du schéma classique issu du courant de pensée systémique des années 1970, courant qui a notamment crée le fondement théorique de la notion de système d'information.

Mémoire KIAKA MUSITU Héritier Page 10

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 11 sur 91

Système d'Information

Système de Pilotage

Système de Opérant

L'organisation est vue comme un système composé de trois sous-systèmes, à savoir :

Figure. n°3 Système d'information décisionnelle

Le niveau opérationnel : Concerne les données relatives aux différentes fonctions de l'entreprise, il s'agit des bases de données résultantes des sources d'informations internes.

1) Le Système Opérant, qui n'est autre que l'appareil de production, qui importe, transforme et exporte des flux matériels, énergétiques et financiers ;

2) Le Système d'In formation, qui constitue à la fois le reflet et le support informationnel du Système Opérant : il capte des données dans le Système Opérant auquel il renvoie des commandes;

3) Le Système de Pilotage qui détermine le comportement de l'organisation en utilisant le Système d'Information comme une interface à double sens, pour être informé sur le Système Opérant et agir sur ce dernier. Aucune place n'est prévue a priori pour le SID dans cet édifice, Il est situé dans la zone hachurée.

Car le besoin est bien là. Le Système d'information possède toutes les données du problème décisionnel, mais pas sous la forme homogène, cohérente, simplifiée qui convient. Un gros travail de transformation et de mise à disposition est à fournir, le rôle du SID est d'automatiser les traitements correspondants, dans des espaces de travail séparés du reste du SI afin d'éviter toute perturbation mutuelle.

Mémoire KIAKA MUSITU Héritier Page 11

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 12 sur 91

Les besoins en termes d'exploitation de l'information sont divers et variés.

La représentation des besoins est pyramidale le haut de la pyramide correspond à un nombre réduit d'utilisateurs dits avertis, dont le rôle est de tirer un maximum de valeur ajoutée de l'information.

A l'opposé, le bas de la pyramide représente la masse des utilisateurs, dont le rôle va se limiter à l'exploitation de l'information, Il s'agit donc d'identifier les types d'utilisateurs et leurs fournir les informations utiles en conséquence.

I.3.2. Les outils d'aide à la décision

Quelques outils et techniques d'aide à la décision sont :

- Les tableaux de bord ;

- Les outils de Reporting ;

- Datamart (magasin de données),

- Entrepôt de données (data warehouse) ;

- Datamining ;

- Système expert ;

- Analyse multidimensionnelle.

I.3.3. Les outils de manipulation décisionnelle

a. Requêtes

Dans cette catégorie, nous recensons les requêtes SQL. Elles permettent de manipuler les données relationnelles. Ces outils intègrent une couche conceptuelle permettant aux utilisateurs et spécifier les requêtes à partir d'un référentiel et intégrant aussi de différentes possibilités de définition des états plus ou moins complexe.

Mémoire KIAKA MUSITU Héritier Page 12

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 13 sur 91

b. Les tableurs

Le décideur utilise couramment un tableur et souhaite obtenir les informations sous forme du tableau. Une fois que le tableau est construit, il peut, soit l'analyser directement, soit compléter le tableau en y associant des graphiques.

c. Forage

C'est une structure qui permet d'accéder à un niveau plus précis de données.

L'outil de forage de données « datamining» fait référence à un ensemble de techniques d'exploration et d'analyse, par des moyens automatiques ou semi-automatiques, d'une masse importante de données dans le but de découvrir des tendances cachées ou des règles significatives (non triviales, implicites et potentiellement utiles) [6]

I.4. LES NOTIONS OLAP ET OLTP

I.4.1. OLTP à OLAP

L'infocentre, base relationnelle exclusivement réservée aux requêtes décisionnelles, à pu durant un temps assez bref sembler proposer une solution. Mais les bases OLTP structurées en 2 dimensions ne se prêtent guère aux requêtes décisionnelles.

Il était temps de redéfinir une nouvelle structure spécifique aux exigences du décisionnel.

Edgar Franck CODD, père des bases relationnelles a relevé ce défi en 1993. En fondant son expertise sur le produit ESSBASE, un tableur multidimensionnel, E.F. CODD a établi 12 Règles, complétées par la suite de 6 nouvelles, pour définir le concept du cube OLAP (On Line Analytical Processing), une base de données multidimensionnelle [11].

Mémoire KIAKA MUSITU Héritier Page 13

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 14 sur 91

OLTP

OLAP

Utilisateur

Les utilisateurs sont les rouages de

l'entreprise

Les utilisateurs observent les rouages de

l'entreprise peu nombreux

Nombreux variés (employés, directeurs,...)

Uniquement les décideurs

Concurrents

Non concurrents

Mises à jour et interrogations

Interrogations

Requêtes prédéfinies

Requêtes imprévisibles et complexes

Réponses immédiates

Réponses moins rapides

Accès à peu d'information

Accès à de nombreuses informations

Beaucoup d'utilisateurs

Peu d'utilisateurs (décideurs)

Une seule vision métier

Traite plusieurs vision métiers

Exécution un grand nombre de fois la même tâche

Lisent uniquement les données qui sont souvent récapitulées.

Lisent et modifient les données

(système vivant)

Les demandent sont similaire mais différentes.

Exigent des performances (temps

réel pour augmenter la productivité) ERP. GPAO, RH...

 

Contenu des données

Nécessaire au fonctionnement de

l'entreprise

Utilisé pour analyser le

Exhaustives

fonctionnement de l'entreprise.

Courantes

Résumées

Dynamiques

Historiques

Mémoire KIAKA MUSITU Héritier Page 14

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 15 sur 91

Orientées applications

Statiques

Normalisation en 3FN

Agrégée (denormalisée)

Non historisé

Le temps est fondamental

Structures

Beaucoup de tables

Peu de tables mais de grande taille

Petite requêtes sur une seule table

Requêtes larges sur une grosse

quantité de données

Temps de réponses instantanés

(temps réel)

Temps de réponse de quelques

secondes à plusieurs minutes.

Administration

Forte disponibilité

Disponibilité faible

Sauvegardes fréquentes

Sauvegardes peu fréquences, mais

très volumineuses.

Beaucoup de petites transactions

En règle générale, une transaction

par jour

Peu de maintenance off-line

Beaucoup de maintenance off-line

Tableau N°1 OLTP vs OLAP

I.4.2. Le principe OLAP

Au sein d'une base de données de type OLAP, les données sont rangées selon un principe de dimension correspondant étroitement aux axes de recherche des utilisateurs. Cette structure en forme d'hypercube (cube pour 3 dimensions) présente de nombreux avantages.

Exemple : Un chef de secteur peut ainsi souhaiter visualiser une représentation du chiffre d'affaires réalisé selon les trois axes suivant : par produit et par province et par période, puis après réflexion, il pense qu'il obtiendra une meilleure appréciation en inversant les axes :

Par province et par produit et par période.

Mémoire KIAKA MUSITU Héritier Page 15

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 16 sur 91

Avec une base multidimensionnelle, il suffit de faire « pivoter )) le cube sans pour autant être contraint de générer une nouvelle requête.

Il existe bien sûr en natif d'autres fonctions essentielles pour le décisionnel comme le Slice and Dice, permettant de découper une « tranche )) du cube afin de l'analyser plus finement et Drill Down et Drill Up pour descendre plus avant dans le détail ou remonter plus haut.

Ainsi notre chef de secteur peut se poser la question suivante :

« Vente des produits frais dans la province du Kasaï-Oriental pour le trimestre

écoulé )).

Puis il voudra affiner :

... Et dans le Territoire de Kabinda...

... Et dans la ville de Kabinda...

... Et dans le quartier...

OLAP réactualise l'ensemble des calculs de synthèse et les agrégats selon la question posée.

I.5. CHAINE DECISIONNELLE ET OUTILS DE L'INFORMATIQUE DECISIONNELLE

L'informatique décisionnelle propose d'utiliser les données transitant par le système d'information, données de production le plus souvent, en informations susceptibles d'être exploitées à des fins décisionnelles. Sur le plan pratique et technique, la Business Intelligence se compose d'une famille d'outils informatiques et progiciels assurant le fonctionnement de la chaine de traitement de l'information.

Il est coutumier de présenter les éléments composant la chaine décisionnelle en quatre catégories correspondant chacune à une fonction spécifique.

Mémoire KIAKA MUSITU Héritier Page 16

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 17 sur 91

Collecter, nettoyer et consolider les données Extraire les données des systèmes de production et les adapter à un usage décisionnel.

Stocker Centraliser les données structurées et traitées afin qu'elles soient disponibles pour un usage décisionnel.

Distribuer ou plutôt facilite l'accessibilité des informations selon les fonctions et les types d'utilisation.

Exploiter ou comment assister du mieux possible l'utilisateur afin qu'il puisse extraire la substance de l'information des données à cet usage.

I.6. ARCHITECTURE D'UN SYSTEME DECISIONNEL

Figure n°4 Architecture d'un système décisionnel - La collecte des données

La collecte de données est une fonction remplie par une famille d'outils dénommée ETL.

Mémoire KIAKA MUSITU Héritier Page 17

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 18 sur 91

Le système d'information de l'entreprise ne s'est pas bâti en un temps unique. La majorité des systèmes d'information d'entreprise sont de nature hétérogène pour la plupart. Bien que la standardisation des échanges entre les divers outils informatiques avance à grands pas, la disparité des formats des données en circulation est toujours une réalité. C'est le principal obstacle technologique aux échanges étendus d'information.

Avant d'être utilisables, les données seront formatées, nettoyées

et consolidées. Les outils ETL (Extract Transform Load) permettent
d'automatiser ces traitements et de gérer les flux de données alimentant les bases de stockage : Data Warehouse ou datamart.

Le Master Data Management, la gestion des données de référence, assure la standardisation et la traçabilité des données de référence de l'entreprise. Le Master Data Management est un projet en soi dont la finalité dépasse la constitution de la base décisionnelle.

- Le Stockage des données

Les bases de données de production ne sont pas utilisables pour une exploitation décisionnelle. Les données brutes ne sont pas prêtes à cet usage et par ailleurs les requêtes décisionnelles sont particulièrement gourmandes en ressources machines. Les données, au préalable nettoyées et consolidées, seront stockées dans une base spécialisée : le data warehouse (entrepôt de données ou base de données décisionnelle) ou le datamart (magasin de données). Le datamart est une version plus réduite du data warehouse.

- La Distribution des informations

Portail décisionnel EIP Entreprise Information Portail. L'écrasement de la pyramide et de la multiplication des points de prise de décision modifient fondamentalement la gestion de l'information. L'information sera perçue en termes de flux et non d'unité de stockage. Afin de dynamiser la réactivité

Mémoire KIAKA MUSITU Héritier Page 18

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 19 sur 91

globale, l'information sera largement distribuée auprès de l'ensemble des partenaires. Le portail décisionnel EIP Entreprise Information Portail, remplir cette fonction essentielle. Désormais, l'essor de la Business Intelligence de 2nde génération, la BI 2.0 exploitant pleinement les capacités du web 2.0 démocratise très largement l'accès à l'information décisionnelle.

- Exploiter : tableau de bord, data mining...

Une fois les données stockées, nettoyées, consolidées et accessibles, elles sont utilisables. Selon les besoins, différents types d'outils d'extraction et d'exploitation seront envisagés pour analyser les données, notamment avec les outils de type comme :

- Analyse OLAP pour les analyses multidimensionnelles.

- Le Datamining pour la rechercher des corrélations peu visibles.

- Les tableaux de bord pour piloter la performance, aide à la décision des

décideurs présentant les indicateurs clés de l'activité.

- Le Reporting pour communiquer la performance.

I.7. OUTILS D'EXTRACTION

I.7. I. Définition

Un outil d'extraction est une application utilitaire paramétrable employée pour acquérir à partir de données diverses et variées, un sous ensemble provisoire mais cohérent d'informations définies par un même standard. Cet ensemble peut être ensuite interrogé directement ou sauvegardé dans une structure plus complexe.

Mémoire KIAKA MUSITU Héritier Page 19

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 20 sur 91

I.7.2. L'outil de l'ETL (Extract Transform Loading)

Il collecte, nettoye et consolide les données de l'entreprise étendue. Sachant que la collecte des données est une fonction remplie par une famille d'outil dénommée ETL.

Figure n° 5 Principe ETL

I.7.3. Les Le processus ou fonctions d'ETL

L'ETL est une opération de migration de données qui représente une part majeure des traitements et nécessite une attention régulière tout au long du cycle de vie du système. Pour pouvoir obtenir ce sous -ensemble, l'outil utilise trois fonctions principales.

1. L'extraction des données

Il s'agit d'abord de rechercher les données là ou elles se trouvent, car l'outil ETL a la capacité d'être en contact avec différentes applications, bases de données ou fichier c.à.d. dans les différentes sources de données, pour trouver l'information pertinente effectuer les mises à jour (sur les bases légataires ou les fichiers de l'entreprise).

Mémoire KIAKA MUSITU Héritier Page 20

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 21 sur 91

2. La transformation et le contrôle des données

Les outils ETL sont des ateliers spécialisés dans la migration de données. La transformation des données est leur fonctionnalité principale. C'est pourquoi ils disposent une fonction permettant de vérifier qu'une donnée est cohérente par rapport aux données déjà existantes dans la base ciblée, ils ont alors des outils de conversion de données et ils sont conçus pour manipuler de gros volumes de données. L'étape de contrôle s'effectue par application de règles adaptées sur les flux de données entrants.

3. Le chargement de données et le transfert des données

Le chargement prend en compte la gestion du format final des données pour la mise en oeuvre du transfert de ces données. En outre une fois que les données extraites, retravaillées, validées, il reste à les sauvegarder dans une structure permettant à terme leur interrogation optimisée et uniformisée.

I.8. LES CUBES OLAP

Un cube OLAP est une représentation abstraite d'informations multidimensionnelles exclusivement numérique utilisé par l'approche OLAP (acronyme de Online Analytical Processing). Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont censées représenter.

Les cubes OLAP ont les caractéristiques suivantes :

1- obtenir des informations déjà agrégées selon les besoins de l'utilisateur.

2- Simplicité et rapidité d'accès

3- capacité à manipuler les données agrégées selon différentes dimensions

4- un cube utilise les fonctions classiques d'agrégation : min, max, count, mais

peut utiliser des fonctions d'agrégations spécifiques.

Mémoire KIAKA MUSITU Héritier Page 21

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 22 sur 91

Nous pouvons effectuer différentes opérations avec OLAP pour faire des Analyses nous citons entre autre:

I.8.1.Navigation dans un cube

Les outils OLAP utilisent des opérateurs particuliers afin de « naviguer » dans les cubes multidimensionnels :

Pivoter (pivot, swap) : permet d'interchanger deux dimensions

Forage vers le bas (drill-down) : permet de descendre dans l'hiérarchie de la dimension, EX. visualiser les ventes par mois au lieu de par année.

Forage vers le haut (drill-up, roll-up) : remonter dans la hiérarchie de la dimension

Ex. visualiser le nombre d'accidents par année au lieu de par mois.

Forer latéralement (drill-across) : Permet de passer d'un membre de dimension à un autre Ex. visualiser les ventes du Katanga au lieu de celles de Kinshasa, visualiser le cout des travaux au lieu du nombre d'accidents.

I.8.2. Implémentations OLAP

Il existe deux critères permettant de bien différencier les implémentations OLAP:

1. La technologie de stockage des données OLAP

Les différentes implémentations OLAP sont :

Relational online analytical processing (ROLAP): Les données sont stockées dans un SGBD relationnel classique structurée pour réagir à la manière d'une base OLAP. C`est en faite une base relationnelle classique organisée pour fonctionner comme une base OLAP. Elles sont bien plus lentes et nettement moins performantes que les bases MOLAP. Mais, immense avantage, elles sont sans limite de taille c'est -à-dire les données sont stockées dans un SGBD

Mémoire KIAKA MUSITU Héritier Page 22

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 23 sur 91

relationnel. Elles utilisent le concept relationnel pour stocker les données modélisées dans le format multi dimensionnel.

Multidimensionnal on line analytical processing (MOLAP) : Base de données dimensionnelle (Cube) : Les données sont stockées dans une base de données multidimensionnelles le plus souvent propriétaires. Cependant il ya des limitations quant à la quantité de données et l'application physique du concept OLAP. Il s'agit réellement d'une structure multidimensionnelle et ses bases sont rapides et performantes aussi proposent des fonctionnalités particulièrement évoluées, elles restent limitées au gigaoctet.

Hybrid on line analytical processing (HOLAP) : C'est un troisième modèle qui propose de cumuler les avantages de deux modèles précédents. Les données agrégées sont stockées sous forme multidimensionnelle alors que les données détaillées sont stockées dans des structures relationnelles. Il repose sur des bases ROLAP et MOLAP, cette dernière prenant en charge les contenus les plus souvent recherchés.

Desktop on line analytical processing (DOLAP) : Les fichiers sur le poste client à petite quantité de données est stockée directement sur le poste client de l'utilisateur.

2. Les techniques de traitements des données OLAP :

a) SQL : SQL est utilisé pour effectuer les différents traitements sur les données OLAP. On réaliser de roll-up, de drill-down... en utilisant des requêtes en général très complexes et très exigeantes en terme de ressources et de temps d'exécution. (Rolap) ;

b) Serveur de traitement OLAP : Il s'agit de l'approche la plus adaptée aux traitements de données OLAP. Un serveur, conjointement avec la base de données, est alors dédié à effectuer les différents traitements de données OLAP. Les performances sont excellentes en général ! (Molap) ;

Mémoire KIAKA MUSITU Héritier Page 23

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 24 sur 91

c) Client de traitement OLAP : Une approche qui perd beaucoup de terrain vu l'émergence des postes clients léger. Un nombre limité de traitement OLAP se Font sur le poste client de l'utilisateur (Dolap).

I.9. FAIT ET DIMENSION

I.9.1. Fait

Les faits, en complément aux dimensions, sont ce sur quoi va porter l'analyse. Ce sont des tables qui contiennent des informations opérationnelles et qui relatent la vie de l'entreprise. On aura des tables de faits pour les ventes (chiffre d'affaires nettes, quantités et montants commandés, quantités facturées, quantités retournées, volumes des ventes, etc.)

Par exemple sur les stocks (nombre d'exemplaires d'un produit en stock, niveau de remplissage du stock, taux de roulement d'une zone, etc.), ou peut être sur les ressources humaines (performances des employés, nombre de demandes de congés, nombre de démissions, taux de roulement des employés, etc.). Nous dirons donc un fait est tout ce qu'on voudra analyser.

I.9.2. Dimension

On entend par dimensions les axes avec lesquels on veut faire l'analyse, un axe d'analyse essentiel est la dimension temps Il peut y avoir une dimension client, une dimension produit, une dimension géographie (pour faire des analyses par secteur géographique), etc. Les tables contiennent des rangées (types, enregistrements). Chaque rangée est constituée de colonnes (champs).

Dans une base de données standard, le premier champ de chaque enregistrement est généralement la clé primaire, l'unique identifiant de l'enregistrement. Par contre, le modèle de données multidimensionnel est un tableau à n ou plusieurs dimensions c.à.d. en hypercube. Et chaque dimension

Mémoire KIAKA MUSITU Héritier Page 24

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 25 sur 91

possède une hiérarchie associée de niveau de consolidation. Chaque position dans un tableau multidimensionnel, correspondant à une intersection de toutes les dimensions est appelée une cellule. Ces dimensions peuvent être décomposées en hiérarchies, comme aussi être affinées pour de permettre aux utilisateurs d'examiner les indicateurs à différents niveaux de détail, de descendre «remote, dril-up, drill-down » dans les données, allant du niveau global au niveau le plus fin.

I.10. Concept d`hiérarchie

Une hiérarchie organise les paramètres d'une dimension selon une relation « est_plus_fin » conformément à leur niveau de détail [10]. On distingue deux types d'hiérarchies Simple et Multiple :

I.10.1. Hiérarchies Simple

Une hiérarchie simple consiste en exactement un chemin linéaire d'agrégation dans une dimension.

I.10.2. Hiérarchies Multiple

Une hiérarchie multiple contient au moins deux chemins d'agrégation différents dans une dimension.

Identification des hiérarchies

La hiérarchie est un concept extrêmement important dans le modèle multidimensionnel, car c'est par la hiérarchie que l'on va pouvoir passer du modèle relationnel au modèle multidimensionnel.

Une hiérarchie est un modèle d'entité-association qui est identifié par des séquences d'entités reliées par des relations (un à plusieurs), toutes alignées dans le même sens. Nous parlons alors d'un schéma normalisé.

Mémoire KIAKA MUSITU Héritier Page 25

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 26 sur 91

Date

Année

Saison

Semaine

Pays

Canton

Ville

Quartier

Trimestre

Mois

Figure N°5 Hiérarchie Simple Figure N°6 Hiérarchie Multiple

Note : La hiérarchie ordonne la dimension et permet de changer le niveau d'analyse.

Mémoire KIAKA MUSITU Héritier Page 26

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 27 sur 91

Chapitre Deuxième : CONCEPT DE BASE SUR L'ENTREPOT DE DONNEES

II.1. INTRODUCTION

Une fois l'information structurée et validée, il existe deux solutions d'exploitation. La première est de garder ces informations en mémoire dans une structure virtuelle temporaire pour l'interrogation. L'autre solution est de stocker de manière permanente les données sur disques magnétiques.

Nous nous intéressons à la deuxième solution au cours de ce travail, plus complexe à mettre en oeuvre ; elle permet alors de fournir tous les renseignements nécessaires.

Certes, l'analyse décisionnelle se base sur la dimension temporelle de l'information, ce qui nécessite une sauvegarde permanente. Le data warehouse est le terme anglais qui veut dire entrepôt de données.

Un entrepôt de données est une structure informatique dans la quelle est centralisé un volume important de données consolidées à partir des différentes sources de renseignements d'une entreprise (notamment les bases de données internes) et qui est conçue de manière que les personnes intéressées aient accès rapidement à l'information stratégique dont elles ont besoin.

Si, dans le passé, l'entrepôt de données servait davantage à l'archivage, aujourd'hui il est devenu une pièce maitresse de l'information décisionnelle (ou informatique d'aide à la décision). Il représente l'un des éléments essentiels d'un ensemble matériel et logiciel dynamique de recherche d'informations. Dans un entrepôt de données, les données sont sélectionnées et préparées (pour répondre aux questions vitales de l'entreprise), intégrées (à partir des différentes sources de renseignements) et datées (elles gardent la trace de leur origine). Le terme entrepôt de données, employé très

Mémoire KIAKA MUSITU Héritier Page 27

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 28 sur 91

fréquemment, semble vouloir supplanter ses concurrents dépôt de données et centrale de données.

Figure n°7 Datawarehouse et Datamart

Cette définition est tirée de celle Bill Inmon que l'on nomme le père des entrepôts de données et l'inventeur de ce qu'on appelle EDW pour entreprise Data warehouse ou CIF pour Corporate Information factory.

II.2. DEFINITION D'UN ENTREPOT DE DONNEES

De nombreuses définitions ont été proposées, soit académiques, soit par les éditeurs d'outils de bases de données ou encore par des constructeurs, cherchant à orienter ces définitions dans un sens mettant en valeur leur produit.

Une définition pourrait être qu'un Data Warehouse est l'ensemble des données historiées, nettoyées, valides, complètes et cohérentes d'une entreprise, organisées de telle façon à ce que des non informaticiens puissent en comprendre la structure et l'exploiter, sans l'intervention d'un informaticien. La définition la plus appropriée du data warehouse est celle proposée par Bill Inmon : c'est une collection de données orientées sujet,

Mémoire KIAKA MUSITU Héritier Page 28

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 29 sur 91

intégrées, non volatiles et historisées, organisées pour le support d'un processus d'aide à la décision.

D'ailleurs les grands de l'informatique décisionnelle Bill Inmon et Kimball, définissent un entrepôt de données par ses caractéristiques :

Dans un entrepôt de données, les informations sont organisées par fonction dans l'entreprise (comptabilité, stocks, ventes, etc.), afin de répondre à des besoins (métier), elles sont classées par thème ( les données propres à un thème) nous dirons que dans un entrepôt de données, les données sont

structurées ou organisées autour des sujets majeurs de l'entreprise,
contrairement aux données de systèmes de production (OLTP= OneLine transaction processing) ceux-ci sont généralement organisées par processus fonctionnels.

II.2.1. Données orientées sujets

L'intérêt de cette organisation est de disposer de l'ensemble des informations utiles sur un sujet le plus souvent transversal aux structures fonctionnelles et organisationnelles de l'entreprise. Cette orientation sujet va également permettre de développer son système décisionnel via une approche par itérations successives, sujet après sujet c'est-à-dire Les données sont organisées pour répondre à des besoins « métiers » : elles sont classées par thème. Les données propres à un thème, les ventes par exemple, seront rapatriées des différentes bases OLTP (OneLine transaction processing) de production et regroupées.

II.2.2. Données intégrées

Comme nous l'avons dit ci-haut les données proviennent de sources hétérogènes utilisant plusieurs types de formats. Nous savons qu'un Datawarehouse est un projet d'entreprise. Pour y parvenir, les données doivent être intégrées. Avant d'être intégrées dans le Datawarehouse, les données

Mémoire KIAKA MUSITU Héritier Page 29

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 30 sur 91

doivent être mises en forme et unifiées afin d'avoir un état cohérent. Les données proviennent de sources hétérogènes utilisant chacune un type de format.

Elles sont intégrées avant d'être proposées à utilisation. Un « nettoyage » préalable des données est nécessaire dans un souci de rationalisation et de normalisation.

II.2.3. Données non volatiles

Retenons qu'une fois les données intégrées dans l'entrepôt, elles ne sont pas appelées à être supprimées car le non volatilité des données est en quelque sorte une conséquence de l'historisation. La requête effectuée à quelques mois d'intervalle en précisant la date de référence de l'information recherchée donnera le même résultat. Les données une fois intégrée dans l'entrepôt ne sont pas appelées à être supprimées. (Read-Only)

II.2.4. Données historisées

Les données mémorisées sont datées c.à.d. un référentiel temps doit être associé à la donnée afin d'être capable d'identifier une valeur particulière dans le temps. Il est donc possible de voir son évolution après un temps donné. Dans un système de production, la donnée est mise à jour à chaque nouvelle transaction car le degré de détail de l'archivage est bien entendu relatif à la nature des données, parce que toutes les données ne sont pas propres à être archivées .On ne doit pas permettre que les données soient modifiées seul. Elles sont en lecture seule. Les données mémorisées sont datées, il est ainsi possible de visualiser leur évolution dans le temps. Le degré de détail de l'archivage est bien entendu relatif à la nature des données. Toutes les données ne méritent pas d'être archivées.

Mémoire KIAKA MUSITU Héritier Page 30

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 31 sur 91

II.2.5. Données agrégées

Elles correspondant à des éléments d'analyse représentatifs des besoins des utilisateurs.

Elles constituent déjà un résultat d'analyse et une synthèse de l'information contenue dans le système décisionnel, et doivent être facilement accessibles et compréhensibles.

II.2.6. Méta-données

C'est l'ensemble d'informations nécessaires à la compréhension et à l'exploitation des données du Datawarehouse, elles regroupent l'ensemble des informations concernant le Datawarehouse et les processus associés. Elles sont idéalement intégrée dans un référentiel, elle donne la signification de chaque donnée, et précise les algorithmes qui permettent l'extraction des données dans une base de production données sur les données.

II.3. UTILITE D'UN ENTREPOT DE DONNEES

Un entrepôt de données, est une vision centralisée et universelle de toutes les informations de l'entreprise. C'est une structure (comme une base de données) qui à pour but, contrairement aux bases de données, de regrouper les données de l'entreprise pour des fins analytiques et pour aider à la décision stratégique. La décision stratégique est une action entreprise par les décideurs qui vise à améliorer, quantitativement ou qualitativement, la performance de l'entreprise. En gros, c'est un gigantesque flux d'informations épurées, organisées, historisées et provenant de plusieurs sources de données, servant aux analyses et à l'aide à la décision.

L'entrepôt de données est l'élément central de l'informatique décisionnelle. En effet, il est le meilleur moyen que les professionnels ont

Mémoire KIAKA MUSITU Héritier Page 31

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 32 sur 91

trouvé pour modéliser de l'information pour des fins d'analyse. Les données d'une entreprise proviennent essentiellement des bases de production. Ces données sont éparpillées ou en masse dans des systèmes multiples, pas nécessairement compatibles entre eux. Ces bases sont conçues pour être efficaces pour les fonctions sur lesquelles elles sont spécialistes.

Elles sont donc peu structurées pour l'analyse, avec souvent comme objectif principal de conserver l'information. Comme bases de production, elles sont focalisées sur les fonctions critiques de l'entreprise et doivent être en mesure de servir l'utilisateur avec un temps de réponse rapide et structurées dans ce but.

Ces systèmes sont donc peu adaptés à la vision à long terme et donc à la prise de décision. L'entrepôt de données aura pour objectif d'agréger et de valoriser ces données provenant de différentes sources. Il va permettre à l'utilisateur d'y accéder de manière simple et ergonomique [3].

II.4. LES ARCHITECTURES D'UN ENTREPOT DE DONNEES

Pour implémenter un Datawarehouse, trois types d'architectures

sont possibles :

? L'architecture réelle,

? L'architecture virtuelle,

? L'architecture remote.

II.4.1. L'architecture Réelle

Elle est généralement retenue pour les systèmes décisionnels.

Le stockage des données est réalisé dans un SGBD séparé du système de production. Le SGBD est alimenté par des extractions périodiques.

Mémoire KIAKA MUSITU Héritier Page 32

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 33 sur 91

Avant le chargement, les données subissent d'importants processus d'intégration, de nettoyage, de transformation.

L'avantage est de disposer de données préparées pour les besoins de la décision et répondant aux objectifs du Datawarehouse.

Les inconvénients sont le coût de stockage supplémentaire et le manque d'accès en temps réel.

II.4.2. L'architecture Virtuelle

Cette architecture n'est pratiquement pas utilisée pour le Datawarehouse.

Les données résident dans le système de production. Elles sont rendues visibles par des produits middlware ou par des passerelles.

Il en résulte deux avantages : pas de cout de stockage supplémentaire et l'accès se fait en temps réel. L'inconvénient est que les données ne sont pas préparées.

II.4.3. L'architecture Remote

C'est une combinaison de l'architecture réelle et de l'architecture virtuelle. Elle est rarement utilisée. L'objectif est d'implémenter physiquement les niveaux agrégés afin d'en faciliter l'accès et de garder le niveau de détail dans le système de production en y donnant l'accès par le biais de middleware ou de passerelle.

Mémoire KIAKA MUSITU Héritier Page 33

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 34 sur 91

II.5. ARCHITECTURE TECHNIQUE D'UN ENTREPOT DE DONNEES

Figure n08 Architecture technique d'un entrepôt des données

II.7. COMPOSANTS DE BASE OU ARCHITECTURALES D'UN ENTREPOT DE

DONNEES

Figure n09 Composant de base ou Architecturales d'un entrepôt de données

Mémoire KIAKA MUSITU Héritier Page 34

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 35 sur 91

L'architecture des systèmes décisionnels met en jeu un environnement comportant quatre éléments essentiels : les sources de données, l'entrepôt de données, les magasins de données et les outils d'analyse et d'interrogation.

- Les sources de données

Sont nombreuses, variées, distribuées et autonomes. Elles peuvent être internes (bases de production de l'entreprise) ou externe (Données fournies par les partenaires tel que : Les Fournisseurs, Contribuables, Clients, Administration Publiques, Documentation Juridiques) à l'entreprise.

- L'entrepôt de données

C'est le lieu de stockage centralisé des informations utiles pour les décideurs. Il met en commun les données provenant des différentes sources et conserve leurs évolutions.

- Les magasins de données

Sont des extraits de l'entrepôt orientés sujet. Les données sont organisées de manière adéquate pour permettre des analyses rapides à des fins de prise de décision, et principalement dédie à une classe de décideurs.

- Les outils d'analyse et d'interrogation

Permettent de manipuler les données suivant des axes d'analyses. L'information est visualisée au travers d'interfaces interactives et fonctionnelles dédiées à des décideurs souvent non informaticiens (directeurs, chefs de services,...).

Mémoire KIAKA MUSITU Héritier Page 35

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 36 sur 91

II.8. TABLE DE FAITS

Table de fait : comme son nom l'indique, une table de fait est une table contenant tous les faits du SI et dont dépendent toutes les autres tables. Cette table ne contient que des clés étrangères venant des tables de dimension et des valeurs numériques appelées mesure. Exemple de table de fait : table des Ventes. Initiation au décisionnel [5].

Rappelons que certaines tables de faits peuvent contenir aucun attribut et représentent que des liaisons entre tables dimensionnelles. Et tous les éléments qui pointent sur la table de faits sont liés à une sémantique exprimable par une phrase. Par conséquent, la table de faits est la matérialisation d'une association entre entités, généralement elle contient un petit nombre de colonnes mais beaucoup plus d'enregistrements qu'une table de dimension.

II.9. TABLE DE DIMENSION

Les tables de dimension sont des tables servant d'axes d'analyse. On peut par exemple analyser les ventes (table de fait) suivant l'axe des temps (table de dimension) pour indiquer par exemple pendant quel trimestre de l'année les ventes ont explosé [5].

II.10. LES MESURES

Une mesure est une quantité présente dans la table de fait qui permet de mesurer les faits. Par exemple, nombre de vente ou prix unitaire sont des exemples des mesures, en outre les mesures sont en fait les critères ou indicateurs que l'on veut étudier en fonction de différents axes ou dimensions [5].

Mémoire KIAKA MUSITU Héritier Page 36

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 37 sur 91

II.11. MODELES DE CONCEPTION D'UN ENTREPOT DE DONNEES

II.11.1. Modélisation en étoile

Nous allons utiliser un exemple pour expliquer la modélisation en étoile. L'important en BI est de toujours garder à l'esprit que ce que nous faisons est différent des bases de données traditionnelles. Le schéma créé sera accessible par les utilisateurs et doit donc être le plus simple et explicite possible.

La modélisation en étoile découle naturellement du tableau ci-dessus, il en résulte le schéma suivant:

Figure N°10 Modélisation en Etoile

Dans une modélisation en étoile, toutes les dimensions sont directement reliées à la table de faits, qui contient les données à analyser. Plusieurs remarques sont à faire pour ce schéma :

- La table de fait contient se qu'on appelle des " mesures ", des champs (numériques pour la plupart) sur lesquels on va faire nos analyses, on

Mémoire KIAKA MUSITU Héritier Page 37

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 38 sur 91

peut y trouver le montant des ventes nettes, les quantités vendues, les kilomètres parcourus, les quantités en pré commande, etc. La table de faits est reliée aux dimensions par des relations (1, n). Pour analyser une ligne de fait par client par exemple, il faut qu'il y ait une relation entre cette ligne et la dimension client.

- Les tables de dimension contiennent les éléments qu'utiliseront les décideurs pour voir la table de faits. Les utilisateurs pourront ainsi apprécier les montant des ventes par vendeur, par client, ou le kilométrage pour un vendeur pour un client donnée (pour voir si ce client est rentable), calculer le coût de revient d'un produit par rapport aux activités des vendeurs, etc. On n'utilise jamais la clé d'un système de production comme clé de dimension : pour préserver l'historique des modifications dans l'entrepôt de données.

- La granularité des tables de dimensions et de faits doit être la même : imaginez que la table de faits regroupe les informations par heures et que la table de dimension du temps gère les minutes, il ne sera pas possible de lier la dimension temps et la table de faits (multi détermination).

- Chaque ligne de la table de faits doit avoir une relation avec chacune des tables de dimensions : dans le cas contraire, on aurait perte d'information ou analyse erronée.

- Il n'existe de relations qu'entre les dimensions et les tables de faits. Il sera beaucoup trop compliqué de gérer et d'utiliser des dimensions liées entre elles. N'oubliez pas que le schéma doit être assimilable par des non informaticiens pour pouvoir l'exploiter.

II.11.2. Modélisation en flocon

La modélisation en flocon étant une variante de la modélisation en étoile, nous prendrons le même cas avec la même analyse. Il faut savoir que la modélisation en flocon existe pour des raisons de performances. En effet, des dimensions de plusieurs millions de lignes peuvent poser des problèmes de lenteur lors de l'exploitation des données.

Mémoire KIAKA MUSITU Héritier Page 38

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 39 sur 91

Le principe de la modélisation en flocon est de créer des hiérarchies de dimensions, de telle manière à avoir moins de lignes par dimensions. Vous nous direz que cela va en contradiction avec la dernière remarque de la modélisation en étoile, et nous vous dirons que vous avez raison, à la seule chose prés que la performance prime sur la structure. C'est la seule alternative pour avoir des résultats clairs et rapides.

Le schéma d'une modélisation en flocon pourrait être comme suit :

Figure N°12 Modélisation en Flacon

Conseil : il faut éviter floconner à tort et à travers. En effet, pour garder une structure simple, gérable et compréhensible, on utilise le plus possible la modélisation en étoile. La modélisation en flocon n'intervenant que lorsque des problèmes de performances apparaissent ou sont facilement prédictibles. Une règle informelle en BI préconise de ne floconner que si l'on a la relation (11000). C'est-à-dire que si l'on réussit à créer une hiérarchie de deux dimensions

Mémoire KIAKA MUSITU Héritier Page 39

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 40 sur 91

avec une ligne de la dimension père (groupe produit par exemple) faisant référence à plus de 1000 lignes de la dimension fille (produit par exemple). Dans ce cas, il est peut être temps de penser aux flocons.

II.11.3. Modélisation en Constellation

Une constellation est une série d'étoiles ou de flocons reliées entre eux par des dimensions. Il s'agit donc d'étoiles avec des dimensions en commun. Un environnement décisionnel idéal serait une place où il serait possible de naviguer d'étoile en étoile, de constellation en constellation et de DataMart en DataMart à la recherche de l'information si précieuse.

Un des indicateurs clés d'une bonne conception d'entrepôt est la grosseur des constellations. En effet, plus la constellation est grosse, plus cela veut dire que vous avez réutilisé vos dimensions, et qui dit réutilisation de dimension, dit dimensions complètes, centralisées et avec une vue orientée entreprise.

II.11.4. Modélisation en Grappe

Ce schéma en grappe est une dérivation de ces deux schémas pour en former un troisième. Kimball déclare qu'un schéma en flocon n'est pas optimal, car il est trop complexe. Toujours pour les mêmes raisons de simplification des tables, afin de pouvoir trouver facilement les informations dans l'entrepôt, le schéma en grappe apparait alors comme un compromis entre le schéma en étoile et le schéma en flocon.

II.12. APPROCHES DE MISE EN PLACE D'UN DATA WAREHOUSE

Il existe plusieurs approches pour mettre en place un Datawarehouse. Par contre seulement trois approches sont communes, il s'agit de l'approche « Top-Down » prônée par Inmon, l'approche « Bottom-up » de Kimball et l'approche « Hybride » qui dérivent des deux premières approches.

Mémoire KIAKA MUSITU Héritier Page 40

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 41 sur 91

II.12.1.Approche Top-down

C'est la méthode la plus lourde, la plus contraignante et la plus complète en même temps. Elle consiste en la conception de tout entrepôt (toutes les étoiles, puis en la réalisation de ce dernier. Imaginez le travail qu'une telle méthode implique : savoir à l'avance toutes les dimensions et tous les faits de l'entreprise, puis réaliser tout ça... Le seul avantage que cette méthode comporte est qu'elle offre une vision très claire et très conceptuelle des données de l'entreprise ainsi que du travail à faire.

II.12.2. Approche Bottom-up

C'est l'approche inverse, elle consiste à créer les étoiles une par une, puis les regrouper par des niveaux intermédiaires jusqu'à l'obtention d'un véritable entrepôt pyramidal avec une vision d'entreprise. L'avantage de cette méthode est qu'elle est simple à réaliser (une étoile à la fois), l'inconvénient est le volume de travail d'intégration pour obtenir un entrepôt de données ainsi que la possibilité de redondances entre les étoiles (car elles sont faites indépendamment les unes des autres).

II.12.3. Approche Middle-out

C'est l'approche hybride, et conseillée par les professionnels du BI. Elle consiste en la conception totale de l'entrepôt de données (concevoir toutes dimensions, tous les faits, toutes les relations), puis créer des divisions plus petites et plus gérables et les mettre en oeuvre. Cela équivaut à découper notre conception par éléments en commun et réaliser les découpages un par un. Cette méthode tire le meilleur des deux précédentes sans avoir les contraintes. Il faut juste noter que cette méthode implique, parfois, des compromis de découpage (dupliquer des dimensions identiques pour des besoins pratiques.

Mémoire KIAKA MUSITU Héritier Page 41

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 42 sur 91

II.13. LE MAGASIN DE DONNEES

II.13.1. Introduction

Le Datawarehouse étant, en général, très volumineux et très complexes à concevoir, on a décidé de les diviser en « bouchées » plus faciles à créer et entretenir. Ce sont les Datamart. On peut faire des divisions par fonction (un datamart pour les ventes, pour les commandes, pour les ressources humaines) ou par sous-ensemble organisationnel

(un datamart par succursale). Nous verrons plus tard comment organiser les datamarts pour créer un entrepôt proprement dit [3].

II.13.2. Définition

Un Datamart littéralement en anglais magasin de données est un sous-ensemble d'une base de données décisionnelle utilisé en informatique décisionnelle : il est généralement exploité en entreprise pour restituer des informations ciblées sur un métier spécifique, constituant pour ce dernier un ensemble d'indicateurs à vocation de pilotage de l'activité et d'aide à la décision. Un Datamart, selon les définitions, est issu ou fait partie d'un Data Warehouse, et en reprend par conséquent la plupart des caractéristiques.

Le Datamart est un ensemble de données ciblées, organisées, regroupées et agrégées pour répondre à un besoin spécifique à un métier ou un domaine donné. Il est donc destiné à être interrogé un panel de données restreint à son domaine fonctionnel, selon des paramètres qui auront été définis à l'avance lors de sa conception.

De façon plus technique. Le DataMart peut être considéré de deux manières différentes, attribuées aux deux principaux théoriciens de l'informatique décisionnelle, Bill Inmon et Ralph Kimball :

Mémoire KIAKA MUSITU Héritier Page 42

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 43 sur 91

Définition d'Inmon : Le Datamart est un sous- ensemble du Datawarehouse, constitué au niveau des détails et à des niveaux plus agrégés, permettant de restituer tout le spectre d'une activité métier. L'ensemble des Datamarts de l'entreprise constitue le Datawarehouse.

Définition de Ralph Kimball : l'entrepôt de données est constitué peu à peu par les Datamarts de l'entreprise, regroupant ainsi différents niveau d'agrégation et d'historisation de données au sein d'une même base.

II.13.3 Structure physique et théorique

Au même titre que les autres parties de la de base de données globale de l'entreprise, les Datamarts sont stockés physiquement sur disque dur par un système de gestion de bases de données relationnelle hébergé sur un serveur.

Le Datamart est souvent confondu avec la notion d'Hypercube OLAP ; il peut de fait être représenté par un modèle en étoile ou en flacon dans une base de données relationnelle (notamment lorsqu'il s'agit de données élémentaires ou unitaires non agrégées).

II.13.4 Place du DataMart dans la structure de données

Le Datamart se trouve en toute fin de la chaine de traitement de l'information. En règle générale, il se situe en aval d'un Datawarehouse plus global à partir duquel il est alimenté, dont il constitue en quelque sorte un extrait.

II.13.5 Interaction avec les utilisateurs

Un DataMart forme la principale interaction entre les utilisateurs et les systèmes informatiques qui gèrent la production de l'entreprise. Dans un DataMart, l'information est préparée pour être exploitée brute par les personnes du métier auquel il se rapporte. Pour ce faire, il est appelé à être

Mémoire KIAKA MUSITU Héritier Page 43

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 44 sur 91

utilisé via des logiciels d'interrogation de bases de données (notamment des outils de Reporting) afin de renseigner ses utilisateurs sur l'état de l'entreprise à un moment donné (stock par exemple) ou sur son activité (flux).

La préparation de la donnée pour une utilisation directe, inhérente au Datamart, peut revêtir plusieurs formes. Il faut noter que toutes représentent une simplification par rapport au niveau de données inférieur : on peut citer pour exemple :

- L'agrégation de données : Le DataMart ne contient pas le détail de toutes les opérations qui ont eu lieu, mais seulement des totaux, repartis par groupements.

- Le retrait de données inutiles : Le DataMart ne contient que les données qui sont strictement utiles aux utilisateurs.

- L'historisation de données : le DataMart contient seulement la période de temps qui intéresse les utilisateurs.

II.13.6. Intérêt et limites

Les Datamarts étant des extraits simplifiés du détail des données de l'entreprise, ils présentent un grand intérêt pour des requêtes identifiées et répétitives ; il est plus facile pour le système d'interroger un DataMart qui ne contient que le nécessaire que d'avoir à cerner et à trier toute la base. Par ailleurs, les Datamarts permettent de classifier et de clarifier l'information, de manière à ce que chaque métier ait accès à des chiffres correspondant à ses attentes fonctionnelles, sans être pollué par des données contigües.

Le Datamart minimise la complexité informatique. Il est donc facile de se concentrer sur les besoins des utilisateurs.

En revanche, les choix de simplification qui donnent lieu aux Datamarts rendent ceux-ci naturellement moins flexibles ; des demandes d'utilisateurs sortant de leur cadre habituel requièrent fréquemment d'interroger la base à un autre niveau, générant des coûts de développement ou la création de solutions de rechange. Des problèmes peuvent de fait survenir lorsque les Datamarts constituent l'unique moyen d'accès aux données pour l'utilisateur final.

Mémoire KIAKA MUSITU Héritier Page 44

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 45 sur 91

Chapitre Troisième : PRESENTATION DE LA DIRECTION GENERALE DES

IMPOTS.

III.1. PRESENTATION DE LA DIRECTION GENERALE DES IMPOTS

III.1.1. Historique et Nature Juridique de la Direction Générale des Impôts

La Direction Générale des Impôts, DGI en sigle, est une entité publique dotée de la personnalité juridique et chargée de la mobilisation des recettes fiscales de l'Etat en République Démocratique du Congo.

Le Ministère des Finances, précisément le Secrétariat Général aux Finances avait sous son autorité des directions telles que le Trésor, la Comptabilité, l'Informatique, la Gestion de la Dette Publique, la Douane, les Contributions,...

Avec l'évolution dictée par le temps et les circonstances d'une part, et le souci de rendre plus efficace et plus efficiente la gestion de ces services d'autre part, certaines directions ont été émargées de la tutelle du Secrétariat Général aux Finances pour devenir des entreprises autonomes, c'est le cas de la Direction des douanes qui deviendra Office des Douanes et Accises jusqu'à devenir par la suite Direction Générale des Douanes et Accises, de la Gestion de la Dette Publique devenue Office de Gestion de la Dette Publique.

La Direction des Contributions n'a pas, elle aussi échappée à cette situation. Ainsi, il a été proposé la création d'une structure nationale, jouissant de la compétence générale, exclusive et financière qui lui permettrait d'avoir un budget de fonctionnement conséquent, d'un effectif qualifié, adapté à ses attributions et bénéficiant d'un barème amélioré, motivant et des services de bases efficaces.

Mémoire KIAKA MUSITU Héritier Page 45

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 46 sur 91

Le 10 mars 1988, l'ordonnance loi n°88/039 portant création de la Direction Générale des Contributions fut signée. Elle sera modifiée et complétée par l'ordonnance loi n°89/101 du 12 mai 1989.

En 1991, suite à l'évolution de la matière fiscale et des nouveaux impératifs de fonctionnement, une restructuration de la DGC sera décidée, celle-ci sera suivie d'un autre, celle de 1994.

En décembre 1999 sera signé un « nouveau cadre organique aménagé ». Cette nouvelle restructuration signée par le Vice - ministre aux Finances sera transmise à la DGC par la lettre n°377/CAB/VMIN/FIN/99 du 21 décembre 1999 et sa mise en application sera effective en 2000.

Parmi les innovations du nouveau cadre organique aménagé nous citons la scission de la Direction Urbaine des Contributions en deux nouvelles Directions Urbaines des Contributions respectivement celles de Kinshasa - Est et celle de Kinshasa - Ouest.

Le 02 mars 2003, le décret n°017/2003 portant création de la Direction Générale des Impôts est signé en annulation des ordonnances lois n°88/039 et 89/101.

La nouvelle structure est placée sous l'autorité du ministère ayant les finances dans ses attributions et son siège social se trouve au croisement des avenues DES MARAIS et HAUT - CONGO à KINSHASA/GOMBE - RDC.

III.1.2. Mission de la Direction Générale des Impôts

L'article 2 du décret n°17/2003 stipule que : la Direction Générale des Impôts exerce, dans le cadre des lois et règlements en vigueur, toutes les missions et prérogatives en matière fiscale.

La Direction Générale des Impôts est donc chargée d'étudier et de soumettre à l'autorité compétente les projets de lois, de décrets et arrêtés en

Mémoire KIAKA MUSITU Héritier Page 46

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 47 sur 91

matière fiscale. Elle doit être consultée pour tout texte ou toute convention à incidence fiscale ou tout agrément d'un projet d'investissement à un régime fiscal dérogatoire.

III.2. OBJECTIF

L'objectif principal des services de la DGI est la maximisation des recettes fiscales pour le compte de l'Etat congolais.

La DGI a aussi pour objectif d'exercer ses compétences, de manière exclusive, sur toute l'étendue du territoire national.

III.3. FONCTIONNEMENT

La DGI dispose, pour son fonctionnement et la motivation de son personnel, d'une allocation budgétaire au moins égale à 5% des recettes assignées ainsi que celle de 50% des pénalités fiscales recouvrées.

Elle bénéficie également, en sus des crédits budgétaires lui alloués à cet effet, d'une quotité de 10% des pénalités recouvrées pour ses dépenses d'investissement.

III.4. STRUCTURE ADMINISTRATIVE DE LA DIRECTION GENERALE DES IMPOTS

La DGI est dirigée par un Directeur Général assisté d'un Directeur Général Adjoint, nommés et, le cas échéant, relevés de leurs fonctions par le Président de la République, sur proposition du ministre ayant les finances dans ses attributions.

Elle comprend une Administration Centrale et des Directions Urbaine et Provinciales...

Mémoire KIAKA MUSITU Héritier Page 47

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 48 sur 91

L'Administration Centrale est composée de la Direction Générale et des Directions Centrales suivantes :

- La Direction des Ressources Humaines ;

- La Direction de la Gestion Budgétaire et des services Généraux ;

- La Direction de l'Informatique ;

- La Direction des Études, de la Législation et du Contentieux ;

- La Direction de la Taxation et de la Documentation ;

- La Direction du Contrôle Fiscal ;

- La Direction du Recouvrement ;

- La Direction des Grandes Entreprises.

Les Directions Urbaine et Provinciales sont :

- La Direction Urbaine de Kinshasa ;

- Les dix Directions Provinciales, soit une par province.

La structure organisationnelle de la DGI comporte des services de deux types : les services non opérationnels qui s'occupent des aspects administratifs et des travaux de conception (services centraux et sièges de certaines Directions Provinciales des Impôts - DPI -) et les services opérationnels qui s'occupent de la gestion de l'impôt au quotidien dont la Direction des Grandes Entreprises (DGE) et les Services extérieurs qui sont les Centres des Impôts et les Centres d'Impôts Synthétiques ainsi que les Directions Provinciales.

A ce jour, la DGI a une Direction opérationnelle (la Direction des Grandes Entreprises), 3 Centres des Impôts (CDI-Kinshasa, CDI-Lubumbashi et CDI Goma dont le lancement est prévu en fin mars 2011) et 142 Centres d'Impôts Synthétiques.

Les Directions Centrales, les Directions Urbaines et Provinciales sont hiérarchiquement soumises à l'autorité du Directeur Général.

Mémoire KIAKA MUSITU Héritier Page 48

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 49 sur 91

Elles sont subdivisées en Divisions et Bureaux. La DGI dispose d'une inspection des services placée sous l'autorité directe du Directeur Général.

Mémoire KIAKA MUSITU Héritier Page 49

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 50 sur 91

III.4.1. Organigramme de la DGI

Tableau n°2 : Organigramme de la DGI

Mémoire KIAKA MUSITU Héritier Page 50

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 51 sur 91

III.4.2. Description de Postes

1. Directeur Général

Il supervise et coordonne l'ensemble des activités de la direction générale des impôts.

A ce titre, il dispose des tous les pouvoirs nécessaires et reconnus par les lois et règlements en vigueur pour l'accomplissement des taches définies ci-dessus et il gère le personnel, les crédits ainsi que les biens meubles et immeubles, présents et à venir, mis à la disposition de la DGI.

Le directeur général dispose du droit d'évoquer les affaires et peut réformer, sauf en matière contentieuse, les décisions des directeurs.

Délègue une partie de ses compétences au directeur général adjoint qui lui en rend compte. En cas d'absence ou d'empêchement ; le directeur général est provisoirement remplacé, dans la plénitude de ses fonctions, par le directeur général adjoint, à défaut de ce dernier, par un directeur désigné par le ministre ayant les finances dans ses attributions.

2. Directeur Général Adjoint

Il assiste le directeur général dans l'exercice de ses fonctions et donne ses avis sur toutes les matières. Il décide dans les matières de la compétence du directeur général lui déléguées, tout en lui rendant compte. En cas d'absence ou empêchement du directeur général adjoint, le ministre ayant les Finances dans ses attributions peut désigner un directeur pour assumer son intérim.

3. Division Administrative et Cellule Technique

C'est le cabinet du directeur général, elle est chargée de l'instruction du contentieux.

Mémoire KIAKA MUSITU Héritier Page 51

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 52 sur 91

4. L'inspection des Services

Elle contrôle les services des Directions Centrales, de la Direction des Grandes entreprises ainsi que les Directions Urbaines et provinciales sur ordre du directeur général. Elle peut être chargée des missions d'enquête et de contre vérification fiscale. Elle veille à l'application régulière des lois et règlements en vigueur et au strict respect des directives de l'administration Centrale. Elle propose, suite aux manquements constatés, les mesures disciplinaires et réformes de nature à améliorer l'organisation et le fonctionnement des services.

5. la Direction des Ressources Humaines Elle a pour attributions :

- La gestion du personnel affecté à la DGI ;

- L'organisation du recrutement des agents nécessaires au fonctionnement des services selon les modalités en vigueur en la matière ;

- La formation en cours de carrière des agents.

6. la Direction de la Gestion Budgétaire et des Services Généraux Elle a pour attributions :

- La gestion des crédits alloués à la DGI ;

- La coordination, l'harmonisation et le suivi de la gestion de la part des pénalités revenant aux services ;

- La gestion des biens meubles et immeubles mis à la disposition de la DGI.

Mémoire KIAKA MUSITU Héritier Page 52

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 53 sur 91

7. La Direction de l'Informatique

Elle a pour attributions :

- L'élaboration de la stratégie d'informatisation de système d'information

- L'informatisation des services ;

- L'élaboration des cahiers de charges des projets informatiques ;

- L'analyse, le développement, l'implantation et la maintenance des

applications et des équipements ;

- La gestion des systèmes d'exploitation et de communication par

ordinateur ;

- L'assistance technique en la matière des services tant centraux

qu'opérationnels.

8. La Direction des Études de la Législation et des Contentieux Elle est chargée :

- De la centralisation et de l'analyse des statistiques fiscales ;

- De la réalisation des études fiscales de fond ;

- De l'élaboration et de la proposition des projets de textes fiscaux ;

- De l'instruction des dossiers soumis au Directeur Général ou évoqués par

lui ;

- De la formule des avis sur tout projet du régime fiscal d'exception ;

- De la proposition de retrait éventuel des agréments fiscaux ;

- Du suivi des relations avec les autres administrations fiscales ;

- De l'élaboration et de la coordination de la supervision des politiques et

des stratégies de communication au niveau national ;

- De l'élaboration de la coordination, et de la supervision des procédures

contentieuses sur l'ensemble du territoire national ;

- De l'élaboration de la coordination administrative ;

- Du suivi des instances en cours dans les cas des recours juridictionnels ;

- De l'assistance, le cas échéant, des services opérationnels dans le

traitement des dossiers importants.

Mémoire KIAKA MUSITU Héritier Page 53

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 54 sur 91

9. La Direction de la Taxation et de la Documentation

Elle est chargée :

De la tenue, de l'actualisation et du suivi du répertoire national des contribuables ;

De la gestion du système centralisé d'attribution du numéro impôt ;

De la définition des orientations en matière d'identification des contribuables ;

De l'élaboration de la coordination et de la supervision des procédures d'assiette sur l'ensemble du territoire national ;

De l'élaboration des monographies professionnelles en liaison avec les organisations représentatives des professions ;

Du suivi des performances des services gestionnaires au niveau national.

10. La Direction du Contrôle Fiscal

Elle a pour attribution au niveau national :

> L'élaboration du programme de recherche et de regroupement ;

> La tenue et la mise à jour d'une banque à données de regroupement ;

> La coordination du programme de Contrôle Fiscal ;

> La fixation des objectifs quantitatifs et qualitatifs de contrôle ;

> L'élaboration, la coordination et la supervision des procédures

techniques et méthodes de contrôle ;

> L'évaluation des performances des services opérationnels et la

consolidation des résultats de contrôle ;

> La définition de la politique en matière de répression des infractions

fiscales et de suivi des relations avec le parquet et les juridictions

répressives ;

> L'assistance, le cas échéant, des services opérationnels dans le

traitement des dossiers importants en la matière.

Mémoire KIAKA MUSITU Héritier Page 54

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 55 sur 91

11. La Direction des Grandes Entreprises

Elle est chargée de la gestion de l'ensemble des opérations fiscales des entreprises, personnes physiques ou morales, sélectionnées suivant les critères définis par la Direction Générale des Impôts.

Elle s'occupe notamment de la tenue des dossiers uniques, du contrôle du recouvrement et du contentieux de ces entreprises en ce qui concerne tous les impôts et autres droits relevant de la compétence de la DGI ;

Elle exerce également sa compétence en matière de gestion des ressources humaines, de gestion budgétaire et services généraux et d'informatique. Elle peut disposer des antennes dans les provinces.

12. Les Directions Urbaines et Provinciales

Elles sont chargées, dans leurs ressorts, des taches non dévolues à l'Administration Centrale et à la Direction des Grandes Entreprises.

Elles exercent leur compétence en matière de ressources humaines, de gestion budgétaire et services généraux, de gestion des dossiers uniques, de contrôle fiscal, de recouvrement, de contentieux et d'informatique. Elles ont, en leur sein, des services extérieurs dénommés « Centre des Impôts », chargé de la gestion des contribuables personnes physiques.

Elles disposent, chacune d'une inspection des services qui, sur le plan local, vérifie les services sur demande du Directeur Urbain ou Provincial peut être chargées des missions d'enquête et veille à l'application régulière des lois et règlements en vigueur ainsi qu'au strict respect des directives de l'Administration Centrale et Urbaine ou Provinciale.

L'inspecteur de services propose, suite aux manquements constatés, les mesures disciplinaires et les reformes de nature à améliorer et le fonctionnement des services.

Mémoire KIAKA MUSITU Héritier Page 55

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 56 sur 91

III.5. L'IMPOT

III.5.1. Notion et définition

Pour assurer le fonctionnement des services nécessaires à la vie de la nation, l'État dispose des moyens d'action financière contenue dans le budget de l'État. Celui-ci est « l'acte par lequel sont prévues et autorisées les recettes et les dépenses des organismes publics. Il sert à régler l'activité économique en même temps qu'à réaliser les objectifs que le gouvernement juge prioritaires [7].

Selon le professeur Nsaka, le budget a deux volets à savoir les ressources et les emplois ou dépenses publiques [8]:

- Les ressources : ce sont des recettes que l'État compte mobiliser pendant une période, généralement, d'un an. Ainsi, il doit se procurer des ressources. Il peut recourir à l'impôt, aliéner son domaine, tirer des revenus de ce domaine, utiliser les moyens de trésorerie, ou recourir à l'emprunt.

- Les emplois : c'est la justification que l'État doit effectuer des dépenses lourdes pour une période déterminée d'une année.

L'impôt est donc un moyen qui procure à l'État l'essentiel de ses ressources. C'est un fait permanent et universel. « Il peut se définir comme une prestation pécuniaire et unilatérale requise des personnes physiques ou morales par voie d'autorité à titre obligatoire et définitif sans contrepartie directe ayant pour objet la couverture des dépenses publiques ou l'intervention en matière économique et sociale [9]. »

La principale caractéristique de l'impôt est qu'il est perçu sans contrepartie directe, c'est-à-dire que son paiement n'ouvre pas un service ou un droit particulier. La contrepartie existe mais elle n'est pas individualisable en vertu du principe de non-affectation. L'impôt se distingue alors de la taxe qui a une contrepartie directe. La taxe fiscale est un prélèvement opéré sur l'usager

Mémoire KIAKA MUSITU Héritier Page 56

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 57 sur 91

du service public, du fait de l'utilisateur de ce service, sans qu'il y ait d'ailleurs une équivalence exacte entre le montant du prélèvement et le cout du service : par exemple, ma taxe spéciale de circulation routière (TSCR)

III.5.2. Types d'impôts

Nous pouvons classifier les impôts selon quatre critères

principaux :

a) Un revenu :

Dans cette catégorie, c'est la richesse produit par le capital ou le travail qui constitue l'assiette de l'impôt. On citer :

- L'impôt sur les bénéfices ;

- L'impôt sur les rémunérations ;

- L'impôt sur m*les professions libérales ;

- La taxe sur la plus-value de réévaluation de l'actif immobilisé ;

- L'imposé sur les revenus mobiliers.

b) Une dépense

Il s'agit de l'impôt qui frappe la consommation à l'occasion de la vente, la circulation ou même la détention d'objet ou des produits taxés.

Nous citons :

- L'impôt sur le chiffre d'affaires ; - Les droits de consommation ; - Les droits d'entrée, etc.

Mémoire KIAKA MUSITU Héritier Page 57

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 58 sur 91

c) La fortune

L'impôt est assis sur le patrimoine ou la transmission des éléments du patrimoine. Il s'agit de l'impôt et la taxe sur la propriété des biens immeubles c'est-à-dire l'impôt réel sur les terrains, sur les bâtiments, sur les véhicules, sur les bateaux ainsi que les droits succession perçu à raison de la mutation de propriété à cause de la mort, etc.

2° selon le mode de liquidation

La liquidation consiste en l'application du tari aux bases d'imposition ou assiettes pour fixer le montant de l'impôt, la constatation de l'exigibilité ainsi que pour la détermination redevable.

Il existe plusieurs méthodes pour liquider des impôts:

a) La méthode des quotités : elle consiste à calculer l'impôt en utilisant les taux déterminés qui s'appliquent à tous les contribuables (application d'un barème, d'une quotité) ;

b) La méthode de répartition : elle consiste à calculer préalablement l'impôt global, ensuite à désigner les contribuables suivant un plan de répartition territoriale ;

c) La méthode proportionnelle : elle consiste à liquider l'impôt en soumettant la matière imposable à un taux constant ;

d) La méthode progressive : elle consiste à liquider l'impôt en

soumettant la matière imposable à un taux à croissant. On distingue :

- La progressivité globale : la manière imposable est répartie en catégories dont chaque part du minimum exonéré pour aboutir à un plafond déterminé ; des taux d'impôts des plus en plus élevés sont appliqués aux catégories successives ;

- La progressivité par tranches : tous les revenus sont découpés en un certain nombre de tranches égales ou inégales ; les tranches successives sont affectés d'un taux d'imposition différent de plus en plus élevé ;

Mémoire KIAKA MUSITU Héritier Page 58

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 59 sur 91

- L'impôt dégressif : l'impôt est calculé en appliquant un taux maximum à l'ensemble de la matière imposable ; ce taux est réduit, dans une mesure plus ou moins large en faveur de revenu modeste.

3° selon l'incidence de l'impôt sur la situation économico - financière nous distinguons :

- L'impôt direct : c'est celui qui frappe périodiquement le revenu ; il porte sur les revenus des personnes. (BI ; BS);

- L'impôt indirect : il frappe les fonds particuliers intermittents. Il

porte sur les dépenses ou sur les objets. (ex : IPR, ICA)

4° selon de mode de recouvrement ou de perception

L'impôt est payé soit au comptant ou après un certain délai. L'impôt au comptant est exigible immédiatement. Il est également appelé impôt spontané.

Par impôt spontané, il faut entendre celui qui payé librement, sans que le service adresse préalablement au contribuable un avis de paiement. Le paiement est fait le plus souvent à l'appui d'une déclaration.

Par contre, l'impôt dont le paiement peut être différé est appelé impôt enrôlé.

Par impôt enrôlé, il faut comprendre celui qui est mis en recouvrement après que la déclaration du contribuable ait fait l'objet d'une taxation, la quelle conduit à la confection d'un rôle, c'est-à-dire une liste de créances nominatives rendue exécutoire par le Directeur Général ou par le Directeur Provincial des Impôts, ou encore par leurs délégués.

Mémoire KIAKA MUSITU Héritier Page 59

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 60 sur 91

III.5.3. Opérations d'exécution d'impôt

L'exécution d'une recette en général et de l'impôt en particulier, comporte quatre phases :

1° L'assiette de l'impôt ou l'engagement ou encore la constatation.

Il s'agit de l'opération qui consiste à constater les faits, de la matière imposable avec l'évaluation qui en a été faite par le contribuable. En effet, le système fiscal congolais est pour l'essentiel fondé sur un système déclaratif, de ce fait, le contribuable étable lui -même, sur base d'une déclaration qu'il remplit, l'assiette de l'impôt et/ou la matière imposable. Sa bonne fois est présumée est ses déclarations sont réputées sincères et complètes. Mais il doit être en mesure de justifier les éléments déclaratifs faits par le contribuable. Toutefois, l'Administration fiscale dispose d'un pouvoir de contrôle visant la recherche de contribuables ou de redevables défaillants et l'analyse des éléments déclarés. Elle peut, le cas échéant, établir elle-même l'assiette imposable assortie de pénalités fiscales.

2° La liquidation : elle consiste à déterminer les montants des droits à payer par les contribuables. Ce calcul se fait par application des taux, des tarifs conformément aux lois et règlement en vigueur. En pratique, elle consiste en l'application des taux, des tarifs aux bases d'imposition ou assiettes, pour fixer le montant de l'impôt et pour la constatation de l'exigibilité ainsi que pour la détermination du redevables

3° L'ordonnancement : l'opération par laquelle l'Ordonnateur ou son délégué donne, conformément aux résultats de la liquidation, l'ordre de percevoir. Il se traduit par l'émission d'une note de perception permettant de donner à la recette l'imputation convenable et d'en autoriser la perception. Quant à l'impôt enrôlé, la note de perception doit être accompagnée d'un Avertissement-Extrait de Rôle, qui est un avis de paiement indiquant le montant à payer et date d'exigibilité.

Mémoire KIAKA MUSITU Héritier Page 60

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 61 sur 91

4° Le recouvrement ou la perception : l'acte par lequel le contribuable s'acquitte de sa dette en versant le montant au profit du Trésor, qui perçoit par le bilais du comptable ou du Receveur des impôts. Dans ce sens, le recouvrement couvre l'opération de versement et de perception de l'impôt.

III.6. PRESENTATION DU SCHEMA RELATIONNEL DE LA BASE DE DONNEES EXISTANTE

Notons que la D.G.I dispose d'une base existante dont le schéma relationnel nous servira pour la conception de notre datamart afin d'effectuer des analyses multidimensionnelle. Partant du MCD globale de l'entreprise, nous allons créer un sous MCD qui pourra faciliter notre étude.

Voici, les sous domaines nous concernant pour la mise en place de notre Datamart :

Figure n°13 Sous Schéma relationnel de la base existante

Mémoire KIAKA MUSITU Héritier Page 61

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 62 sur 91

Chapitre .IV. CONCEPTION D'UN DATAMART POUR LE PILOTAGE DU

SYSTEME DE GESTION DES IMPOTS CAS DE LA DIRECTION GENERALE DES IMPOTS

IV.1. APPORT DE L'INFORMATIQUE DECISIONNELLE A L'ENTREPRISE

Comme nous l'avons définis ci-haut, l'informatique décisionnelle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la décision et de permettre aux décideurs de la stratégie d'entreprise d'avoir une vue globale de l'activité traitée au sein de l'entreprise.

L'accumulation de ces données nécessite donc leur sauvegarde dans le but d'une future exploitation. On constate ainsi régulièrement que chaque service possède son tableau de bord, ce qui lui permet de mesurer ou encore évaluer les indicateurs de performance de l'entreprise (chiffre d'affaire, calculs de bénéfices de l'année...). Cependant, chaque service a bien souvent sa façon de stocker ses informations peut être aussi dans différents formats (par exemple dans un fichier Excel, une base de données MySQL, Access, SQL Serveur...), et sa manière de calculer les indicateurs, avec sa vérité et ses critères. Ainsi, si l'on veut considérer les données de l'entreprise dans son ensemble, la tâche s'avère rude voire parfois impossible. Pourtant, cela constituerait une utilité évidente et un réel apport à la société. En effet, une mise en relation et une analyse de toutes les données permettraient de réaliser des études et des prévisions sur le comportement et la santé de l'entreprise. Le monde décisionnel analyse des données agrégées pour mieux apprécier l'ensemble de l'activité de l'entreprise. L'aide à la prise de décision est la responsabilité de quelques personnes dans l'entreprise (décideurs). En effet, les décideurs s'intéressent à l'ensemble de l'activité et souhaitent avoir une vue globale de la société.

Mémoire KIAKA MUSITU Héritier Page 62

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 63 sur 91

Dans le monde décisionnel, on ne supprime jamais des données, on archive. Les outils de BI (business intelligent) permettent une exploitation rationnelle et coopérative des données (contrairement à l'informatique de gestion ou l'on produit de l'information grâce aux bases de données relationnelles).

Retenons que l'informatique décisionnelle ne prend pas la décision au sein de l'entreprise. Mais c'est un outil d'aide afin de permettre aux décideurs d'avoir une vue globale sous plusieurs dimensions de l'entreprise en un temps record pour analyser les indicateurs ou axes de performances.

IV.2. ANALYSE DES BESOINS

La Direction Générale des Impôts éprouve des difficultés pour maximiser ses recettes en vue d'approvisionner le budget de l'Etat, afin d'assurer le fonctionnement des services nécessaires à la vie de la Nation en même temps que réaliser les objectifs que le gouvernement juge prioritaires. Pour rendre plus performante sa gestion du point de vue financier, elle présente les besoins d'effectuer des analyses multidimensionnelles sur :

- La masse d'argent par Impôt ;

- Le chiffre d'affaire par type contribuable et par province ; - Les contribuables actifs ;

- Les contribuables inactifs.

IV.3. CHOIX DE METHODE

En ayant l'oeil tourné sur la base existante qui représente une partie de la vie du système de gestion des impôts, c'est la méthode bottom-up qui s'est imposée. Nous concevons une étoile représentative du datamart de l'analyse de masse d'argents par impôt.

Mémoire KIAKA MUSITU Héritier Page 63

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 64 sur 91

IV.4. CHOIX DU MODELE

L'importance masse d'informations sur les impôts nécessite de mettre en place un modèle dimensionnel qui évite les redondances afin de gagner en espace de stockage, c'est la raison pour laquelle nous avons opté pour le modèle en flocon.

IV.5. PROPOSITION DU NOUVEAU SYSTEME

Compte tenu des besoins expliqués au point IV.2. du chapitre quatre, le schéma relationnel global est découpé en sous schéma qui a permis notre analyse multidimensionnelle.

Puisqu'il s'agit d'analyser des mouvements de paiement d'impôt par des contribuables de la DGI, un outil d'extraction, de transformation et de chargement des données doit être utilisé en vue de la transformation d'entité mouvement impôt en fait « argent payé par contribuable )) par comptage de solde.

A part l'entité mouvement impôt qui sera transformé en table de fait, on aura aussi la mesure « solde )) issue du comptage des recettes dans la table contribuable par ETL.

La structure du modèle conceptuel des données nous impose de considérer les autres entités comme tables de dimensions organisées hiérarchiquement.

Mémoire KIAKA MUSITU Héritier Page 64

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 65 sur 91

IV.6. TABLEAU DES SPECIFICATIONS DES BESOINS

La construction du tableau des données décisionnelles utilise les questions décisionnelles et schéma Entité-Relation initial, afin de faire un tri des données décisionnelles nécessaires à la construction d'un Magasin de données.

Attribut

Description

M

D

Autres

Numéro

Numéro d'enregistrement contribuable

 

X

 

NomContribuable

Nom contribuable

 

X

 

CodeProvince

Code du province

 

X

 

Sigle

Sigle du province

 

X

 

LibelleAdresseEtab

Libellé et adresse d'établissement

 
 

X

Telephone

Numéro téléphone du contribuable

 

X

 

DateSaisie

Date de saisie

 

X

 

Ref_Impot

Référence impôt

 

X

 

NomImpot

Nom Impôt

 

X

 

TypeImpot

Type Impôt

 

X

 

Echeance

Echéance

 

X

 

Code_Fac

Code Facture

X

 
 

NomContribuable

Nom Contribuable

 

X

 

Ref_Impot

Référence Impôt

 

X

 

DatePaie

Date Paiement

 

X

 

Solde

Solde montant

 

X

 

Code_Province

Code Province

 

X

 

Code_Periode

Code Période

 

X

 

Mois

Mois

X

 
 

Annee

Année

 
 
 

LibelleProvince

Libelle Province

 
 
 

NatureImpôt

Nature Impôt

 
 
 

NomImpôt

Nom Impôt

 
 
 

SigleImpôt

Sigle Impôt

 
 
 

Catégorie

Catégorie impôt

 
 
 

TauxImpôt

Taux Impôt

 
 
 

Tableau n°3 : Spécifications des besoins

Mémoire KIAKA MUSITU Héritier Page 65

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 66 sur 91

IV.6.1. Identifier les activités à modéliser :

L'analyse et la spécification des données fait ressortir l'activité

suivante :

? Mouvement Impôt

IV.6.2. Identifier le sous schéma conceptuel

On peut recenser le sous schéma en rapport avec l'activité à modéliser, afin de pouvoir classifier les entités à partir du schéma Entité-Relationnel initial, on a le sous schéma suivant :

Figure n° 14 Sous schéma entité relation

Mémoire KIAKA MUSITU Héritier Page 66

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 67 sur 91

IV.6.3. Classification des entités et détermination du gain

Classification de sous schéma obtenu doit faire apparaitre les entités composantes, transactionnelles et de classification.

Activité : Mouvement Impôt

Entité

Transactionnelles

Entité

Composantes

Entité

Classification

Solde

Contribuable Impôt

Période

Province Type Impôt

Tableau n°4 : Classification des entités et détermination du gain

IV.6.4. Identification des Hiérarchies

On détermine toutes les hiérarchies maximales ou autres : Activités Mouvement Impôt

1. Solde (entité minimale) _ Impôt _TypeImpôt (entité maximale).

2. Solde (entité minimale) _ Contribuable_ Province (entité maximale).

3. Solde (entité minimale) _ Période (entité maximale).

IV.6.5. Production du Modèle dimensionnel :

Il ya un large choix d'options pour la production des modèles multidimensionnels, chacune de ces différentes options représente le compromis entre la complexité et la redondance.

Mémoire KIAKA MUSITU Héritier Page 67

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 68 sur 91

IV.6.6. Rappel des règles de passage pour le schéma en étoile :

- Une table de fait est formée pour chaque entité de transaction. La clef de la table est la combinaison des clefs de ses entités associées ou composantes.

- Une table de dimension est formée pour chaque entité de composante, par réduction de la hiérarchie liée aux entités de classification dans cette entité composante.

- Quand des relations hiérarchiques existent entre des entités de transaction, l'entité d'enfant hérite toutes les dimensions (et clefs d'attributs) de l'entité parentale, cela fournit la capacité de «Drill Down » entre les niveaux de transaction.

- Attributs numériques dans entités de transaction doit être agrégé par des attributs clefs (des dimensions).

Nous optons pour un schéma en étoile pour l'activité Mouvement Impôt, ce choix est motivé par :

- L'existence d'une seule entité transactionnelle, donc une seule table de faits.

- La taille des tables des dimensions (Contribuable, Impôt, Période) sont très négligeables par rapport à la table de faits.

Mémoire KIAKA MUSITU Héritier Page 68

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 69 sur 91

Donc on peut dénormaliser notre schéma multidimensionnel pour l'activité Mouvement Impôt.

Figure n015 Schéma du datamart de la DGI

IV.7. DEFINITION DES CONTRAINTES D'AGREGATION

L'étape suivante doit définir des niveaux de restriction pour toutes les mesures le long des différents chemins d'agrégation dans chaque schéma de fait :

Niveau de Restriction

Fonction d'agrégation Applicable

1

{SUM, AVG, MIN, MAX, STDDEV, VAR, COUNT}

2

{ AVG, MIN, MAX, STDDEV, VAR, COUNT}

3

{ COUNT}

4

{ }

Table n05 : Classification des niveaux de restriction

Mémoire KIAKA MUSITU Héritier Page 69

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 70 sur 91

Schéma de Fait

Mesures

Niveaux de

dimension

Niveau de

restriction

 

Montant

Contribuable

1

 
 

Impôt

1

 
 

Période

1

 

Solde

Contribuable

1

 
 

Impôt

2

 
 

Période

1

Table n°6: contrainte d'agrégation pour le schéma de Fait : Mouvement Impôt

IV.8. DIFFERENTS ETAPES D'IMPLEMENTATION DU CUBE DGI

1. Nous nous rendons dans le menu Démarrer / Tous les programmes / Microsoft SQL server 2008/2008 R2 puis lancez SQL Server Business Intelligence Development Studio.

Mémoire KIAKA MUSITU Héritier Page 70

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 71 sur 91

2. Après le lancement de Visual Studio nous pouvons créer notre projet de base de données Analysis Services. Pour cela, allez dans le menu Fichier / « Nouveau / Projet ou utilisez la raccourci Ctrl + Maj + N

Nous obtenons :

1) Type de projets : nous choisissons Projet Business Intelligence

2) Modèles : Nous sélectionnons Projet Analysis Services

3) Nom : Nous saisissons le nom que nous allons donner au projet de base de données, ici test DGI

Mémoire KIAKA MUSITU Héritier Page 71

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 72 sur 91

3. Dans l'explorateur de solution qui est présent à droite de la fenêtre de BIDS, nous obtenons la structure suivante pour notre projet test :

Pour alimenter une base de données Analysis Services, il est nécessaire de définir une source de données relationnelle. Nous allons donc créer et définir les propriétés de connexion de celle-ci.

1. Nous allons lancer l'assistant Source de données, pour cela, nous nous rendons dans l'explorateur de solution. Nous faisons un click-droit sur le

répertoire Source de données puis Nouvelle source de données...

Mémoire KIAKA MUSITU Héritier Page 72

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 73 sur 91

2. Nous allons créer et configurer les propriétés de la connexion à la base de données relationnelle qui va servir de source de données, pour cela, nous cliquons sur le bouton Nouveau...

Mémoire KIAKA MUSITU Héritier Page 73

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 74 sur 91

3. A l'étape Informations d'emprunt d'identité nous choisissons Hériter

4. A la fin de l'assistant nous pouvons nommer notre source de données et cliquer sur Terminer :

Mémoire KIAKA MUSITU Héritier Page 74

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 75 sur 91

Une fois la source de données créée, nous allons pouvoir ajouter la vue de source de données, qui est une couche d'abstraction entre la base relationnelle et le contenu de la base OLAP. Elle va ainsi nous permettre d'ajouter une référence vers les tables et les vues présentes dans la base source, sans avoir à modifier le contenu de cette dernière. De plus si le contenu des tables et vues de la base source ne correspond pas exactement à nos besoins, nous aurons aussi la possibilité de définir dans le langage SQL, des calculs nommés sur nos tables, voire des requêtes nommées, véritables équivalent de vues SQL. Nous pourrons ensuite les utiliser pour construire nos objets OLAP (dimensions et cubes).

1. Nous allons lancer l'assistant de vue de source de données, pour cela, nous nous rendons dans l'explorateur de solution. Nous faisons un click-droit sur le répertoire Vues des sources de données puis Nouvelle vue des sources de données...

Mémoire KIAKA MUSITU Héritier Page 75

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 76 sur 91

2. La source de données que nous avons créée lors de l'étape précédente est sélectionnée, cliquez sur Suivant

3. Nous allons ajouter toutes les tables disponibles dans la base DGI :

Mémoire KIAKA MUSITU Héritier Page 76

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 77 sur 91

Nous cliquons sur le bouton portant le symbole « >> » puis sur Suivant.

4. A la fin de l'assistant nous pouvons nommer notre Vue de source de données et cliquer sur Terminer

Mémoire KIAKA MUSITU Héritier Page 77

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 78 sur 91

Le concepteur de Vue de source de données est ouvert et nous obtenons :

Conception des dimensions :

Mémoire KIAKA MUSITU Héritier Page 78

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 79 sur 91

2. A l'étape Sélectionner la méthode de création, nous conservons l'option Utiliser une table existante présélectionnée par défaut :

4. A l'étape suivante, nous sélectionnons la table DimImpot dans la liste Table principale. La colonne est alors sélectionnée par défaut dans la liste des colonnes clés car c'est la clé primaire de la table. Elle servira de colonne clé pour l'attribut clé qui constitue l'attribut principal de la dimension. Pour définir la colonne qui servira de source au libellé de cet attribut, nous choisissons Ref_Impot dans la liste Colonne de nom, puis nous cliquons sur Suivant.

Mémoire KIAKA MUSITU Héritier Page 79

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 80 sur 91

5. Pour pouvoir ajouter des attributs supplémentaires à la dimension

Impôt, nous cochons les cases pour les champs TypeImpot, nous cliquons sur Suivant.

Mémoire KIAKA MUSITU Héritier Page 80

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 81 sur 91

6. A la dernière étape de l'assistant, nommons notre dimension Impôt et cliquez sur Termine :

Nous nous retrouvons dans le concepteur de dimension. Grâce à celui-ci, nous allons modifier manuellement la dimension Impôt.

On modifie manuellement la dimension contribuable.

Mémoire KIAKA MUSITU Héritier Page 81

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 82 sur 91

Mémoire KIAKA MUSITU Héritier Page 82

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 83 sur 91

Conception de vue DGI

1. Dans l'explorateur de solutions nous faisons un clic droit sur le répertoire Cube puis Nouveau Cube

2. Dans le premier écran de l'Assistant Cube conservé le choix par défaut et nous cliquons sur Suivant

3. A l'étape suivante, nous cliquons sur le bouton Suggérer, nous constatons que tables de faits : FaitMouvementImpot est automatiquement cochées dans la liste de table. Cela est dû à la structure de notre base SQL et à relations récupérées depuis celle-ci dans la Vue de source de données. Nous cliquons sur Suivant.

Mémoire KIAKA MUSITU Héritier Page 83

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 84 sur 91

4. Dans l'écran choix des mesures, nous décochons uniquement Fait Mouvement_Impot Nombre et nous cliquons sur Suivant

Mémoire KIAKA MUSITU Héritier Page 84

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 85 sur 91

5. Nous conservons toutes les dimensions qui sont sélectionnées et nous cliquons sur Suivant

6. A la dernière étape nous cliquons sur Terminer

Mémoire KIAKA MUSITU Héritier Page 85

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 86 sur 91

7.

Nous allons déployer notre base DGI et son contenu (Source de données, dimensions, cubes...) sur le serveur Analysis Services. Dans l'explorateur de solution, nous faisons un click-droit à la racine du projet test puis Déployer.

8. Nous pouvons donc tester notre cubes DGI en nous rendant dans le dernier onglet du concepteur de cube, l'onglet Parcourir et en sélectionnant les éléments du cubes et les disposant à la manière d'un tableau croisé dynamique tel que nous pourrions le faire dans le tableau Excel de la suite Office.

Mémoire KIAKA MUSITU Héritier Page 86

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 87 sur 91

CONCLUSION

Nous voici enfin arrivé au terme de notre conception portant sur « Conception d'un datamart pour le pilotage du système de gestion des impôts cas de la direction générale des impôts » qui est conçue pour la direction générale des impôts en République Démocratique du Congo.

Notre préoccupation était de démontrer qu'une base de données relationnelle modélisée selon les principes classiques de normalisation s'adapte mal à un contexte analytique où la masse d'argent et le nombre de contribuables doivent être analysés suivant les différents axes. La personne qui analyse doit disposer d'un modèle relativement intuitif et capable de stocker le résultat de nombreux calcul d'agrégation; ce qui, d'un point de vue strictement relationnel, constitue une redondance. Nous pensions que seule l'informatique décisionnelle dans son aspect entrepôt de données permettait de contribuer à résoudre le problème.

La décision stratégique est une action entreprise par les décideurs de l'entreprise et qui vise à améliorer, quantitativement ou qualitativement la performance de l'entreprise.

La BI est riche en solution et concepts, et elle permet de mettre en place des projets pour les grandes entreprises d'aujourd'hui.

Nous devons reconnaitre que le datamart étant une méthode d'analyse qui s'avère payante, cependant peu d'entreprises en utilisent, alors notre investigation consistait à vulgariser les datamarts afin de permettre aux entreprises de bien vouloir analyser sur les différents domaines.

En effet, nous avons rencontré des difficultés au cours de notre étude tant au niveau de la collecte des données qu'à la réalisation de ce travail, nous pensons avoir résolu tant soit peu le problématique posé au début de notre étude.

Nul n'est parfait comme le déclare la Bible, ce travail demeure ouvert à toute critique et suggestion constructive en vue de son amélioration.

Mémoire KIAKA MUSITU Héritier Page 87

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 88 sur 91

BIBLIOGRAPHIE

I. OUVRAGES

1. J.de ROSNAY-le macroscope : éd. du seuil, Paris, 1975

2. Yazid grim : Business Intelligence, France, Eyrolle, 2000

3. Dot net France Association-valentin Pauline

4. Mahomed Taslimanka Sylla : Initiation au décisionnel, Datawarehouse, Proc, ICDE ; 1997

5. Ralph Kimball, La boîte à outils de l'Entrepôt de données, France, Paris, 1996

6. Bill Inmon, Construire l'Entrepôt de Données, Dunod, Paris, 1991

7. Ikelemba Mputu, Budget des dépenses publiques en capitale et son impact sur la croissance de l'économie Zaïroise de 1971 à 1990, Mémoire, UNIKIN, 1993

8. Nsaka, Finances Publiques, cours [inédit], IC3, EIFI, 2004

9. Pascal Bertoni, Finances publiques, 3° édition, librairie Vuibert, Paris, 2001

10. Olivier TEST, Thèse de Doctorat de l'université Paul Sabatier TOULOUSE, « Modélisation et manipulation d'entrepôt de données complexes et historisées », 2000

11. Edgar Franck CODD, Poviding OLAP to user-analysts : an IT mandate » Technical Report, E.F Codd and Associates, 1993

II. NOTES DE COURS

1. Jean Louis KAZADI, Informatique décisionnelle, cours, [inédit] L2 Math-Info, UPN, 2010-2011

2. Jean Louis KAZADI, Conception d'entrepôt de données, cours, [inédit], L2 Math-Info, UPN, 2010-2011

WEBOGRAPHIE

1. http : // www.grim.developpez.com

2. http : // www.grim.developpez.com/ cours/business intelligence// concepts/ conception_data Warehouse.

Mémoire KIAKA MUSITU Héritier Page 88

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 89 sur 91

TABLE DES MATIERES

0.1. PROBLEMATIQUE ET HYPOTHESE 2

0.2. CHOIX ET INTERET DU SUJET 3

0. 3. DELIMITATION DU SUJET 4

0.4. METHODES ET TECHNIQUES UTILISEES 4

0.4.1. Méthodes 4

0.4.2. Techniques 5

Chapitre Premier : GENERALITES SUR L'INFORMATIQUE DECISIONNELLE 6

I.1. INTRODUCTION 6

I.2. SYSTEME D'INFORMATION 6

I.3. L'INFORMATION DECISIONNELLE 8

I.3.I. Business intelligente dans le système d'information 10

I.3.2. Les outils d'aide à la décision 12

I.3.3. Les outils de manipulation décisionnelle 12

I.4. LES NOTIONS OLAP ET OLTP 13

I.4.1. OLTP à OLAP 13

I.4.2. Le principe OLAP 15

I.5. CHAINE DECISIONNELLE ET OUTILS DE L'INFORMATIQUE DECISIONNELLE 16

I.6. ARCHITECTURE D'UN SYSTEME DECISIONNEL 17

I.7. OUTILS D'EXTRACTION 19

I.7. I. Définition 19

I.7.2. L'outil de l'ETL (Extract Transform Loading) 20

I.7.3. Les Le processus ou fonctions d'ETL 20

I.8. LES CUBES OLAP 21

I.8.1.Navigation dans un cube 22

I.8.2. Implémentations OLAP 22

I.9. FAIT ET DIMENSION 24

I.9.1. Fait 24

I.9.2. Dimension 24

I.10. Concept d`hiérarchie 25

I.10.1. Hiérarchies Simple 25

I.10.2. Hiérarchies Multiple 25

Chapitre Deuxième : CONCEPT DE BASE SUR L'ENTREPOT DE DONNEES 27

II.1. INTRODUCTION 27

II.2. DEFINITION D'UN ENTREPOT DE DONNEES 28

II.2.1. Données orientées sujets 29

II.2.2. Données intégrées 29

II.2.3. Données non volatiles 30

Mémoire KIAKA MUSITU Héritier Page 89

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 90 sur 91

II.2.4. Données historisées 30

II.2.5. Données agrégées 31

II.2.6. Méta-données 31

II.3. UTILITE D'UN ENTREPOT DE DONNEES 31

II.4. LES ARCHITECTURES D'UN ENTREPOT DE DONNEES 32

II.4.1. L'architecture Réelle 32

II.4.2. L'architecture Virtuelle 33

II.4.3. L'architecture Remote 33

II.5. ARCHITECTURE TECHNIQUE D'UN ENTREPOT DE DONNEES 34

II.7. COMPOSANTS DE BASE OU ARCHITECTURALES D'UN ENTREPOT DE

DONNEES 34

II.8. TABLE DE FAITS 36

II.9. TABLE DE DIMENSION 36

II.10. LES MESURES 36

II.11. MODELES DE CONCEPTION D'UN ENTREPOT DE DONNEES 37

II.11.1. Modélisation en étoile 37

II.11.2. Modélisation en flocon 38

II.11.3. Modélisation en Constellation 40

II.11.4. Modélisation en Grappe 40

II.12. APPROCHES DE MISE EN PLACE D'UN DATA WAREHOUSE 40

II.12.1.Approche Top-down 41

II.12.2. Approche Bottom-up 41

II.12.3. Approche Middle-out 41

II.13. LE MAGASIN DE DONNEES 42

II.13.1. Introduction 42

II.13.2. Définition 42

II.13.3 Structure physique et théorique 43

II.13.4 Place du DataMart dans la structure de données 43

II.13.5 Interaction avec les utilisateurs 43

II.13.6. Intérêt et limites 44

Chapitre Troisième : PRESENTATION DE LA DIRECTION GENERALE DES IMPOTS. 45

III.1. PRESENTATION DE LA DIRECTION GENERALE DES IMPOTS 45

III.1.1. Historique et Nature Juridique de la Direction Générale des Impôts 45

III.1.2. Mission de la Direction Générale des Impôts 46

III.2. OBJECTIF 47

III.3. FONCTIONNEMENT 47

III.4. STRUCTURE ADMINISTRATIVE DE LA DIRECTION GENERALE DES IMPOTS 47

III.4.1. Organigramme de la DGI 50

III.4.2. Description de Postes 51

Mémoire KIAKA MUSITU Héritier Page 90

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)

Page 91 sur 91

III.5. L'IMPOT 56

III.5.1. Notion et définition 56

III.5.2. Types d'impôts 57

III.5.3. Opérations d'exécution d'impôt 60

III.6. PRESENTATION DU SCHEMA RELATIONNEL DE LA BASE DE DONNEES EXISTANTE 61

Chapitre .IV. CONCEPTION D'UN DATAMART POUR LE PILOTAGE DU SYSTEME DE GESTION

DES IMPOTS CAS DE LA DIRECTION GENERALE DES IMPOTS 62

IV.1. APPORT DE L'INFORMATIQUE DECISIONNELLE A L'ENTREPRISE 62

IV.2. ANALYSE DES BESOINS 63

IV.3. CHOIX DE METHODE 63

IV.4. CHOIX DU MODELE 64

IV.5. PROPOSITION DU NOUVEAU SYSTEME 64

IV.6. TABLEAU DES SPECIFICATIONS DES BESOINS 65

IV.6.1. Identifier les activités à modéliser : 66

IV.6.2. Identifier le sous schéma conceptuel 66

IV.6.3. Classification des entités et détermination du gain 67

IV.6.4. Identification des Hiérarchies 67

IV.6.5. Production du Modèle dimensionnel : 67

IV.6.6. Rappel des règles de passage pour le schéma en étoile : 68

IV.7. DEFINITION DES CONTRAINTES D'AGREGATION 69

IV.8. DIFFERENTS ETAPES D'IMPLEMENTATION DU CUBE DGI 70

CONCLUSION 87

BIBLIOGRAPHIE 88

TABLE DES MATIERES 89

Mémoire KIAKA MUSITU Héritier Page 91

Conception d'un Datamart pour le pilotage du système de gestion des impôts (cas de la DGI)






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld