REPUBLIQUE DEMOCRATIQUE DU CONGO MINISTERE DE
L'ENSEIGNEMENT SUPERIEUR ET UNIVERSITAIRE
UNIVERSITE PEDAGOGIQUE NATIONALE
FACULTE DES SCIENCES
DEPARTEMENT DE MATHEMATIQUE ET INFORMATIQUE
B.P. 8815
KINSHASA / NGALIEMA
CONCEPTION D'UN DATAMART POUR LE PILOTAGE DU SYSTEME DE
GESTION DES IMPOTS
« CAS DE LA DIRECTION GENERALE DES IMPOTS
»
KIAKA MUSITU Héritier
Mémoire présenté et
défendu en vu de l'obtention du titre de Licencié en sciences
Option : Mathématique - Informatique Orientation : Conception des
Systèmes
d'Informations
Directeur : ENGOMBE WEDI Boniface
Professeur
Co-directeur : Jean-Louis KAZADI
Chef de Travaux
Année Académique 2010 -
2011
Page 2 sur 91
O. INTRODUCTION
0.1. PROBLEMATIQUE ET HYPOTHESE
Dans les entreprises, actuellement l'informatique est devenue
une discipline à part entière souvent organisée. Cela est
l'aboutissement logique de l'évolution et de l'importance de cette
discipline dans les différents domaines scientifique, commercial, et
autres. Il est actuellement un fait établi que l'informatique peut
être considérée comme l'élément moteur
principal du développement des entreprises car la performance d'une
entreprise dépend aussi de sa qualité de prise de
décision.
Les entreprises sont confrontées à une
concurrence de plus en plus forte, des clients de plus en plus exigeants, dans
un contexte organisationnel de plus en plus complexe et mouvant.
Pour faire face aux nouveaux enjeux, l'entreprise doit
collecter, traiter, analyser les informations de son environnement pour
anticiper les stratégies. Mais cette information produite par
l'entreprise est surabondante, non organisée et
éparpillée dans de multiples systèmes
opérationnels hétérogènes et peut provenir de
toutes les places de marchés (mondialisation des échanges).
Il devient fondamental de rassembler et
d'homogénéiser les données afin de permettre l'analyse des
indicateurs pertinents pour faciliter la prise de
décisions.
Pour répondre aux besoins de nos entreprises le cas
cité ici la Direction Générale des Impôts (DGI), le
nouveau rôle de l'informatique décisionnelle est de définir
et d'intégrer une architecture qui serve de fondation aux applications
décisionnelle : le datamart qui résoudra les difficultés
de l'analyser de la masse d'informations à la D.G.I
Mémoire KIAKA MUSITU Héritier Page 2
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 3 sur 91
Nous pensons que l'informatique décisionnelle dans son
aspect « entrepôt de données» est une solution au
problème de prise de décision de l'organisation au vu de son
contexte, de ses contraintes, de ses objectifs poursuivis sur les plans
sécurité, développement et rentabilité ou encore
performance.
C'est ainsi que la conception d'un datamart pour l'analyse
multidimensionnelle des ressources financières, semble être la
solution idoine (adéquate) aux problèmes ci-haut
évoqués.
0.2. CHOIX ET INTERET DU SUJET
L'intérêt qui nous a conduits à
rédiger ce mémoire et à choisir ce thème
d'étude « Conception d'un datamart pour le pilotage des
systèmes de gestion des impôts cas de la direction
générale des impôts» est justifié par
les raisons suivantes :
Les entreprises, après avoir informatisé les
principales activités ou secteur pour leur survie journalière
(gestion de recette, facturation, comptabilité, gestion de stocks et
vente, et autres) se trouvent en face de nombreuses difficultés de
regrouper les données de l'entreprise pour des fins analytiques et pour
aider à la décision stratégique. La décision
stratégique est une action entreprise par les décideurs de
l'entreprise et qui vise à améliorer, quantitativement ou
qualitativement la performance de l'entreprise. L'entrepôt de
données est la seule alternative pour modéliser de l'information
pour des fins analytiques. D'où l'importance de renseigner nos lecteurs
intéressés sur la conception d'un datamart (magasin de
données).
Mémoire KIAKA MUSITU Héritier Page 3
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 4 sur 91
0. 3. DELIMITATION DU SUJET
La conception d'un entrepôt de données pour
l'analyse multidimensionnelle de la masse d'argent payé par les
contribuables de la DGI constitue une matière très vaste et
complexe à développer. Ainsi, compte tenu du temps qui nous est
imparti, nous nous sommes limités à la conception d'un datamart
pour l'analyse multidimensionnelle des mouvements de paiement d'impôts.
Celui-ci servira à l'analyse de différents faits suivant des
dimensions variées.
0.4. METHODES ET TECHNIQUES UTILISEES
Tout travail scientifique doit se soumettre à des
exigences méthodologiques afin de rendre sa démarche intelligible
et logique.
0.4.1. Méthodes
Définition :
R. Pinto et Madeleine Grawitz disent que la
méthode est l'ensemble des opérations intellectuelles par les
quelles une discipline cherche à atteindre les vérités
qu'elle poursuit, les démontrent, les vérifient. Ainsi, la
réalisation d'un travail scientifique ne peut se faire sans
l'utilisation systématique de méthode de recherche. Elle est une
voie rationnelle de traitement de données relative à l'objet
étudié.
En ce qui nous concerne, la méthode historique nous a
permis de connaitre l'évolution des différentes notions de base
sur l'informatique décisionnelle et la méthode d'analytique nous
a sévi à l'examen de plusieurs cas d'analyse multidimensionnelle
des données.
Mémoire KIAKA MUSITU Héritier Page 4
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 5 sur 91
0.4.2. Techniques
Nul n'ignore le rôle que jouent les techniques pour
toute investigation scientifique. En effet, nous la définissons comme un
outil que le chercheur utilise pour recueillir les données indispensable
à l'élaboration d'un travail scientifique.
Nous avons recouru essentiellement à la technique
documentaire, elle a constitué la base et le soubassement de notre
étude du fait qu'elle est précise et rigoureuse. Il a
été pour nous opportun de consulter les livres, les revues, les
mémoires, les notes, les cours, internet et etc.
Mémoire KIAKA MUSITU Héritier Page 5
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 6 sur 91
Chapitre Premier : GENERALITES SUR L'INFORMATIQUE
DECISIONNELLE
I.1. INTRODUCTION
Le développement et l'intégration de diverses
applications au sein des entreprises génèrent un patrimoine de
données éparses et hétérogènes. Dans un
monde où l'informatique apparait comme une donnée
stratégique, retrouver toutes les données associées
à un sujet particulier (un contribuable, un consommateur, un vendeur, un
produit, ou une autre activité) est capital pour l'entreprise.
Il ne s'agit pas seulement, d'obtenir un accès rapide,
unifié et fiable à l'information, mais beaucoup plus permettre
une analyse fine des données contenues dans un système
d'information (évaluation, des bilans, des rapports, etc.). C'est dans
cette lancée que les entreprises puisent toute leur
compétitivité face à une concurrence
effrénée.
I.2. SYSTEME D'INFORMATION
L'information est représentée par les
données. C'est-à-dire des formes écrites (textes, nombres
...), picturales (graphique, dessin, photos, vidéo ...), sonore, etc.
Ces données sont matérialisées sur des
supports (papier, écrans, bandes magnétiques, disquettes. CD
...). A ces représentations, un être humain, une organisation ou
une machine (ordinateur, robot ...) attache une signification susceptible
d'entrainer une modification immédiate ou différée de son
comportement.
L'exemple 1 : Un automobiliste voyant les lettres STOP sur un
panneau rouge octogonal (données) arrête sa voiture
(comportement).
Mémoire KIAKA MUSITU Héritier Page 6
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 7 sur 91
Exemple 2 : Un client ayant reçu une facture
(données) prend son téléphone (comportement) pour donner
un ordre de virement à sa banque (données) ; l'ordinateur de la
banque recevant de la ligne téléphonique les chiffres composant
le virement (données) effectue diverses opérations
(comportement).
On peut définir une information comme étant
l'accroissement de connaissance découlant de l'interprétation
d'un ensemble de données. Cette interprétation est le fait d'un
acteur humain ou mécanique. D'ailleurs l'application de l'informatique
à la gestion des organisations humaines manipule de l'information :
devis, commandes, factures, ordres de paiement, fiches de paie, fiche fiscales
: écritures comptables : planning ; etc. Cette information
reflète les flux de matières (fabrications, achats, ventes ...).
Les flux financiers, les échanges de services qui forment la
matière de l'activité de l'entreprise, reçue par les
acteurs de l'organisation, elle commande leur comportement
échantillonnée et synthétisée. Elle éclaire
et supporte les décisions aux différents niveaux de
responsabilité dans l'organisation.
SYSTEME DE DECISION/PILOTAGE
Si, d'après J. de ROSNAY. « Un système est
un ensemble d'éléments en interaction dynamique, organisés
en fonction d'un but » [2], on peut, à la suite notamment des
acteurs de la méthode MERISE distinguer au sein du système qu'est
toute entreprise ou organisation les trois sous-systèmes
schématisés sur la figure suivante.
SYSTEME D'INFORMATION
SYSTEME OPERANT
Figure. n°1 Système d'Information
Mémoire KIAKA MUSITU Héritier Page 7
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 8 sur 91
Les fonctions d'un système d'information sont de
conserver (mémoriser), créer (transformer) et communiquer
(diffuser) de l'information, plus précisément : des
données que les acteurs interprètent.
De nos jours, les acteurs du traitement de l'information sont
les hommes et les machines, et un système d'information est
partiellement autorisé ; les opérations sont «
programmées )) sur des ordinateurs. «Manuelles )) ou «
interactives » (c'est -à-dire mettant en communication
immédiate les acteurs humains et mécanique) ... Nous appellerons
applications informatiques. « Application de l'informatique )) serait plus
correct, les parties automatisées d'un système d'information.
I.3. L'INFORMATION DECISIONNELLE
L'informatique décisionnelle ou BI (Business
Intelligence) désigne les moyens, les outils et les méthodes qui
permettent de collecter, consolider, modéliser et restituer les
données, matérielles ou immatérielles, d'une entreprise en
vue d'offrir une aide à la décision et de permettre aux
décideurs de la stratégie d'entreprise d'avoir une vue globale de
l'activité traitée au sein de l'entreprise.
Généralement lorsqu'on parle de l'informatique
décisionnelle ; une entreprise est généralement
composée de plusieurs services tels que les ressources humaines, les
services comptabilité, marketing, commercial, technique... Tous
conservent des informations propres à leurs fonctions : listes des
clients ou contribuables, des employés, chiffres, emplois du temps...
L'accumulation de ces données nécessite donc leur sauvegarde dans
le but d'une future exploitation. On constate ainsi régulièrement
que chaque service possède son tableau de bord, ce qui lui permet de
mesurer ou encore évaluer les indicateurs de performance de l'entreprise
(chiffre d'affaire, calculs de bénéfices de l'année...).
Cependant, chaque service a bien souvent sa façon de stocker ses
informations peut être aussi dans différents formats (par exemple
dans un fichier Excel, une base de données MySQL, Access, SQL
Serveur...), et
Mémoire KIAKA MUSITU Héritier Page 8
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 9 sur 91
sa manière de calculer les indicateurs, avec sa
vérité et ses critères. Ainsi, si l'on veut
considérer les données de l'entreprise dans son ensemble, la
tâche s'avère rude voire parfois impossible.
Pourtant, cela constituerait une utilité
évidente et un réel apport à la société. En
effet, une mise en relation et une analyse de toutes les données
permettraient de réaliser des études et des prévisions sur
le comportement et la santé de l'entreprise.
Le monde décisionnel analyse des données
agrégées pour mieux apprécier l'ensemble de
l'activité de l'entreprise. L'aide à la prise de décision
est la responsabilité de quelques personnes dans l'entreprise
(décideurs). En effet, les décideurs s'intéressent
à l'ensemble de l'activité et souhaitent avoir une vue globale de
la société.
Dans le monde décisionnel, on ne supprime jamais des
données, on archive. Les outils de BI (business intelligent) permettent
une exploitation rationnelle et coopérative des données
(contrairement à l'informatique de gestion ou l'on produit de
l'information pour la majorité des cas grâce aux bases de
données relationnelles).
Retenons que le but de l'informatique décisionnelle est
d'apporter une vision globale des données de l'entreprise, afin de
répondre aux problématiques de celle-ci, ou tout simplement, afin
de l'évaluer, et non de prendre décision au sein de l'entreprise.
Mais c'est un outil d'aide afin de permettre aux décideurs d'avoir une
vue globale sous plusieurs dimensions de l'entreprise en un temps record pour
analyser les indicateurs ou axes de performances.
Mémoire KIAKA MUSITU Héritier Page 9
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 10 sur 91
Le schéma ci-dessous illustre cela :
Figure. n°2 Solution Business Intelligence
I.3.I. Business intelligente dans le système
d'information
Ce que nous appelons aujourd'hui système d'information
est un ensemble organisé mais hétérogène de
composants automatiques et / ou semi - automatiques de traitement de
données dont chacun est prioritairement destiné à soutenir
une activité opérationnelle particulière.
Incidemment, chacun de ces composants peut produire des
informations de contrôle très détaillées sur
l'activité à la quelle il est lié. Mais ces informations
restent « au ras des pâquerettes » ; elles ne sont pas
directement exploitables à des fins d'analyse et de prévision. De
cette limitation congénitale est venue l'idée d'un autre
système d'information, spécialement et exclusivement conçu
pour l'aide à la décision, et découplé des
opérations. Pour essayer de préciser le rôle du SID dans
une organisation, on peut partir du schéma classique issu du courant de
pensée systémique des années 1970, courant qui a notamment
crée le fondement théorique de la notion de système
d'information.
Mémoire KIAKA MUSITU Héritier Page 10
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 11 sur 91
Système d'Information
Système de Pilotage
Système de Opérant
L'organisation est vue comme un système composé de
trois sous-systèmes, à savoir :
Figure. n°3 Système d'information
décisionnelle
Le niveau opérationnel : Concerne les données
relatives aux différentes fonctions de l'entreprise, il s'agit des bases
de données résultantes des sources d'informations internes.
1) Le Système Opérant, qui
n'est autre que l'appareil de production, qui importe, transforme et exporte
des flux matériels, énergétiques et financiers ;
2) Le Système d'In formation, qui
constitue à la fois le reflet et le support informationnel du
Système Opérant : il capte des données dans le
Système Opérant auquel il renvoie des commandes;
3) Le Système de Pilotage qui
détermine le comportement de l'organisation en utilisant le
Système d'Information comme une interface à double sens, pour
être informé sur le Système Opérant et agir sur ce
dernier. Aucune place n'est prévue a priori pour le SID dans cet
édifice, Il est situé dans la zone hachurée.
Car le besoin est bien là. Le Système
d'information possède toutes les données du problème
décisionnel, mais pas sous la forme homogène, cohérente,
simplifiée qui convient. Un gros travail de transformation et de mise
à disposition est à fournir, le rôle du SID est
d'automatiser les traitements correspondants, dans des espaces de travail
séparés du reste du SI afin d'éviter toute perturbation
mutuelle.
Mémoire KIAKA MUSITU Héritier Page 11
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 12 sur 91
Les besoins en termes d'exploitation de l'information sont
divers et variés.
La représentation des besoins est pyramidale le haut de
la pyramide correspond à un nombre réduit d'utilisateurs dits
avertis, dont le rôle est de tirer un maximum de valeur ajoutée de
l'information.
A l'opposé, le bas de la pyramide représente la
masse des utilisateurs, dont le rôle va se limiter à
l'exploitation de l'information, Il s'agit donc d'identifier les types
d'utilisateurs et leurs fournir les informations utiles en
conséquence.
I.3.2. Les outils d'aide à la décision
Quelques outils et techniques d'aide à la
décision sont :
- Les tableaux de bord ;
- Les outils de Reporting ;
- Datamart (magasin de données),
- Entrepôt de données (data warehouse) ;
- Datamining ;
- Système expert ;
- Analyse multidimensionnelle.
I.3.3. Les outils de manipulation décisionnelle
a. Requêtes
Dans cette catégorie, nous recensons les requêtes
SQL. Elles permettent de manipuler les données relationnelles. Ces
outils intègrent une couche conceptuelle permettant aux utilisateurs et
spécifier les requêtes à partir d'un
référentiel et intégrant aussi de différentes
possibilités de définition des états plus ou moins
complexe.
Mémoire KIAKA MUSITU Héritier Page 12
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 13 sur 91
b. Les tableurs
Le décideur utilise couramment un tableur et souhaite
obtenir les informations sous forme du tableau. Une fois que le tableau est
construit, il peut, soit l'analyser directement, soit compléter le
tableau en y associant des graphiques.
c. Forage
C'est une structure qui permet d'accéder à un
niveau plus précis de données.
L'outil de forage de données « datamining»
fait référence à un ensemble de techniques d'exploration
et d'analyse, par des moyens automatiques ou semi-automatiques, d'une masse
importante de données dans le but de découvrir des tendances
cachées ou des règles significatives (non triviales, implicites
et potentiellement utiles) [6]
I.4. LES NOTIONS OLAP ET OLTP
I.4.1. OLTP à OLAP
L'infocentre, base relationnelle exclusivement
réservée aux requêtes décisionnelles, à pu
durant un temps assez bref sembler proposer une solution. Mais les bases OLTP
structurées en 2 dimensions ne se prêtent guère aux
requêtes décisionnelles.
Il était temps de redéfinir une nouvelle
structure spécifique aux exigences du décisionnel.
Edgar Franck CODD, père des bases relationnelles a
relevé ce défi en 1993. En fondant son expertise sur le produit
ESSBASE, un tableur multidimensionnel, E.F. CODD a établi 12
Règles, complétées par la suite de 6 nouvelles, pour
définir le concept du cube OLAP (On Line Analytical Processing), une
base de données multidimensionnelle [11].
Mémoire KIAKA MUSITU Héritier Page 13
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 14 sur 91
OLTP
|
OLAP
|
Utilisateur
|
Les utilisateurs sont les rouages de
l'entreprise
|
Les utilisateurs observent les rouages de
l'entreprise peu nombreux
|
Nombreux variés (employés, directeurs,...)
|
Uniquement les décideurs
|
Concurrents
|
Non concurrents
|
Mises à jour et interrogations
|
Interrogations
|
Requêtes prédéfinies
|
Requêtes imprévisibles et complexes
|
Réponses immédiates
|
Réponses moins rapides
|
Accès à peu d'information
|
Accès à de nombreuses informations
|
Beaucoup d'utilisateurs
|
Peu d'utilisateurs (décideurs)
|
Une seule vision métier
|
Traite plusieurs vision métiers
|
Exécution un grand nombre de fois la même
tâche
|
Lisent uniquement les données qui sont souvent
récapitulées.
|
Lisent et modifient les données
(système vivant)
|
Les demandent sont similaire mais différentes.
|
Exigent des performances (temps
réel pour augmenter la productivité) ERP. GPAO,
RH...
|
|
Contenu des données
|
Nécessaire au fonctionnement de
l'entreprise
|
Utilisé pour analyser le
|
Exhaustives
|
fonctionnement de l'entreprise.
|
Courantes
|
Résumées
|
Dynamiques
|
Historiques
|
Mémoire KIAKA MUSITU Héritier Page 14
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 15 sur 91
Orientées applications
|
Statiques
|
Normalisation en 3FN
|
Agrégée (denormalisée)
|
Non historisé
|
Le temps est fondamental
|
Structures
|
Beaucoup de tables
|
Peu de tables mais de grande taille
|
Petite requêtes sur une seule table
|
Requêtes larges sur une grosse
quantité de données
|
Temps de réponses instantanés
(temps réel)
|
Temps de réponse de quelques
secondes à plusieurs minutes.
|
Administration
|
Forte disponibilité
|
Disponibilité faible
|
Sauvegardes fréquentes
|
Sauvegardes peu fréquences, mais
très volumineuses.
|
Beaucoup de petites transactions
|
En règle générale, une transaction
par jour
|
Peu de maintenance off-line
|
Beaucoup de maintenance off-line
|
Tableau N°1 OLTP vs OLAP
I.4.2. Le principe OLAP
Au sein d'une base de données de type OLAP, les
données sont rangées selon un principe de dimension correspondant
étroitement aux axes de recherche des utilisateurs. Cette structure en
forme d'hypercube (cube pour 3 dimensions) présente de nombreux
avantages.
Exemple : Un chef de secteur peut ainsi souhaiter visualiser
une représentation du chiffre d'affaires réalisé selon les
trois axes suivant : par produit et par province et par période, puis
après réflexion, il pense qu'il obtiendra une meilleure
appréciation en inversant les axes :
Par province et par produit et par période.
Mémoire KIAKA MUSITU Héritier Page 15
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 16 sur 91
Avec une base multidimensionnelle, il suffit de faire «
pivoter )) le cube sans pour autant être contraint de
générer une nouvelle requête.
Il existe bien sûr en natif d'autres fonctions
essentielles pour le décisionnel comme le Slice and Dice, permettant de
découper une « tranche )) du cube afin de l'analyser plus finement
et Drill Down et Drill Up pour descendre plus avant dans le détail ou
remonter plus haut.
Ainsi notre chef de secteur peut se poser la question suivante
:
« Vente des produits frais dans la province du
Kasaï-Oriental pour le trimestre
écoulé )).
Puis il voudra affiner :
... Et dans le Territoire de Kabinda...
... Et dans la ville de Kabinda...
... Et dans le quartier...
OLAP réactualise l'ensemble des calculs de
synthèse et les agrégats selon la question posée.
I.5. CHAINE DECISIONNELLE ET OUTILS DE L'INFORMATIQUE
DECISIONNELLE
L'informatique décisionnelle propose d'utiliser les
données transitant par le système d'information, données
de production le plus souvent, en informations susceptibles d'être
exploitées à des fins décisionnelles. Sur le plan pratique
et technique, la Business Intelligence se compose d'une famille d'outils
informatiques et progiciels assurant le fonctionnement de la chaine de
traitement de l'information.
Il est coutumier de présenter les
éléments composant la chaine décisionnelle en quatre
catégories correspondant chacune à une fonction
spécifique.
Mémoire KIAKA MUSITU Héritier Page 16
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 17 sur 91
Collecter, nettoyer et consolider les données Extraire
les données des systèmes de production et les adapter à un
usage décisionnel.
Stocker Centraliser les données structurées et
traitées afin qu'elles soient disponibles pour un usage
décisionnel.
Distribuer ou plutôt facilite l'accessibilité des
informations selon les fonctions et les types d'utilisation.
Exploiter ou comment assister du mieux possible l'utilisateur
afin qu'il puisse extraire la substance de l'information des données
à cet usage.
I.6. ARCHITECTURE D'UN SYSTEME DECISIONNEL
Figure n°4 Architecture d'un système
décisionnel - La collecte des
données
La collecte de données est une fonction remplie par une
famille d'outils dénommée ETL.
Mémoire KIAKA MUSITU Héritier Page 17
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 18 sur 91
Le système d'information de l'entreprise ne s'est pas
bâti en un temps unique. La majorité des systèmes
d'information d'entreprise sont de nature hétérogène pour
la plupart. Bien que la standardisation des échanges entre les divers
outils informatiques avance à grands pas, la disparité des
formats des données en circulation est toujours une
réalité. C'est le principal obstacle technologique aux
échanges étendus d'information.
Avant d'être utilisables, les données seront
formatées, nettoyées
et consolidées. Les outils ETL (Extract Transform Load)
permettent d'automatiser ces traitements et de gérer les flux de
données alimentant les bases de stockage : Data Warehouse ou
datamart.
Le Master Data Management, la gestion des données de
référence, assure la standardisation et la
traçabilité des données de référence de
l'entreprise. Le Master Data Management est un projet en soi dont la
finalité dépasse la constitution de la base
décisionnelle.
- Le Stockage des données
Les bases de données de production ne sont pas
utilisables pour une exploitation décisionnelle. Les données
brutes ne sont pas prêtes à cet usage et par ailleurs les
requêtes décisionnelles sont particulièrement gourmandes en
ressources machines. Les données, au préalable nettoyées
et consolidées, seront stockées dans une base
spécialisée : le data warehouse (entrepôt de données
ou base de données décisionnelle) ou le datamart (magasin de
données). Le datamart est une version plus réduite du data
warehouse.
- La Distribution des informations
Portail décisionnel EIP Entreprise Information Portail.
L'écrasement de la pyramide et de la multiplication des points de prise
de décision modifient fondamentalement la gestion de l'information.
L'information sera perçue en termes de flux et non d'unité de
stockage. Afin de dynamiser la réactivité
Mémoire KIAKA MUSITU Héritier Page 18
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 19 sur 91
globale, l'information sera largement distribuée
auprès de l'ensemble des partenaires. Le portail décisionnel EIP
Entreprise Information Portail, remplir cette fonction essentielle.
Désormais, l'essor de la Business Intelligence de 2nde
génération, la BI 2.0 exploitant pleinement les capacités
du web 2.0 démocratise très largement l'accès à
l'information décisionnelle.
- Exploiter : tableau de bord, data mining...
Une fois les données stockées, nettoyées,
consolidées et accessibles, elles sont utilisables. Selon les besoins,
différents types d'outils d'extraction et d'exploitation seront
envisagés pour analyser les données, notamment avec les outils de
type comme :
- Analyse OLAP pour les analyses multidimensionnelles.
- Le Datamining pour la rechercher des corrélations peu
visibles.
- Les tableaux de bord pour piloter la performance, aide à
la décision des
décideurs présentant les indicateurs clés de
l'activité.
- Le Reporting pour communiquer la performance.
I.7. OUTILS D'EXTRACTION
I.7. I. Définition
Un outil d'extraction est une application utilitaire
paramétrable employée pour acquérir à partir de
données diverses et variées, un sous ensemble provisoire mais
cohérent d'informations définies par un même standard. Cet
ensemble peut être ensuite interrogé directement ou
sauvegardé dans une structure plus complexe.
Mémoire KIAKA MUSITU Héritier Page 19
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 20 sur 91
I.7.2. L'outil de l'ETL (Extract Transform Loading)
Il collecte, nettoye et consolide les données de
l'entreprise étendue. Sachant que la collecte des données est une
fonction remplie par une famille d'outil dénommée ETL.
Figure n° 5 Principe ETL
I.7.3. Les Le processus ou fonctions d'ETL
L'ETL est une opération de migration de données
qui représente une part majeure des traitements et nécessite une
attention régulière tout au long du cycle de vie du
système. Pour pouvoir obtenir ce sous -ensemble, l'outil utilise trois
fonctions principales.
1. L'extraction des données
Il s'agit d'abord de rechercher les données là
ou elles se trouvent, car l'outil ETL a la capacité d'être en
contact avec différentes applications, bases de données ou
fichier c.à.d. dans les différentes sources de données,
pour trouver l'information pertinente effectuer les mises à jour (sur
les bases légataires ou les fichiers de l'entreprise).
Mémoire KIAKA MUSITU Héritier Page 20
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 21 sur 91
2. La transformation et le contrôle des
données
Les outils ETL sont des ateliers spécialisés
dans la migration de données. La transformation des données est
leur fonctionnalité principale. C'est pourquoi ils disposent une
fonction permettant de vérifier qu'une donnée est
cohérente par rapport aux données déjà existantes
dans la base ciblée, ils ont alors des outils de conversion de
données et ils sont conçus pour manipuler de gros volumes de
données. L'étape de contrôle s'effectue par application de
règles adaptées sur les flux de données entrants.
3. Le chargement de données et le transfert des
données
Le chargement prend en compte la gestion du format final des
données pour la mise en oeuvre du transfert de ces données. En
outre une fois que les données extraites, retravaillées,
validées, il reste à les sauvegarder dans une structure
permettant à terme leur interrogation optimisée et
uniformisée.
I.8. LES CUBES OLAP
Un cube OLAP est une représentation abstraite
d'informations multidimensionnelles exclusivement numérique
utilisé par l'approche OLAP (acronyme de Online Analytical Processing).
Cette structure est prévue à des fins d'analyses interactives par
une ou plusieurs personnes (souvent ni informaticiens ni statisticiens) du
métier que ces données sont censées représenter.
Les cubes OLAP ont les caractéristiques suivantes :
1- obtenir des informations déjà
agrégées selon les besoins de l'utilisateur.
2- Simplicité et rapidité d'accès
3- capacité à manipuler les données
agrégées selon différentes dimensions
4- un cube utilise les fonctions classiques d'agrégation
: min, max, count, mais
peut utiliser des fonctions d'agrégations
spécifiques.
Mémoire KIAKA MUSITU Héritier Page 21
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 22 sur 91
Nous pouvons effectuer différentes opérations
avec OLAP pour faire des Analyses nous citons entre autre:
I.8.1.Navigation dans un cube
Les outils OLAP utilisent des opérateurs particuliers
afin de « naviguer » dans les cubes multidimensionnels :
Pivoter (pivot, swap) : permet d'interchanger
deux dimensions
Forage vers le bas (drill-down) : permet de
descendre dans l'hiérarchie de la dimension, EX. visualiser les ventes
par mois au lieu de par année.
Forage vers le haut (drill-up, roll-up) :
remonter dans la hiérarchie de la dimension
Ex. visualiser le nombre d'accidents par année au lieu de
par mois.
Forer latéralement (drill-across) :
Permet de passer d'un membre de dimension à un autre Ex.
visualiser les ventes du Katanga au lieu de celles de Kinshasa, visualiser le
cout des travaux au lieu du nombre d'accidents.
I.8.2. Implémentations OLAP
Il existe deux critères permettant de bien
différencier les implémentations OLAP:
1. La technologie de stockage des données
OLAP
Les différentes implémentations OLAP sont :
Relational online analytical processing (ROLAP):
Les données sont stockées dans un SGBD relationnel
classique structurée pour réagir à la manière d'une
base OLAP. C`est en faite une base relationnelle classique organisée
pour fonctionner comme une base OLAP. Elles sont bien plus lentes et nettement
moins performantes que les bases MOLAP. Mais, immense avantage, elles sont sans
limite de taille c'est -à-dire les données sont stockées
dans un SGBD
Mémoire KIAKA MUSITU Héritier Page 22
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 23 sur 91
relationnel. Elles utilisent le concept relationnel pour
stocker les données modélisées dans le format multi
dimensionnel.
Multidimensionnal on line analytical processing
(MOLAP) : Base de données dimensionnelle (Cube) : Les
données sont stockées dans une base de données
multidimensionnelles le plus souvent propriétaires. Cependant il ya des
limitations quant à la quantité de données et
l'application physique du concept OLAP. Il s'agit réellement d'une
structure multidimensionnelle et ses bases sont rapides et performantes aussi
proposent des fonctionnalités particulièrement
évoluées, elles restent limitées au gigaoctet.
Hybrid on line analytical processing (HOLAP) :
C'est un troisième modèle qui propose de cumuler les
avantages de deux modèles précédents. Les données
agrégées sont stockées sous forme multidimensionnelle
alors que les données détaillées sont stockées dans
des structures relationnelles. Il repose sur des bases ROLAP et MOLAP, cette
dernière prenant en charge les contenus les plus souvent
recherchés.
Desktop on line analytical processing (DOLAP) :
Les fichiers sur le poste client à petite quantité de
données est stockée directement sur le poste client de
l'utilisateur.
2. Les techniques de traitements des données
OLAP :
a) SQL : SQL est utilisé pour
effectuer les différents traitements sur les données OLAP. On
réaliser de roll-up, de drill-down... en utilisant des requêtes en
général très complexes et très exigeantes en terme
de ressources et de temps d'exécution. (Rolap) ;
b) Serveur de traitement OLAP : Il s'agit de
l'approche la plus adaptée aux traitements de données OLAP. Un
serveur, conjointement avec la base de données, est alors
dédié à effectuer les différents traitements de
données OLAP. Les performances sont excellentes en général
! (Molap) ;
Mémoire KIAKA MUSITU Héritier Page 23
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 24 sur 91
c) Client de traitement OLAP : Une approche
qui perd beaucoup de terrain vu l'émergence des postes clients
léger. Un nombre limité de traitement OLAP se Font sur le poste
client de l'utilisateur (Dolap).
I.9. FAIT ET DIMENSION
I.9.1. Fait
Les faits, en complément aux dimensions, sont ce sur
quoi va porter l'analyse. Ce sont des tables qui contiennent des informations
opérationnelles et qui relatent la vie de l'entreprise. On aura des
tables de faits pour les ventes (chiffre d'affaires nettes, quantités et
montants commandés, quantités facturées, quantités
retournées, volumes des ventes, etc.)
Par exemple sur les stocks (nombre d'exemplaires d'un produit
en stock, niveau de remplissage du stock, taux de roulement d'une zone, etc.),
ou peut être sur les ressources humaines (performances des
employés, nombre de demandes de congés, nombre de
démissions, taux de roulement des employés, etc.). Nous dirons
donc un fait est tout ce qu'on voudra analyser.
I.9.2. Dimension
On entend par dimensions les axes avec lesquels on veut faire
l'analyse, un axe d'analyse essentiel est la dimension temps Il peut y avoir
une dimension client, une dimension produit, une dimension géographie
(pour faire des analyses par secteur géographique), etc. Les tables
contiennent des rangées (types, enregistrements). Chaque rangée
est constituée de colonnes (champs).
Dans une base de données standard, le premier champ de
chaque enregistrement est généralement la clé primaire,
l'unique identifiant de l'enregistrement. Par contre, le modèle de
données multidimensionnel est un tableau à n ou plusieurs
dimensions c.à.d. en hypercube. Et chaque dimension
Mémoire KIAKA MUSITU Héritier Page 24
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 25 sur 91
possède une hiérarchie associée de niveau
de consolidation. Chaque position dans un tableau multidimensionnel,
correspondant à une intersection de toutes les dimensions est
appelée une cellule. Ces dimensions peuvent être
décomposées en hiérarchies, comme aussi être
affinées pour de permettre aux utilisateurs d'examiner les indicateurs
à différents niveaux de détail, de descendre «remote,
dril-up, drill-down » dans les données, allant du niveau global au
niveau le plus fin.
I.10. Concept d`hiérarchie
Une hiérarchie organise les paramètres d'une
dimension selon une relation « est_plus_fin » conformément
à leur niveau de détail [10]. On distingue deux types
d'hiérarchies Simple et Multiple :
I.10.1. Hiérarchies Simple
Une hiérarchie simple consiste en exactement un chemin
linéaire d'agrégation dans une dimension.
I.10.2. Hiérarchies Multiple
Une hiérarchie multiple contient au moins deux chemins
d'agrégation différents dans une dimension.
Identification des hiérarchies
La hiérarchie est un concept extrêmement
important dans le modèle multidimensionnel, car c'est par la
hiérarchie que l'on va pouvoir passer du modèle relationnel au
modèle multidimensionnel.
Une hiérarchie est un modèle
d'entité-association qui est identifié par des séquences
d'entités reliées par des relations (un à plusieurs),
toutes alignées dans le même sens. Nous parlons alors d'un
schéma normalisé.
Mémoire KIAKA MUSITU Héritier Page 25
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 26 sur 91
Date
Année
Saison
Semaine
Pays
Canton
Ville
Quartier
Trimestre
Mois
Figure N°5 Hiérarchie Simple Figure N°6
Hiérarchie Multiple
Note : La hiérarchie ordonne la dimension et permet de
changer le niveau d'analyse.
Mémoire KIAKA MUSITU Héritier Page
26
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 27 sur 91
Chapitre Deuxième : CONCEPT DE BASE SUR
L'ENTREPOT DE DONNEES
II.1. INTRODUCTION
Une fois l'information structurée et validée, il
existe deux solutions d'exploitation. La première est de garder ces
informations en mémoire dans une structure virtuelle temporaire pour
l'interrogation. L'autre solution est de stocker de manière permanente
les données sur disques magnétiques.
Nous nous intéressons à la deuxième
solution au cours de ce travail, plus complexe à mettre en oeuvre ; elle
permet alors de fournir tous les renseignements nécessaires.
Certes, l'analyse décisionnelle se base sur la
dimension temporelle de l'information, ce qui nécessite une sauvegarde
permanente. Le data warehouse est le terme anglais qui veut dire entrepôt
de données.
Un entrepôt de données est une structure
informatique dans la quelle est centralisé un volume important de
données consolidées à partir des différentes
sources de renseignements d'une entreprise (notamment les bases de
données internes) et qui est conçue de manière que les
personnes intéressées aient accès rapidement à
l'information stratégique dont elles ont besoin.
Si, dans le passé, l'entrepôt de données
servait davantage à l'archivage, aujourd'hui il est devenu une
pièce maitresse de l'information décisionnelle (ou informatique
d'aide à la décision). Il représente l'un des
éléments essentiels d'un ensemble matériel et logiciel
dynamique de recherche d'informations. Dans un entrepôt de
données, les données sont sélectionnées et
préparées (pour répondre aux questions vitales de
l'entreprise), intégrées (à partir des différentes
sources de renseignements) et datées (elles gardent la trace de leur
origine). Le terme entrepôt de données, employé
très
Mémoire KIAKA MUSITU Héritier Page 27
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 28 sur 91
fréquemment, semble vouloir supplanter ses concurrents
dépôt de données et centrale de données.
Figure n°7 Datawarehouse et Datamart
Cette définition est tirée de celle Bill Inmon
que l'on nomme le père des entrepôts de données et
l'inventeur de ce qu'on appelle EDW pour entreprise Data warehouse ou CIF pour
Corporate Information factory.
II.2. DEFINITION D'UN ENTREPOT DE DONNEES
De nombreuses définitions ont été
proposées, soit académiques, soit par les éditeurs
d'outils de bases de données ou encore par des constructeurs, cherchant
à orienter ces définitions dans un sens mettant en valeur leur
produit.
Une définition pourrait être qu'un Data
Warehouse est l'ensemble des données historiées,
nettoyées, valides, complètes et cohérentes d'une
entreprise, organisées de telle façon à ce que des non
informaticiens puissent en comprendre la structure et l'exploiter, sans
l'intervention d'un informaticien. La définition la plus
appropriée du data warehouse est celle proposée par Bill Inmon :
c'est une collection de données orientées sujet,
Mémoire KIAKA MUSITU Héritier Page 28
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 29 sur 91
intégrées, non volatiles et historisées,
organisées pour le support d'un processus d'aide à la
décision.
D'ailleurs les grands de l'informatique décisionnelle
Bill Inmon et Kimball, définissent un entrepôt de données
par ses caractéristiques :
Dans un entrepôt de données, les informations
sont organisées par fonction dans l'entreprise (comptabilité,
stocks, ventes, etc.), afin de répondre à des besoins
(métier), elles sont classées par thème ( les
données propres à un thème) nous dirons que dans un
entrepôt de données, les données sont
structurées ou organisées autour des sujets
majeurs de l'entreprise, contrairement aux données de systèmes
de production (OLTP= OneLine transaction processing) ceux-ci sont
généralement organisées par processus fonctionnels.
II.2.1. Données orientées sujets
L'intérêt de cette organisation est de disposer
de l'ensemble des informations utiles sur un sujet le plus souvent transversal
aux structures fonctionnelles et organisationnelles de l'entreprise. Cette
orientation sujet va également permettre de développer son
système décisionnel via une approche par itérations
successives, sujet après sujet c'est-à-dire Les données
sont organisées pour répondre à des besoins «
métiers » : elles sont classées par thème. Les
données propres à un thème, les ventes par exemple, seront
rapatriées des différentes bases OLTP (OneLine transaction
processing) de production et regroupées.
II.2.2. Données intégrées
Comme nous l'avons dit ci-haut les données proviennent
de sources hétérogènes utilisant plusieurs types de
formats. Nous savons qu'un Datawarehouse est un projet d'entreprise. Pour y
parvenir, les données doivent être intégrées. Avant
d'être intégrées dans le Datawarehouse, les
données
Mémoire KIAKA MUSITU Héritier Page 29
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 30 sur 91
doivent être mises en forme et unifiées afin
d'avoir un état cohérent. Les données proviennent de
sources hétérogènes utilisant chacune un type de
format.
Elles sont intégrées avant d'être
proposées à utilisation. Un « nettoyage »
préalable des données est nécessaire dans un souci de
rationalisation et de normalisation.
II.2.3. Données non volatiles
Retenons qu'une fois les données
intégrées dans l'entrepôt, elles ne sont pas
appelées à être supprimées car le non
volatilité des données est en quelque sorte une
conséquence de l'historisation. La requête effectuée
à quelques mois d'intervalle en précisant la date de
référence de l'information recherchée donnera le
même résultat. Les données une fois intégrée
dans l'entrepôt ne sont pas appelées à être
supprimées. (Read-Only)
II.2.4. Données historisées
Les données mémorisées sont datées
c.à.d. un référentiel temps doit être associé
à la donnée afin d'être capable d'identifier une valeur
particulière dans le temps. Il est donc possible de voir son
évolution après un temps donné. Dans un système de
production, la donnée est mise à jour à chaque nouvelle
transaction car le degré de détail de l'archivage est bien
entendu relatif à la nature des données, parce que toutes les
données ne sont pas propres à être archivées .On ne
doit pas permettre que les données soient modifiées seul. Elles
sont en lecture seule. Les données mémorisées sont
datées, il est ainsi possible de visualiser leur évolution dans
le temps. Le degré de détail de l'archivage est bien entendu
relatif à la nature des données. Toutes les données ne
méritent pas d'être archivées.
Mémoire KIAKA MUSITU Héritier Page 30
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 31 sur 91
II.2.5. Données agrégées
Elles correspondant à des éléments
d'analyse représentatifs des besoins des utilisateurs.
Elles constituent déjà un résultat
d'analyse et une synthèse de l'information contenue dans le
système décisionnel, et doivent être facilement accessibles
et compréhensibles.
II.2.6. Méta-données
C'est l'ensemble d'informations nécessaires à la
compréhension et à l'exploitation des données du
Datawarehouse, elles regroupent l'ensemble des informations concernant le
Datawarehouse et les processus associés. Elles sont idéalement
intégrée dans un référentiel, elle donne la
signification de chaque donnée, et précise les algorithmes qui
permettent l'extraction des données dans une base de production
données sur les données.
II.3. UTILITE D'UN ENTREPOT DE DONNEES
Un entrepôt de données, est une vision
centralisée et universelle de toutes les informations de l'entreprise.
C'est une structure (comme une base de données) qui à pour but,
contrairement aux bases de données, de regrouper les données de
l'entreprise pour des fins analytiques et pour aider à la
décision stratégique. La décision stratégique est
une action entreprise par les décideurs qui vise à
améliorer, quantitativement ou qualitativement, la performance de
l'entreprise. En gros, c'est un gigantesque flux d'informations
épurées, organisées, historisées et provenant de
plusieurs sources de données, servant aux analyses et à l'aide
à la décision.
L'entrepôt de données est l'élément
central de l'informatique décisionnelle. En effet, il est le meilleur
moyen que les professionnels ont
Mémoire KIAKA MUSITU Héritier Page 31
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 32 sur 91
trouvé pour modéliser de l'information pour des
fins d'analyse. Les données d'une entreprise proviennent essentiellement
des bases de production. Ces données sont éparpillées ou
en masse dans des systèmes multiples, pas nécessairement
compatibles entre eux. Ces bases sont conçues pour être efficaces
pour les fonctions sur lesquelles elles sont spécialistes.
Elles sont donc peu structurées pour l'analyse, avec
souvent comme objectif principal de conserver l'information. Comme bases de
production, elles sont focalisées sur les fonctions critiques de
l'entreprise et doivent être en mesure de servir l'utilisateur avec un
temps de réponse rapide et structurées dans ce but.
Ces systèmes sont donc peu adaptés à la
vision à long terme et donc à la prise de décision.
L'entrepôt de données aura pour objectif d'agréger et de
valoriser ces données provenant de différentes sources. Il va
permettre à l'utilisateur d'y accéder de manière simple et
ergonomique [3].
II.4. LES ARCHITECTURES D'UN ENTREPOT DE DONNEES
Pour implémenter un Datawarehouse, trois types
d'architectures
sont possibles :
? L'architecture réelle,
? L'architecture virtuelle,
? L'architecture remote.
II.4.1. L'architecture Réelle
Elle est généralement retenue pour les
systèmes décisionnels.
Le stockage des données est réalisé dans
un SGBD séparé du système de production. Le SGBD est
alimenté par des extractions périodiques.
Mémoire KIAKA MUSITU Héritier Page 32
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 33 sur 91
Avant le chargement, les données subissent d'importants
processus d'intégration, de nettoyage, de transformation.
L'avantage est de disposer de données
préparées pour les besoins de la décision et
répondant aux objectifs du Datawarehouse.
Les inconvénients sont le coût de stockage
supplémentaire et le manque d'accès en temps réel.
II.4.2. L'architecture Virtuelle
Cette architecture n'est pratiquement pas utilisée pour le
Datawarehouse.
Les données résident dans le système de
production. Elles sont rendues visibles par des produits middlware ou par des
passerelles.
Il en résulte deux avantages : pas de cout de stockage
supplémentaire et l'accès se fait en temps réel.
L'inconvénient est que les données ne sont pas
préparées.
II.4.3. L'architecture Remote
C'est une combinaison de l'architecture réelle et de
l'architecture virtuelle. Elle est rarement utilisée. L'objectif est
d'implémenter physiquement les niveaux agrégés afin d'en
faciliter l'accès et de garder le niveau de détail dans le
système de production en y donnant l'accès par le biais de
middleware ou de passerelle.
Mémoire KIAKA MUSITU Héritier Page 33
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 34 sur 91
II.5. ARCHITECTURE TECHNIQUE D'UN ENTREPOT DE
DONNEES
Figure n08 Architecture technique d'un
entrepôt des données
II.7. COMPOSANTS DE BASE OU ARCHITECTURALES D'UN
ENTREPOT DE
DONNEES
Figure n09 Composant de base ou Architecturales
d'un entrepôt de données
Mémoire KIAKA MUSITU Héritier Page 34
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 35 sur 91
L'architecture des systèmes décisionnels met en
jeu un environnement comportant quatre éléments essentiels : les
sources de données, l'entrepôt de données, les magasins de
données et les outils d'analyse et d'interrogation.
- Les sources de données
Sont nombreuses, variées, distribuées et
autonomes. Elles peuvent être internes (bases de production de
l'entreprise) ou externe (Données fournies par les partenaires tel que :
Les Fournisseurs, Contribuables, Clients, Administration Publiques,
Documentation Juridiques) à l'entreprise.
- L'entrepôt de données
C'est le lieu de stockage centralisé des informations
utiles pour les décideurs. Il met en commun les données provenant
des différentes sources et conserve leurs évolutions.
- Les magasins de données
Sont des extraits de l'entrepôt orientés sujet.
Les données sont organisées de manière adéquate
pour permettre des analyses rapides à des fins de prise de
décision, et principalement dédie à une classe de
décideurs.
- Les outils d'analyse et d'interrogation
Permettent de manipuler les données suivant des axes
d'analyses. L'information est visualisée au travers d'interfaces
interactives et fonctionnelles dédiées à des
décideurs souvent non informaticiens (directeurs, chefs de
services,...).
Mémoire KIAKA MUSITU Héritier Page 35
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 36 sur 91
II.8. TABLE DE FAITS
Table de fait : comme son nom l'indique, une
table de fait est une table contenant tous les faits du SI et dont
dépendent toutes les autres tables. Cette table ne contient que des
clés étrangères venant des tables de dimension et des
valeurs numériques appelées mesure. Exemple de table de fait :
table des Ventes. Initiation au décisionnel [5].
Rappelons que certaines tables de faits peuvent contenir aucun
attribut et représentent que des liaisons entre tables dimensionnelles.
Et tous les éléments qui pointent sur la table de faits sont
liés à une sémantique exprimable par une phrase. Par
conséquent, la table de faits est la matérialisation d'une
association entre entités, généralement elle contient un
petit nombre de colonnes mais beaucoup plus d'enregistrements qu'une table de
dimension.
II.9. TABLE DE DIMENSION
Les tables de dimension sont des tables servant d'axes
d'analyse. On peut par exemple analyser les ventes (table de fait) suivant
l'axe des temps (table de dimension) pour indiquer par exemple pendant quel
trimestre de l'année les ventes ont explosé [5].
II.10. LES MESURES
Une mesure est une quantité présente dans la
table de fait qui permet de mesurer les faits. Par exemple, nombre de vente ou
prix unitaire sont des exemples des mesures, en outre les mesures sont en fait
les critères ou indicateurs que l'on veut étudier en fonction de
différents axes ou dimensions [5].
Mémoire KIAKA MUSITU Héritier Page 36
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 37 sur 91
II.11. MODELES DE CONCEPTION D'UN ENTREPOT DE
DONNEES
II.11.1. Modélisation en étoile
Nous allons utiliser un exemple pour expliquer la
modélisation en étoile. L'important en BI est de toujours garder
à l'esprit que ce que nous faisons est différent des bases de
données traditionnelles. Le schéma créé sera
accessible par les utilisateurs et doit donc être le plus simple et
explicite possible.
La modélisation en étoile découle
naturellement du tableau ci-dessus, il en résulte le schéma
suivant:
Figure N°10 Modélisation en Etoile
Dans une modélisation en étoile, toutes les
dimensions sont directement reliées à la table de faits, qui
contient les données à analyser. Plusieurs remarques sont
à faire pour ce schéma :
- La table de fait contient se qu'on appelle des " mesures ",
des champs (numériques pour la plupart) sur lesquels on va faire nos
analyses, on
Mémoire KIAKA MUSITU Héritier Page 37
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 38 sur 91
peut y trouver le montant des ventes nettes, les
quantités vendues, les kilomètres parcourus, les quantités
en pré commande, etc. La table de faits est reliée aux dimensions
par des relations (1, n). Pour analyser une ligne de fait par client par
exemple, il faut qu'il y ait une relation entre cette ligne et la dimension
client.
- Les tables de dimension contiennent les
éléments qu'utiliseront les décideurs pour voir la table
de faits. Les utilisateurs pourront ainsi apprécier les montant des
ventes par vendeur, par client, ou le kilométrage pour un vendeur pour
un client donnée (pour voir si ce client est rentable), calculer le
coût de revient d'un produit par rapport aux activités des
vendeurs, etc. On n'utilise jamais la clé d'un système de
production comme clé de dimension : pour préserver l'historique
des modifications dans l'entrepôt de données.
- La granularité des tables de dimensions et de faits
doit être la même : imaginez que la table de faits regroupe les
informations par heures et que la table de dimension du temps gère les
minutes, il ne sera pas possible de lier la dimension temps et la table de
faits (multi détermination).
- Chaque ligne de la table de faits doit avoir une relation
avec chacune des tables de dimensions : dans le cas contraire, on aurait perte
d'information ou analyse erronée.
- Il n'existe de relations qu'entre les dimensions et les
tables de faits. Il sera beaucoup trop compliqué de gérer et
d'utiliser des dimensions liées entre elles. N'oubliez pas que le
schéma doit être assimilable par des non informaticiens pour
pouvoir l'exploiter.
II.11.2. Modélisation en flocon
La modélisation en flocon étant une variante de
la modélisation en étoile, nous prendrons le même cas avec
la même analyse. Il faut savoir que la modélisation en flocon
existe pour des raisons de performances. En effet, des dimensions de plusieurs
millions de lignes peuvent poser des problèmes de lenteur lors de
l'exploitation des données.
Mémoire KIAKA MUSITU Héritier Page 38
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 39 sur 91
Le principe de la modélisation en flocon est de
créer des hiérarchies de dimensions, de telle manière
à avoir moins de lignes par dimensions. Vous nous direz que cela va en
contradiction avec la dernière remarque de la modélisation en
étoile, et nous vous dirons que vous avez raison, à la seule
chose prés que la performance prime sur la structure. C'est la seule
alternative pour avoir des résultats clairs et rapides.
Le schéma d'une modélisation en flocon pourrait
être comme suit :
Figure N°12 Modélisation en Flacon
Conseil : il faut éviter floconner
à tort et à travers. En effet, pour garder une structure simple,
gérable et compréhensible, on utilise le plus possible la
modélisation en étoile. La modélisation en flocon
n'intervenant que lorsque des problèmes de performances apparaissent ou
sont facilement prédictibles. Une règle informelle en BI
préconise de ne floconner que si l'on a la relation (11000).
C'est-à-dire que si l'on réussit à créer une
hiérarchie de deux dimensions
Mémoire KIAKA MUSITU Héritier Page 39
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 40 sur 91
avec une ligne de la dimension père (groupe produit par
exemple) faisant référence à plus de 1000 lignes de la
dimension fille (produit par exemple). Dans ce cas, il est peut être
temps de penser aux flocons.
II.11.3. Modélisation en Constellation
Une constellation est une série d'étoiles ou de
flocons reliées entre eux par des dimensions. Il s'agit donc
d'étoiles avec des dimensions en commun. Un environnement
décisionnel idéal serait une place où il serait possible
de naviguer d'étoile en étoile, de constellation en constellation
et de DataMart en DataMart à la recherche de l'information si
précieuse.
Un des indicateurs clés d'une bonne conception
d'entrepôt est la grosseur des constellations. En effet, plus la
constellation est grosse, plus cela veut dire que vous avez
réutilisé vos dimensions, et qui dit réutilisation de
dimension, dit dimensions complètes, centralisées et avec une vue
orientée entreprise.
II.11.4. Modélisation en Grappe
Ce schéma en grappe est une dérivation de ces
deux schémas pour en former un troisième. Kimball déclare
qu'un schéma en flocon n'est pas optimal, car il est trop complexe.
Toujours pour les mêmes raisons de simplification des tables, afin de
pouvoir trouver facilement les informations dans l'entrepôt, le
schéma en grappe apparait alors comme un compromis entre le
schéma en étoile et le schéma en flocon.
II.12. APPROCHES DE MISE EN PLACE D'UN DATA
WAREHOUSE
Il existe plusieurs approches pour mettre en place un
Datawarehouse. Par contre seulement trois approches sont communes, il s'agit de
l'approche « Top-Down » prônée par Inmon, l'approche
« Bottom-up » de Kimball et l'approche « Hybride » qui
dérivent des deux premières approches.
Mémoire KIAKA MUSITU Héritier Page 40
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 41 sur 91
II.12.1.Approche Top-down
C'est la méthode la plus lourde, la plus contraignante
et la plus complète en même temps. Elle consiste en la conception
de tout entrepôt (toutes les étoiles, puis en la
réalisation de ce dernier. Imaginez le travail qu'une telle
méthode implique : savoir à l'avance toutes les dimensions et
tous les faits de l'entreprise, puis réaliser tout ça... Le seul
avantage que cette méthode comporte est qu'elle offre une vision
très claire et très conceptuelle des données de
l'entreprise ainsi que du travail à faire.
II.12.2. Approche Bottom-up
C'est l'approche inverse, elle consiste à créer
les étoiles une par une, puis les regrouper par des niveaux
intermédiaires jusqu'à l'obtention d'un véritable
entrepôt pyramidal avec une vision d'entreprise. L'avantage de cette
méthode est qu'elle est simple à réaliser (une
étoile à la fois), l'inconvénient est le volume de travail
d'intégration pour obtenir un entrepôt de données ainsi que
la possibilité de redondances entre les étoiles (car elles sont
faites indépendamment les unes des autres).
II.12.3. Approche Middle-out
C'est l'approche hybride, et conseillée par les
professionnels du BI. Elle consiste en la conception totale de l'entrepôt
de données (concevoir toutes dimensions, tous les faits, toutes les
relations), puis créer des divisions plus petites et plus
gérables et les mettre en oeuvre. Cela équivaut à
découper notre conception par éléments en commun et
réaliser les découpages un par un. Cette méthode tire le
meilleur des deux précédentes sans avoir les contraintes. Il faut
juste noter que cette méthode implique, parfois, des compromis de
découpage (dupliquer des dimensions identiques pour des besoins
pratiques.
Mémoire KIAKA MUSITU Héritier Page 41
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 42 sur 91
II.13. LE MAGASIN DE DONNEES
II.13.1. Introduction
Le Datawarehouse étant, en général,
très volumineux et très complexes à concevoir, on a
décidé de les diviser en « bouchées » plus
faciles à créer et entretenir. Ce sont les Datamart. On peut
faire des divisions par fonction (un datamart pour les ventes, pour les
commandes, pour les ressources humaines) ou par sous-ensemble
organisationnel
(un datamart par succursale). Nous verrons plus tard comment
organiser les datamarts pour créer un entrepôt proprement dit
[3].
II.13.2. Définition
Un Datamart littéralement en anglais magasin de
données est un sous-ensemble d'une base de données
décisionnelle utilisé en informatique décisionnelle : il
est généralement exploité en entreprise pour restituer des
informations ciblées sur un métier spécifique, constituant
pour ce dernier un ensemble d'indicateurs à vocation de pilotage de
l'activité et d'aide à la décision. Un Datamart, selon les
définitions, est issu ou fait partie d'un Data Warehouse, et en reprend
par conséquent la plupart des caractéristiques.
Le Datamart est un ensemble de données ciblées,
organisées, regroupées et agrégées pour
répondre à un besoin spécifique à un métier
ou un domaine donné. Il est donc destiné à être
interrogé un panel de données restreint à son domaine
fonctionnel, selon des paramètres qui auront été
définis à l'avance lors de sa conception.
De façon plus technique. Le DataMart peut être
considéré de deux manières différentes,
attribuées aux deux principaux théoriciens de l'informatique
décisionnelle, Bill Inmon et Ralph Kimball :
Mémoire KIAKA MUSITU Héritier Page 42
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 43 sur 91
Définition d'Inmon : Le
Datamart est un sous- ensemble du Datawarehouse, constitué au niveau des
détails et à des niveaux plus agrégés, permettant
de restituer tout le spectre d'une activité métier. L'ensemble
des Datamarts de l'entreprise constitue le Datawarehouse.
Définition de Ralph Kimball :
l'entrepôt de données est constitué peu à peu par
les Datamarts de l'entreprise, regroupant ainsi différents niveau
d'agrégation et d'historisation de données au sein d'une
même base.
II.13.3 Structure physique et théorique
Au même titre que les autres parties de la de base de
données globale de l'entreprise, les Datamarts sont stockés
physiquement sur disque dur par un système de gestion de bases de
données relationnelle hébergé sur un serveur.
Le Datamart est souvent confondu avec la notion d'Hypercube
OLAP ; il peut de fait être représenté par un modèle
en étoile ou en flacon dans une base de données relationnelle
(notamment lorsqu'il s'agit de données élémentaires ou
unitaires non agrégées).
II.13.4 Place du DataMart dans la structure de
données
Le Datamart se trouve en toute fin de la chaine de traitement
de l'information. En règle générale, il se situe en aval
d'un Datawarehouse plus global à partir duquel il est alimenté,
dont il constitue en quelque sorte un extrait.
II.13.5 Interaction avec les utilisateurs
Un DataMart forme la principale interaction entre les
utilisateurs et les systèmes informatiques qui gèrent la
production de l'entreprise. Dans un DataMart, l'information est
préparée pour être exploitée brute par les personnes
du métier auquel il se rapporte. Pour ce faire, il est appelé
à être
Mémoire KIAKA MUSITU Héritier Page 43
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 44 sur 91
utilisé via des logiciels d'interrogation de bases de
données (notamment des outils de Reporting) afin de renseigner ses
utilisateurs sur l'état de l'entreprise à un moment donné
(stock par exemple) ou sur son activité (flux).
La préparation de la donnée pour une utilisation
directe, inhérente au Datamart, peut revêtir plusieurs formes. Il
faut noter que toutes représentent une simplification par rapport au
niveau de données inférieur : on peut citer pour exemple :
- L'agrégation de données : Le DataMart ne
contient pas le détail de toutes les opérations qui ont eu lieu,
mais seulement des totaux, repartis par groupements.
- Le retrait de données inutiles : Le DataMart ne
contient que les données qui sont strictement utiles aux
utilisateurs.
- L'historisation de données : le DataMart contient
seulement la période de temps qui intéresse les utilisateurs.
II.13.6. Intérêt et limites
Les Datamarts étant des extraits simplifiés du
détail des données de l'entreprise, ils présentent un
grand intérêt pour des requêtes identifiées et
répétitives ; il est plus facile pour le système
d'interroger un DataMart qui ne contient que le nécessaire que d'avoir
à cerner et à trier toute la base. Par ailleurs, les Datamarts
permettent de classifier et de clarifier l'information, de manière
à ce que chaque métier ait accès à des chiffres
correspondant à ses attentes fonctionnelles, sans être
pollué par des données contigües.
Le Datamart minimise la complexité informatique. Il est
donc facile de se concentrer sur les besoins des utilisateurs.
En revanche, les choix de simplification qui donnent lieu aux
Datamarts rendent ceux-ci naturellement moins flexibles ; des demandes
d'utilisateurs sortant de leur cadre habituel requièrent
fréquemment d'interroger la base à un autre niveau,
générant des coûts de développement ou la
création de solutions de rechange. Des problèmes peuvent de fait
survenir lorsque les Datamarts constituent l'unique moyen d'accès aux
données pour l'utilisateur final.
Mémoire KIAKA MUSITU Héritier Page 44
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 45 sur 91
Chapitre Troisième : PRESENTATION DE LA
DIRECTION GENERALE DES
IMPOTS.
III.1. PRESENTATION DE LA DIRECTION GENERALE DES
IMPOTS
III.1.1. Historique et Nature Juridique de la Direction
Générale des Impôts
La Direction Générale des Impôts, DGI en
sigle, est une entité publique dotée de la personnalité
juridique et chargée de la mobilisation des recettes fiscales de l'Etat
en République Démocratique du Congo.
Le Ministère des Finances, précisément le
Secrétariat Général aux Finances avait sous son
autorité des directions telles que le Trésor, la
Comptabilité, l'Informatique, la Gestion de la Dette Publique, la
Douane, les Contributions,...
Avec l'évolution dictée par le temps et les
circonstances d'une part, et le souci de rendre plus efficace et plus
efficiente la gestion de ces services d'autre part, certaines directions ont
été émargées de la tutelle du Secrétariat
Général aux Finances pour devenir des entreprises autonomes,
c'est le cas de la Direction des douanes qui deviendra Office des Douanes et
Accises jusqu'à devenir par la suite Direction Générale
des Douanes et Accises, de la Gestion de la Dette Publique devenue Office de
Gestion de la Dette Publique.
La Direction des Contributions n'a pas, elle aussi
échappée à cette situation. Ainsi, il a été
proposé la création d'une structure nationale, jouissant de la
compétence générale, exclusive et financière qui
lui permettrait d'avoir un budget de fonctionnement conséquent, d'un
effectif qualifié, adapté à ses attributions et
bénéficiant d'un barème amélioré, motivant
et des services de bases efficaces.
Mémoire KIAKA MUSITU Héritier Page 45
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 46 sur 91
Le 10 mars 1988, l'ordonnance loi n°88/039 portant
création de la Direction Générale des Contributions fut
signée. Elle sera modifiée et complétée par
l'ordonnance loi n°89/101 du 12 mai 1989.
En 1991, suite à l'évolution de la
matière fiscale et des nouveaux impératifs de fonctionnement, une
restructuration de la DGC sera décidée, celle-ci sera suivie d'un
autre, celle de 1994.
En décembre 1999 sera signé un « nouveau
cadre organique aménagé ». Cette nouvelle restructuration
signée par le Vice - ministre aux Finances sera transmise à la
DGC par la lettre n°377/CAB/VMIN/FIN/99 du 21 décembre 1999 et sa
mise en application sera effective en 2000.
Parmi les innovations du nouveau cadre organique
aménagé nous citons la scission de la Direction Urbaine des
Contributions en deux nouvelles Directions Urbaines des Contributions
respectivement celles de Kinshasa - Est et celle de Kinshasa - Ouest.
Le 02 mars 2003, le décret n°017/2003 portant
création de la Direction Générale des Impôts est
signé en annulation des ordonnances lois n°88/039 et 89/101.
La nouvelle structure est placée sous l'autorité
du ministère ayant les finances dans ses attributions et son
siège social se trouve au croisement des avenues DES MARAIS et HAUT -
CONGO à KINSHASA/GOMBE - RDC.
III.1.2. Mission de la Direction Générale des
Impôts
L'article 2 du décret n°17/2003 stipule que : la
Direction Générale des Impôts exerce, dans le cadre des
lois et règlements en vigueur, toutes les missions et
prérogatives en matière fiscale.
La Direction Générale des Impôts est donc
chargée d'étudier et de soumettre à l'autorité
compétente les projets de lois, de décrets et
arrêtés en
Mémoire KIAKA MUSITU Héritier Page 46
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 47 sur 91
matière fiscale. Elle doit être consultée
pour tout texte ou toute convention à incidence fiscale ou tout
agrément d'un projet d'investissement à un régime fiscal
dérogatoire.
III.2. OBJECTIF
L'objectif principal des services de la DGI est la maximisation
des recettes fiscales pour le compte de l'Etat congolais.
La DGI a aussi pour objectif d'exercer ses compétences, de
manière exclusive, sur toute l'étendue du territoire national.
III.3. FONCTIONNEMENT
La DGI dispose, pour son fonctionnement et la motivation de son
personnel, d'une allocation budgétaire au moins égale à 5%
des recettes assignées ainsi que celle de 50% des
pénalités fiscales recouvrées.
Elle bénéficie également, en sus des
crédits budgétaires lui alloués à cet effet, d'une
quotité de 10% des pénalités recouvrées pour ses
dépenses d'investissement.
III.4. STRUCTURE ADMINISTRATIVE DE LA DIRECTION
GENERALE DES IMPOTS
La DGI est dirigée par un Directeur
Général assisté d'un Directeur Général
Adjoint, nommés et, le cas échéant, relevés de
leurs fonctions par le Président de la République, sur
proposition du ministre ayant les finances dans ses attributions.
Elle comprend une Administration Centrale et des Directions
Urbaine et Provinciales...
Mémoire KIAKA MUSITU Héritier Page 47
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 48 sur 91
L'Administration Centrale est composée de la Direction
Générale et des Directions Centrales suivantes :
- La Direction des Ressources Humaines ;
- La Direction de la Gestion Budgétaire et des services
Généraux ;
- La Direction de l'Informatique ;
- La Direction des Études, de la Législation et du
Contentieux ;
- La Direction de la Taxation et de la Documentation ;
- La Direction du Contrôle Fiscal ;
- La Direction du Recouvrement ;
- La Direction des Grandes Entreprises.
Les Directions Urbaine et Provinciales sont :
- La Direction Urbaine de Kinshasa ;
- Les dix Directions Provinciales, soit une par province.
La structure organisationnelle de la DGI comporte des services
de deux types : les services non opérationnels qui s'occupent des
aspects administratifs et des travaux de conception (services centraux et
sièges de certaines Directions Provinciales des Impôts - DPI -) et
les services opérationnels qui s'occupent de la gestion de l'impôt
au quotidien dont la Direction des Grandes Entreprises (DGE) et les Services
extérieurs qui sont les Centres des Impôts et les Centres
d'Impôts Synthétiques ainsi que les Directions Provinciales.
A ce jour, la DGI a une Direction opérationnelle (la
Direction des Grandes Entreprises), 3 Centres des Impôts (CDI-Kinshasa,
CDI-Lubumbashi et CDI Goma dont le lancement est prévu en fin mars 2011)
et 142 Centres d'Impôts Synthétiques.
Les Directions Centrales, les Directions Urbaines et
Provinciales sont hiérarchiquement soumises à l'autorité
du Directeur Général.
Mémoire KIAKA MUSITU Héritier Page 48
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 49 sur 91
Elles sont subdivisées en Divisions et Bureaux. La DGI
dispose d'une inspection des services placée sous l'autorité
directe du Directeur Général.
Mémoire KIAKA MUSITU Héritier Page 49
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 50 sur 91
III.4.1. Organigramme de la DGI
Tableau n°2 : Organigramme de la DGI
Mémoire KIAKA MUSITU Héritier Page 50
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 51 sur 91
III.4.2. Description de Postes
1. Directeur Général
Il supervise et coordonne l'ensemble des activités de
la direction générale des impôts.
A ce titre, il dispose des tous les pouvoirs
nécessaires et reconnus par les lois et règlements en vigueur
pour l'accomplissement des taches définies ci-dessus et il gère
le personnel, les crédits ainsi que les biens meubles et immeubles,
présents et à venir, mis à la disposition de la DGI.
Le directeur général dispose du droit
d'évoquer les affaires et peut réformer, sauf en matière
contentieuse, les décisions des directeurs.
Délègue une partie de ses compétences au
directeur général adjoint qui lui en rend compte. En cas
d'absence ou d'empêchement ; le directeur général est
provisoirement remplacé, dans la plénitude de ses fonctions, par
le directeur général adjoint, à défaut de ce
dernier, par un directeur désigné par le ministre ayant les
finances dans ses attributions.
2. Directeur Général Adjoint
Il assiste le directeur général dans l'exercice
de ses fonctions et donne ses avis sur toutes les matières. Il
décide dans les matières de la compétence du directeur
général lui déléguées, tout en lui rendant
compte. En cas d'absence ou empêchement du directeur
général adjoint, le ministre ayant les Finances dans ses
attributions peut désigner un directeur pour assumer son
intérim.
3. Division Administrative et Cellule Technique
C'est le cabinet du directeur général, elle est
chargée de l'instruction du contentieux.
Mémoire KIAKA MUSITU Héritier Page 51
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 52 sur 91
4. L'inspection des Services
Elle contrôle les services des Directions Centrales, de
la Direction des Grandes entreprises ainsi que les Directions Urbaines et
provinciales sur ordre du directeur général. Elle peut être
chargée des missions d'enquête et de contre vérification
fiscale. Elle veille à l'application régulière des lois et
règlements en vigueur et au strict respect des directives de
l'administration Centrale. Elle propose, suite aux manquements
constatés, les mesures disciplinaires et réformes de nature
à améliorer l'organisation et le fonctionnement des services.
5. la Direction des Ressources Humaines Elle a pour
attributions :
- La gestion du personnel affecté à la DGI ;
- L'organisation du recrutement des agents nécessaires
au fonctionnement des services selon les modalités en vigueur en la
matière ;
- La formation en cours de carrière des agents.
6. la Direction de la Gestion Budgétaire et des
Services Généraux Elle a pour attributions :
- La gestion des crédits alloués à la DGI
;
- La coordination, l'harmonisation et le suivi de la gestion
de la part des pénalités revenant aux services ;
- La gestion des biens meubles et immeubles mis à la
disposition de la DGI.
Mémoire KIAKA MUSITU Héritier Page 52
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 53 sur 91
7. La Direction de l'Informatique
Elle a pour attributions :
- L'élaboration de la stratégie d'informatisation
de système d'information
- L'informatisation des services ;
- L'élaboration des cahiers de charges des projets
informatiques ;
- L'analyse, le développement, l'implantation et la
maintenance des
applications et des équipements ;
- La gestion des systèmes d'exploitation et de
communication par
ordinateur ;
- L'assistance technique en la matière des services tant
centraux
qu'opérationnels.
8. La Direction des Études de la
Législation et des Contentieux Elle est chargée :
- De la centralisation et de l'analyse des statistiques fiscales
;
- De la réalisation des études fiscales de fond
;
- De l'élaboration et de la proposition des projets de
textes fiscaux ;
- De l'instruction des dossiers soumis au Directeur
Général ou évoqués par
lui ;
- De la formule des avis sur tout projet du régime fiscal
d'exception ;
- De la proposition de retrait éventuel des
agréments fiscaux ;
- Du suivi des relations avec les autres administrations fiscales
;
- De l'élaboration et de la coordination de la supervision
des politiques et
des stratégies de communication au niveau national ;
- De l'élaboration de la coordination, et de la
supervision des procédures
contentieuses sur l'ensemble du territoire national ;
- De l'élaboration de la coordination administrative ;
- Du suivi des instances en cours dans les cas des recours
juridictionnels ;
- De l'assistance, le cas échéant, des services
opérationnels dans le
traitement des dossiers importants.
Mémoire KIAKA MUSITU Héritier Page 53
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 54 sur 91
9. La Direction de la Taxation et de la
Documentation
Elle est chargée :
De la tenue, de l'actualisation et du suivi du répertoire
national des contribuables ;
De la gestion du système centralisé d'attribution
du numéro impôt ;
De la définition des orientations en matière
d'identification des contribuables ;
De l'élaboration de la coordination et de la supervision
des procédures d'assiette sur l'ensemble du territoire national ;
De l'élaboration des monographies professionnelles en
liaison avec les organisations représentatives des professions ;
Du suivi des performances des services gestionnaires au niveau
national.
10. La Direction du Contrôle Fiscal
Elle a pour attribution au niveau national :
> L'élaboration du programme de recherche et de
regroupement ;
> La tenue et la mise à jour d'une banque à
données de regroupement ;
> La coordination du programme de Contrôle Fiscal ;
> La fixation des objectifs quantitatifs et qualitatifs de
contrôle ;
> L'élaboration, la coordination et la supervision des
procédures
techniques et méthodes de contrôle ;
> L'évaluation des performances des services
opérationnels et la
consolidation des résultats de contrôle ;
> La définition de la politique en matière de
répression des infractions
fiscales et de suivi des relations avec le parquet et les
juridictions
répressives ;
> L'assistance, le cas échéant, des services
opérationnels dans le
traitement des dossiers importants en la matière.
Mémoire KIAKA MUSITU Héritier Page 54
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 55 sur 91
11. La Direction des Grandes Entreprises
Elle est chargée de la gestion de l'ensemble des
opérations fiscales des entreprises, personnes physiques ou morales,
sélectionnées suivant les critères définis par la
Direction Générale des Impôts.
Elle s'occupe notamment de la tenue des dossiers uniques, du
contrôle du recouvrement et du contentieux de ces entreprises en ce qui
concerne tous les impôts et autres droits relevant de la
compétence de la DGI ;
Elle exerce également sa compétence en
matière de gestion des ressources humaines, de gestion budgétaire
et services généraux et d'informatique. Elle peut disposer des
antennes dans les provinces.
12. Les Directions Urbaines et Provinciales
Elles sont chargées, dans leurs ressorts, des taches
non dévolues à l'Administration Centrale et à la Direction
des Grandes Entreprises.
Elles exercent leur compétence en matière de
ressources humaines, de gestion budgétaire et services
généraux, de gestion des dossiers uniques, de contrôle
fiscal, de recouvrement, de contentieux et d'informatique. Elles ont, en leur
sein, des services extérieurs dénommés « Centre des
Impôts », chargé de la gestion des contribuables personnes
physiques.
Elles disposent, chacune d'une inspection des services qui,
sur le plan local, vérifie les services sur demande du Directeur Urbain
ou Provincial peut être chargées des missions d'enquête et
veille à l'application régulière des lois et
règlements en vigueur ainsi qu'au strict respect des directives de
l'Administration Centrale et Urbaine ou Provinciale.
L'inspecteur de services propose, suite aux manquements
constatés, les mesures disciplinaires et les reformes de nature à
améliorer et le fonctionnement des services.
Mémoire KIAKA MUSITU Héritier Page 55
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 56 sur 91
III.5. L'IMPOT
III.5.1. Notion et définition
Pour assurer le fonctionnement des services nécessaires
à la vie de la nation, l'État dispose des moyens d'action
financière contenue dans le budget de l'État. Celui-ci est «
l'acte par lequel sont prévues et autorisées les recettes et les
dépenses des organismes publics. Il sert à régler
l'activité économique en même temps qu'à
réaliser les objectifs que le gouvernement juge prioritaires [7].
Selon le professeur Nsaka, le budget a deux volets à
savoir les ressources et les emplois ou dépenses publiques [8]:
- Les ressources : ce sont des recettes que l'État
compte mobiliser pendant une période, généralement, d'un
an. Ainsi, il doit se procurer des ressources. Il peut recourir à
l'impôt, aliéner son domaine, tirer des revenus de ce domaine,
utiliser les moyens de trésorerie, ou recourir à l'emprunt.
- Les emplois : c'est la justification que l'État doit
effectuer des dépenses lourdes pour une période
déterminée d'une année.
L'impôt est donc un moyen qui procure à
l'État l'essentiel de ses ressources. C'est un fait permanent et
universel. « Il peut se définir comme une prestation
pécuniaire et unilatérale requise des personnes physiques ou
morales par voie d'autorité à titre obligatoire et
définitif sans contrepartie directe ayant pour objet la couverture des
dépenses publiques ou l'intervention en matière économique
et sociale [9]. »
La principale caractéristique de l'impôt est
qu'il est perçu sans contrepartie directe, c'est-à-dire que son
paiement n'ouvre pas un service ou un droit particulier. La contrepartie existe
mais elle n'est pas individualisable en vertu du principe de non-affectation.
L'impôt se distingue alors de la taxe qui a une contrepartie directe. La
taxe fiscale est un prélèvement opéré sur
l'usager
Mémoire KIAKA MUSITU Héritier Page 56
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 57 sur 91
du service public, du fait de l'utilisateur de ce service,
sans qu'il y ait d'ailleurs une équivalence exacte entre le montant du
prélèvement et le cout du service : par exemple, ma taxe
spéciale de circulation routière (TSCR)
III.5.2. Types d'impôts
Nous pouvons classifier les impôts selon quatre
critères
principaux :
a) Un revenu :
Dans cette catégorie, c'est la richesse produit par le
capital ou le travail qui constitue l'assiette de l'impôt. On citer :
- L'impôt sur les bénéfices
;
- L'impôt sur les
rémunérations ;
- L'impôt sur m*les professions
libérales ;
- La taxe sur la plus-value de
réévaluation de l'actif immobilisé ;
- L'imposé sur les revenus mobiliers.
b) Une dépense
Il s'agit de l'impôt qui frappe la consommation à
l'occasion de la vente, la circulation ou même la détention
d'objet ou des produits taxés.
Nous citons :
- L'impôt sur le chiffre d'affaires ;
- Les droits de consommation ; - Les droits
d'entrée, etc.
Mémoire KIAKA MUSITU Héritier Page 57
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 58 sur 91
c) La fortune
L'impôt est assis sur le patrimoine ou la transmission
des éléments du patrimoine. Il s'agit de l'impôt et la taxe
sur la propriété des biens immeubles c'est-à-dire
l'impôt réel sur les terrains, sur les bâtiments, sur les
véhicules, sur les bateaux ainsi que les droits succession perçu
à raison de la mutation de propriété à cause de la
mort, etc.
2° selon le mode de liquidation
La liquidation consiste en l'application du tari aux bases
d'imposition ou assiettes pour fixer le montant de l'impôt, la
constatation de l'exigibilité ainsi que pour la détermination
redevable.
Il existe plusieurs méthodes pour liquider des
impôts:
a) La méthode des quotités : elle consiste
à calculer l'impôt en utilisant les taux déterminés
qui s'appliquent à tous les contribuables (application d'un
barème, d'une quotité) ;
b) La méthode de répartition : elle consiste
à calculer préalablement l'impôt global, ensuite à
désigner les contribuables suivant un plan de répartition
territoriale ;
c) La méthode proportionnelle : elle consiste à
liquider l'impôt en soumettant la matière imposable à un
taux constant ;
d) La méthode progressive : elle consiste à
liquider l'impôt en
soumettant la matière imposable à un taux
à croissant. On distingue :
- La progressivité globale : la manière
imposable est répartie en catégories dont chaque part du minimum
exonéré pour aboutir à un plafond déterminé
; des taux d'impôts des plus en plus élevés sont
appliqués aux catégories successives ;
- La progressivité par tranches : tous les revenus sont
découpés en un certain nombre de tranches égales ou
inégales ; les tranches successives sont affectés d'un taux
d'imposition différent de plus en plus élevé ;
Mémoire KIAKA MUSITU Héritier Page 58
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 59 sur 91
- L'impôt dégressif : l'impôt est
calculé en appliquant un taux maximum à l'ensemble de la
matière imposable ; ce taux est réduit, dans une mesure plus ou
moins large en faveur de revenu modeste.
3° selon l'incidence de l'impôt sur la situation
économico - financière nous distinguons :
- L'impôt direct : c'est celui qui
frappe périodiquement le revenu ; il porte sur les revenus des
personnes. (BI ; BS);
- L'impôt indirect : il frappe les
fonds particuliers intermittents. Il
porte sur les dépenses ou sur les objets. (ex : IPR,
ICA)
4° selon de mode de recouvrement ou de perception
L'impôt est payé soit au comptant ou après un
certain délai. L'impôt au comptant est exigible
immédiatement. Il est également appelé impôt
spontané.
Par impôt spontané, il faut entendre celui qui
payé librement, sans que le service adresse préalablement au
contribuable un avis de paiement. Le paiement est fait le plus souvent à
l'appui d'une déclaration.
Par contre, l'impôt dont le paiement peut être
différé est appelé impôt enrôlé.
Par impôt enrôlé, il faut comprendre celui
qui est mis en recouvrement après que la déclaration du
contribuable ait fait l'objet d'une taxation, la quelle conduit à la
confection d'un rôle, c'est-à-dire une liste de créances
nominatives rendue exécutoire par le Directeur Général ou
par le Directeur Provincial des Impôts, ou encore par leurs
délégués.
Mémoire KIAKA MUSITU Héritier Page 59
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 60 sur 91
III.5.3. Opérations d'exécution
d'impôt
L'exécution d'une recette en général et
de l'impôt en particulier, comporte quatre phases :
1° L'assiette de l'impôt ou l'engagement ou
encore la constatation.
Il s'agit de l'opération qui consiste à
constater les faits, de la matière imposable avec l'évaluation
qui en a été faite par le contribuable. En effet, le
système fiscal congolais est pour l'essentiel fondé sur un
système déclaratif, de ce fait, le contribuable étable lui
-même, sur base d'une déclaration qu'il remplit, l'assiette de
l'impôt et/ou la matière imposable. Sa bonne fois est
présumée est ses déclarations sont réputées
sincères et complètes. Mais il doit être en mesure de
justifier les éléments déclaratifs faits par le
contribuable. Toutefois, l'Administration fiscale dispose d'un pouvoir de
contrôle visant la recherche de contribuables ou de redevables
défaillants et l'analyse des éléments
déclarés. Elle peut, le cas échéant, établir
elle-même l'assiette imposable assortie de pénalités
fiscales.
2° La liquidation : elle consiste
à déterminer les montants des droits à payer par les
contribuables. Ce calcul se fait par application des taux, des tarifs
conformément aux lois et règlement en vigueur. En pratique, elle
consiste en l'application des taux, des tarifs aux bases d'imposition ou
assiettes, pour fixer le montant de l'impôt et pour la constatation de
l'exigibilité ainsi que pour la détermination du redevables
3° L'ordonnancement : l'opération
par laquelle l'Ordonnateur ou son délégué donne,
conformément aux résultats de la liquidation, l'ordre de
percevoir. Il se traduit par l'émission d'une note de perception
permettant de donner à la recette l'imputation convenable et d'en
autoriser la perception. Quant à l'impôt enrôlé, la
note de perception doit être accompagnée d'un
Avertissement-Extrait de Rôle, qui est un avis de paiement indiquant le
montant à payer et date d'exigibilité.
Mémoire KIAKA MUSITU Héritier Page 60
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 61 sur 91
4° Le recouvrement ou la perception :
l'acte par lequel le contribuable s'acquitte de sa dette en versant le montant
au profit du Trésor, qui perçoit par le bilais du comptable ou du
Receveur des impôts. Dans ce sens, le recouvrement couvre
l'opération de versement et de perception de l'impôt.
III.6. PRESENTATION DU SCHEMA RELATIONNEL DE LA BASE
DE DONNEES EXISTANTE
Notons que la D.G.I dispose d'une base existante dont le
schéma relationnel nous servira pour la conception de notre datamart
afin d'effectuer des analyses multidimensionnelle. Partant du MCD globale de
l'entreprise, nous allons créer un sous MCD qui pourra faciliter notre
étude.
Voici, les sous domaines nous concernant pour la mise en place
de notre Datamart :
Figure n°13 Sous Schéma relationnel de la base
existante
Mémoire KIAKA MUSITU Héritier Page 61
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 62 sur 91
Chapitre .IV. CONCEPTION D'UN DATAMART POUR LE
PILOTAGE DU
SYSTEME DE GESTION DES IMPOTS CAS DE LA DIRECTION
GENERALE DES IMPOTS
IV.1. APPORT DE L'INFORMATIQUE DECISIONNELLE A
L'ENTREPRISE
Comme nous l'avons définis ci-haut, l'informatique
décisionnelle désigne les moyens, les outils et les
méthodes qui permettent de collecter, consolider, modéliser et
restituer les données, matérielles ou immatérielles, d'une
entreprise en vue d'offrir une aide à la décision et de permettre
aux décideurs de la stratégie d'entreprise d'avoir une vue
globale de l'activité traitée au sein de l'entreprise.
L'accumulation de ces données nécessite donc
leur sauvegarde dans le but d'une future exploitation. On constate ainsi
régulièrement que chaque service possède son tableau de
bord, ce qui lui permet de mesurer ou encore évaluer les indicateurs de
performance de l'entreprise (chiffre d'affaire, calculs de
bénéfices de l'année...). Cependant, chaque service a bien
souvent sa façon de stocker ses informations peut être aussi dans
différents formats (par exemple dans un fichier Excel, une base de
données MySQL, Access, SQL Serveur...), et sa manière de calculer
les indicateurs, avec sa vérité et ses critères. Ainsi, si
l'on veut considérer les données de l'entreprise dans son
ensemble, la tâche s'avère rude voire parfois impossible.
Pourtant, cela constituerait une utilité évidente et un
réel apport à la société. En effet, une mise en
relation et une analyse de toutes les données permettraient de
réaliser des études et des prévisions sur le comportement
et la santé de l'entreprise. Le monde décisionnel analyse des
données agrégées pour mieux apprécier l'ensemble de
l'activité de l'entreprise. L'aide à la prise de décision
est la responsabilité de quelques personnes dans l'entreprise
(décideurs). En effet, les décideurs s'intéressent
à l'ensemble de l'activité et souhaitent avoir une vue globale de
la société.
Mémoire KIAKA MUSITU Héritier Page 62
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 63 sur 91
Dans le monde décisionnel, on ne supprime jamais des
données, on archive. Les outils de BI (business intelligent) permettent
une exploitation rationnelle et coopérative des données
(contrairement à l'informatique de gestion ou l'on produit de
l'information grâce aux bases de données relationnelles).
Retenons que l'informatique décisionnelle ne prend pas
la décision au sein de l'entreprise. Mais c'est un outil d'aide afin de
permettre aux décideurs d'avoir une vue globale sous plusieurs
dimensions de l'entreprise en un temps record pour analyser les indicateurs ou
axes de performances.
IV.2. ANALYSE DES BESOINS
La Direction Générale des Impôts
éprouve des difficultés pour maximiser ses recettes en vue
d'approvisionner le budget de l'Etat, afin d'assurer le fonctionnement des
services nécessaires à la vie de la Nation en même temps
que réaliser les objectifs que le gouvernement juge prioritaires. Pour
rendre plus performante sa gestion du point de vue financier, elle
présente les besoins d'effectuer des analyses multidimensionnelles sur
:
- La masse d'argent par Impôt ;
- Le chiffre d'affaire par type contribuable et par province ; -
Les contribuables actifs ;
- Les contribuables inactifs.
IV.3. CHOIX DE METHODE
En ayant l'oeil tourné sur la base existante qui
représente une partie de la vie du système de gestion des
impôts, c'est la méthode bottom-up qui s'est imposée. Nous
concevons une étoile représentative du datamart de l'analyse de
masse d'argents par impôt.
Mémoire KIAKA MUSITU Héritier Page 63
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 64 sur 91
IV.4. CHOIX DU MODELE
L'importance masse d'informations sur les impôts
nécessite de mettre en place un modèle dimensionnel qui
évite les redondances afin de gagner en espace de stockage, c'est la
raison pour laquelle nous avons opté pour le modèle en flocon.
IV.5. PROPOSITION DU NOUVEAU SYSTEME
Compte tenu des besoins expliqués au point IV.2. du
chapitre quatre, le schéma relationnel global est découpé
en sous schéma qui a permis notre analyse multidimensionnelle.
Puisqu'il s'agit d'analyser des mouvements de paiement
d'impôt par des contribuables de la DGI, un outil d'extraction, de
transformation et de chargement des données doit être
utilisé en vue de la transformation d'entité mouvement
impôt en fait « argent payé par contribuable )) par comptage
de solde.
A part l'entité mouvement impôt qui sera
transformé en table de fait, on aura aussi la mesure « solde ))
issue du comptage des recettes dans la table contribuable par ETL.
La structure du modèle conceptuel des données
nous impose de considérer les autres entités comme tables de
dimensions organisées hiérarchiquement.
Mémoire KIAKA MUSITU Héritier Page 64
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 65 sur 91
IV.6. TABLEAU DES SPECIFICATIONS DES BESOINS
La construction du tableau des données
décisionnelles utilise les questions décisionnelles et
schéma Entité-Relation initial, afin de faire un tri des
données décisionnelles nécessaires à la
construction d'un Magasin de données.
Attribut
|
Description
|
M
|
D
|
Autres
|
Numéro
|
Numéro d'enregistrement contribuable
|
|
X
|
|
NomContribuable
|
Nom contribuable
|
|
X
|
|
CodeProvince
|
Code du province
|
|
X
|
|
Sigle
|
Sigle du province
|
|
X
|
|
LibelleAdresseEtab
|
Libellé et adresse d'établissement
|
|
|
X
|
Telephone
|
Numéro téléphone du contribuable
|
|
X
|
|
DateSaisie
|
Date de saisie
|
|
X
|
|
Ref_Impot
|
Référence impôt
|
|
X
|
|
NomImpot
|
Nom Impôt
|
|
X
|
|
TypeImpot
|
Type Impôt
|
|
X
|
|
Echeance
|
Echéance
|
|
X
|
|
Code_Fac
|
Code Facture
|
X
|
|
|
NomContribuable
|
Nom Contribuable
|
|
X
|
|
Ref_Impot
|
Référence Impôt
|
|
X
|
|
DatePaie
|
Date Paiement
|
|
X
|
|
Solde
|
Solde montant
|
|
X
|
|
Code_Province
|
Code Province
|
|
X
|
|
Code_Periode
|
Code Période
|
|
X
|
|
Mois
|
Mois
|
X
|
|
|
Annee
|
Année
|
|
|
|
LibelleProvince
|
Libelle Province
|
|
|
|
NatureImpôt
|
Nature Impôt
|
|
|
|
NomImpôt
|
Nom Impôt
|
|
|
|
SigleImpôt
|
Sigle Impôt
|
|
|
|
Catégorie
|
Catégorie impôt
|
|
|
|
TauxImpôt
|
Taux Impôt
|
|
|
|
Tableau n°3 : Spécifications des besoins
Mémoire KIAKA MUSITU Héritier Page 65
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 66 sur 91
IV.6.1. Identifier les activités à
modéliser :
L'analyse et la spécification des données fait
ressortir l'activité
suivante :
? Mouvement Impôt
IV.6.2. Identifier le sous schéma conceptuel
On peut recenser le sous schéma en rapport avec
l'activité à modéliser, afin de pouvoir classifier les
entités à partir du schéma Entité-Relationnel
initial, on a le sous schéma suivant :
Figure n° 14 Sous schéma entité
relation
Mémoire KIAKA MUSITU Héritier Page 66
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 67 sur 91
IV.6.3. Classification des entités et
détermination du gain
Classification de sous schéma obtenu doit faire
apparaitre les entités composantes, transactionnelles et de
classification.
Activité : Mouvement Impôt
|
Entité
Transactionnelles
|
Entité
Composantes
|
Entité
Classification
|
Solde
|
Contribuable Impôt
Période
|
Province Type Impôt
|
Tableau n°4 : Classification des entités et
détermination du gain
IV.6.4. Identification des Hiérarchies
On détermine toutes les hiérarchies maximales ou
autres : Activités Mouvement Impôt
1. Solde (entité minimale) _ Impôt _TypeImpôt
(entité maximale).
2. Solde (entité minimale) _ Contribuable_ Province
(entité maximale).
3. Solde (entité minimale) _ Période
(entité maximale).
IV.6.5. Production du Modèle dimensionnel :
Il ya un large choix d'options pour la production des
modèles multidimensionnels, chacune de ces différentes options
représente le compromis entre la complexité et la redondance.
Mémoire KIAKA MUSITU Héritier Page 67
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 68 sur 91
IV.6.6. Rappel des règles de passage pour le
schéma en étoile :
- Une table de fait est formée pour chaque
entité de transaction. La clef de la table est la combinaison des clefs
de ses entités associées ou composantes.
- Une table de dimension est formée pour chaque
entité de composante, par réduction de la hiérarchie
liée aux entités de classification dans cette entité
composante.
- Quand des relations hiérarchiques existent entre des
entités de transaction, l'entité d'enfant hérite toutes
les dimensions (et clefs d'attributs) de l'entité parentale, cela
fournit la capacité de «Drill Down » entre les niveaux de
transaction.
- Attributs numériques dans entités de
transaction doit être agrégé par des attributs clefs (des
dimensions).
Nous optons pour un schéma en étoile pour
l'activité Mouvement Impôt, ce choix est motivé par :
- L'existence d'une seule entité transactionnelle, donc
une seule table de faits.
- La taille des tables des dimensions (Contribuable,
Impôt, Période) sont très négligeables par rapport
à la table de faits.
Mémoire KIAKA MUSITU Héritier Page 68
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 69 sur 91
Donc on peut dénormaliser notre schéma
multidimensionnel pour l'activité Mouvement Impôt.
Figure n015 Schéma du datamart de la
DGI
IV.7. DEFINITION DES CONTRAINTES D'AGREGATION
L'étape suivante doit définir des niveaux de
restriction pour toutes les mesures le long des différents chemins
d'agrégation dans chaque schéma de fait :
Niveau de Restriction
|
Fonction d'agrégation Applicable
|
1
|
{SUM, AVG, MIN, MAX, STDDEV, VAR, COUNT}
|
2
|
{ AVG, MIN, MAX, STDDEV, VAR, COUNT}
|
3
|
{ COUNT}
|
4
|
{ }
|
Table n05 : Classification des niveaux de
restriction
Mémoire KIAKA MUSITU Héritier Page 69
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 70 sur 91
Schéma de Fait
|
Mesures
|
Niveaux de
dimension
|
Niveau de
restriction
|
|
Montant
|
Contribuable
|
1
|
|
|
Impôt
|
1
|
|
|
Période
|
1
|
|
Solde
|
Contribuable
|
1
|
|
|
Impôt
|
2
|
|
|
Période
|
1
|
Table n°6: contrainte d'agrégation pour le
schéma de Fait : Mouvement Impôt
IV.8. DIFFERENTS ETAPES D'IMPLEMENTATION DU CUBE
DGI
1. Nous nous rendons dans le menu Démarrer
/ Tous les programmes / Microsoft SQL server
2008/2008 R2 puis lancez SQL Server Business Intelligence
Development Studio.
Mémoire KIAKA MUSITU Héritier Page 70
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 71 sur 91
2. Après le lancement de Visual Studio nous pouvons
créer notre projet de base de données Analysis Services. Pour
cela, allez dans le menu Fichier / « Nouveau
/ Projet ou utilisez la raccourci Ctrl + Maj + N
Nous obtenons :
1) Type de projets : nous choisissons Projet Business
Intelligence
2) Modèles : Nous sélectionnons Projet
Analysis Services
3) Nom : Nous saisissons le nom que nous allons donner au projet
de base de données, ici test DGI
Mémoire KIAKA MUSITU Héritier Page 71
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 72 sur 91
3. Dans l'explorateur de solution qui est présent à
droite de la fenêtre de BIDS, nous obtenons la structure suivante pour
notre projet test :
Pour alimenter une base de données Analysis Services,
il est nécessaire de définir une source de données
relationnelle. Nous allons donc créer et définir les
propriétés de connexion de celle-ci.
1. Nous allons lancer l'assistant Source de
données, pour cela, nous nous rendons dans
l'explorateur de solution. Nous faisons un click-droit sur
le
répertoire Source de données puis
Nouvelle source de données...
Mémoire KIAKA MUSITU Héritier Page 72
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 73 sur 91
2. Nous allons créer et configurer les
propriétés de la connexion à la base de données
relationnelle qui va servir de source de données, pour cela, nous
cliquons sur le bouton Nouveau...
Mémoire KIAKA MUSITU Héritier Page
73
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 74 sur 91
3. A l'étape Informations d'emprunt
d'identité nous choisissons Hériter
4. A la fin de l'assistant nous pouvons nommer notre source de
données et cliquer sur Terminer :
Mémoire KIAKA MUSITU Héritier Page
74
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 75 sur 91
Une fois la source de données créée, nous
allons pouvoir ajouter la vue de source de données, qui est une couche
d'abstraction entre la base relationnelle et le contenu de la base OLAP. Elle
va ainsi nous permettre d'ajouter une référence vers les tables
et les vues présentes dans la base source, sans avoir à modifier
le contenu de cette dernière. De plus si le contenu des tables et vues
de la base source ne correspond pas exactement à nos besoins, nous
aurons aussi la possibilité de définir dans le langage SQL, des
calculs nommés sur nos tables, voire des requêtes nommées,
véritables équivalent de vues SQL. Nous pourrons ensuite les
utiliser pour construire nos objets OLAP (dimensions et cubes).
1. Nous allons lancer l'assistant de vue de source de
données, pour cela, nous nous rendons dans
l'explorateur de solution. Nous faisons un click-droit
sur le répertoire Vues des sources de données
puis Nouvelle vue des sources de données...
Mémoire KIAKA MUSITU Héritier Page 75
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 76 sur 91
2. La source de données que nous avons
créée lors de l'étape précédente est
sélectionnée, cliquez sur Suivant
3. Nous allons ajouter toutes les tables disponibles dans la
base DGI :
Mémoire KIAKA MUSITU Héritier Page 76
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 77 sur 91
Nous cliquons sur le bouton portant le symbole «
>> » puis sur Suivant.
4. A la fin de l'assistant nous pouvons nommer notre Vue de
source de données et cliquer sur Terminer
Mémoire KIAKA MUSITU Héritier Page
77
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 78 sur 91
Le concepteur de Vue de source de données est ouvert et
nous obtenons :
Conception des dimensions :
Mémoire KIAKA MUSITU Héritier Page 78
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 79 sur 91
2. A l'étape Sélectionner la
méthode de création, nous conservons l'option
Utiliser une table existante
présélectionnée par défaut :
4. A l'étape suivante, nous sélectionnons la
table DimImpot dans la liste Table
principale. La colonne est alors sélectionnée par
défaut dans la liste des colonnes clés car c'est la clé
primaire de la table. Elle servira de colonne clé pour
l'attribut clé qui constitue l'attribut principal de la
dimension. Pour définir la colonne qui servira de source au
libellé de cet attribut, nous choisissons Ref_Impot
dans la liste Colonne de nom, puis nous cliquons sur
Suivant.
Mémoire KIAKA MUSITU Héritier Page
79
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 80 sur 91
5. Pour pouvoir ajouter des attributs supplémentaires
à la dimension
Impôt, nous cochons les cases pour les champs TypeImpot,
nous cliquons sur Suivant.
Mémoire KIAKA MUSITU Héritier Page
80
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 81 sur 91
6. A la dernière étape de l'assistant, nommons
notre dimension Impôt et cliquez sur Termine
:
Nous nous retrouvons dans le concepteur de dimension.
Grâce à celui-ci, nous allons modifier manuellement la dimension
Impôt.
On modifie manuellement la dimension
contribuable.
Mémoire KIAKA MUSITU Héritier Page
81
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 82 sur 91
Mémoire KIAKA MUSITU Héritier Page
82
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 83 sur 91
Conception de vue DGI
1. Dans l'explorateur de solutions nous faisons un clic droit
sur le répertoire Cube puis Nouveau
Cube
2. Dans le premier écran de l'Assistant Cube
conservé le choix par défaut et nous cliquons sur
Suivant
3. A l'étape suivante, nous cliquons sur le bouton
Suggérer, nous constatons que tables de faits :
FaitMouvementImpot est automatiquement cochées dans la
liste de table. Cela est dû à la structure de notre base SQL et
à relations récupérées depuis celle-ci dans la Vue
de source de données. Nous cliquons sur Suivant.
Mémoire KIAKA MUSITU Héritier Page 83
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 84 sur 91
4. Dans l'écran choix des mesures, nous décochons
uniquement Fait Mouvement_Impot Nombre et nous cliquons sur
Suivant
Mémoire KIAKA MUSITU Héritier Page
84
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 85 sur 91
5. Nous conservons toutes les dimensions qui sont
sélectionnées et nous cliquons sur Suivant
6. A la dernière étape nous cliquons sur
Terminer
Mémoire KIAKA MUSITU Héritier Page
85
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 86 sur 91
7.
Nous allons déployer notre base DGI et son contenu
(Source de données, dimensions, cubes...) sur le serveur Analysis
Services. Dans l'explorateur de solution, nous faisons un click-droit à
la racine du projet test puis
Déployer.
8. Nous pouvons donc tester notre cubes DGI en nous rendant
dans le dernier onglet du concepteur de cube, l'onglet Parcourir
et en sélectionnant les éléments du cubes et les
disposant à la manière d'un tableau croisé dynamique tel
que nous pourrions le faire dans le tableau Excel de la suite Office.
Mémoire KIAKA MUSITU Héritier Page 86
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 87 sur 91
CONCLUSION
Nous voici enfin arrivé au terme de notre conception
portant sur « Conception d'un datamart pour le pilotage du système
de gestion des impôts cas de la direction générale des
impôts » qui est conçue pour la direction
générale des impôts en République
Démocratique du Congo.
Notre préoccupation était de démontrer
qu'une base de données relationnelle modélisée selon les
principes classiques de normalisation s'adapte mal à un contexte
analytique où la masse d'argent et le nombre de contribuables doivent
être analysés suivant les différents axes. La personne qui
analyse doit disposer d'un modèle relativement intuitif et capable de
stocker le résultat de nombreux calcul d'agrégation; ce qui, d'un
point de vue strictement relationnel, constitue une redondance. Nous pensions
que seule l'informatique décisionnelle dans son aspect entrepôt de
données permettait de contribuer à résoudre le
problème.
La décision stratégique est une action
entreprise par les décideurs de l'entreprise et qui vise à
améliorer, quantitativement ou qualitativement la performance de
l'entreprise.
La BI est riche en solution et concepts, et elle permet de
mettre en place des projets pour les grandes entreprises d'aujourd'hui.
Nous devons reconnaitre que le datamart étant une
méthode d'analyse qui s'avère payante, cependant peu
d'entreprises en utilisent, alors notre investigation consistait à
vulgariser les datamarts afin de permettre aux entreprises de bien vouloir
analyser sur les différents domaines.
En effet, nous avons rencontré des difficultés
au cours de notre étude tant au niveau de la collecte des données
qu'à la réalisation de ce travail, nous pensons avoir
résolu tant soit peu le problématique posé au début
de notre étude.
Nul n'est parfait comme le déclare la Bible, ce travail
demeure ouvert à toute critique et suggestion constructive en vue de son
amélioration.
Mémoire KIAKA MUSITU Héritier Page 87
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 88 sur 91
BIBLIOGRAPHIE
I. OUVRAGES
1. J.de ROSNAY-le macroscope : éd. du
seuil, Paris, 1975
2. Yazid grim : Business Intelligence, France,
Eyrolle, 2000
3. Dot net France Association-valentin
Pauline
4. Mahomed Taslimanka Sylla : Initiation au
décisionnel, Datawarehouse, Proc, ICDE ; 1997
5. Ralph Kimball, La boîte
à outils de l'Entrepôt de données, France, Paris,
1996
6. Bill Inmon, Construire
l'Entrepôt de Données, Dunod, Paris, 1991
7. Ikelemba Mputu, Budget des
dépenses publiques en capitale et son impact sur la croissance de
l'économie Zaïroise de 1971 à 1990, Mémoire, UNIKIN,
1993
8. Nsaka, Finances Publiques, cours
[inédit], IC3, EIFI, 2004
9. Pascal Bertoni, Finances publiques,
3° édition, librairie Vuibert, Paris, 2001
10. Olivier TEST, Thèse de Doctorat
de l'université Paul Sabatier TOULOUSE, « Modélisation et
manipulation d'entrepôt de données complexes et historisées
», 2000
11. Edgar Franck CODD, Poviding OLAP to
user-analysts : an IT mandate » Technical Report, E.F Codd and Associates,
1993
II. NOTES DE COURS
1. Jean Louis KAZADI, Informatique
décisionnelle, cours, [inédit] L2 Math-Info, UPN, 2010-2011
2. Jean Louis KAZADI, Conception
d'entrepôt de données, cours, [inédit], L2 Math-Info, UPN,
2010-2011
WEBOGRAPHIE
1. http : //
www.grim.developpez.com
2. http : // www.grim.developpez.com/ cours/business
intelligence// concepts/ conception_data Warehouse.
Mémoire KIAKA MUSITU Héritier Page 88
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 89 sur 91
TABLE DES MATIERES
0.1. PROBLEMATIQUE ET HYPOTHESE 2
0.2. CHOIX ET INTERET DU SUJET 3
0. 3. DELIMITATION DU SUJET 4
0.4. METHODES ET TECHNIQUES UTILISEES 4
0.4.1. Méthodes 4
0.4.2. Techniques 5
Chapitre Premier : GENERALITES SUR L'INFORMATIQUE
DECISIONNELLE 6
I.1. INTRODUCTION 6
I.2. SYSTEME D'INFORMATION 6
I.3. L'INFORMATION DECISIONNELLE 8
I.3.I. Business intelligente dans le système
d'information 10
I.3.2. Les outils d'aide à la décision
12
I.3.3. Les outils de manipulation décisionnelle
12
I.4. LES NOTIONS OLAP ET OLTP 13
I.4.1. OLTP à OLAP 13
I.4.2. Le principe OLAP 15
I.5. CHAINE DECISIONNELLE ET OUTILS DE L'INFORMATIQUE
DECISIONNELLE 16
I.6. ARCHITECTURE D'UN SYSTEME DECISIONNEL 17
I.7. OUTILS D'EXTRACTION 19
I.7. I. Définition 19
I.7.2. L'outil de l'ETL (Extract Transform Loading)
20
I.7.3. Les Le processus ou fonctions d'ETL 20
I.8. LES CUBES OLAP 21
I.8.1.Navigation dans un cube 22
I.8.2. Implémentations OLAP 22
I.9. FAIT ET DIMENSION 24
I.9.1. Fait 24
I.9.2. Dimension 24
I.10. Concept d`hiérarchie 25
I.10.1. Hiérarchies Simple 25
I.10.2. Hiérarchies Multiple
25
Chapitre Deuxième : CONCEPT DE BASE SUR L'ENTREPOT
DE DONNEES 27
II.1. INTRODUCTION 27
II.2. DEFINITION D'UN ENTREPOT DE DONNEES 28
II.2.1. Données orientées sujets
29
II.2.2. Données intégrées
29
II.2.3. Données non volatiles
30
Mémoire KIAKA MUSITU Héritier Page 89
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 90 sur 91
II.2.4. Données historisées
30
II.2.5. Données agrégées
31
II.2.6. Méta-données
31
II.3. UTILITE D'UN ENTREPOT DE DONNEES 31
II.4. LES ARCHITECTURES D'UN ENTREPOT DE DONNEES 32
II.4.1. L'architecture Réelle 32
II.4.2. L'architecture Virtuelle 33
II.4.3. L'architecture Remote 33
II.5. ARCHITECTURE TECHNIQUE D'UN ENTREPOT DE DONNEES
34
II.7. COMPOSANTS DE BASE OU ARCHITECTURALES D'UN ENTREPOT
DE
DONNEES 34
II.8. TABLE DE FAITS 36
II.9. TABLE DE DIMENSION 36
II.10. LES MESURES 36
II.11. MODELES DE CONCEPTION D'UN ENTREPOT DE DONNEES
37
II.11.1. Modélisation en étoile 37
II.11.2. Modélisation en flocon 38
II.11.3. Modélisation en Constellation 40
II.11.4. Modélisation en Grappe 40
II.12. APPROCHES DE MISE EN PLACE D'UN DATA WAREHOUSE
40
II.12.1.Approche Top-down 41
II.12.2. Approche Bottom-up 41
II.12.3. Approche Middle-out 41
II.13. LE MAGASIN DE DONNEES 42
II.13.1. Introduction 42
II.13.2. Définition 42
II.13.3 Structure physique et théorique 43
II.13.4 Place du DataMart dans la structure de données
43
II.13.5 Interaction avec les utilisateurs 43
II.13.6. Intérêt et limites 44
Chapitre Troisième : PRESENTATION DE LA
DIRECTION GENERALE DES IMPOTS. 45
III.1. PRESENTATION DE LA DIRECTION GENERALE DES IMPOTS
45
III.1.1. Historique et Nature Juridique de la Direction
Générale des Impôts 45
III.1.2. Mission de la Direction Générale des
Impôts 46
III.2. OBJECTIF 47
III.3. FONCTIONNEMENT 47
III.4. STRUCTURE ADMINISTRATIVE DE LA DIRECTION GENERALE DES
IMPOTS 47
III.4.1. Organigramme de la DGI 50
III.4.2. Description de Postes 51
Mémoire KIAKA MUSITU Héritier Page 90
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 91 sur 91
III.5. L'IMPOT 56
III.5.1. Notion et définition 56
III.5.2. Types d'impôts 57
III.5.3. Opérations d'exécution d'impôt
60
III.6. PRESENTATION DU SCHEMA RELATIONNEL DE LA BASE DE DONNEES
EXISTANTE 61
Chapitre .IV. CONCEPTION D'UN DATAMART POUR LE
PILOTAGE DU SYSTEME DE GESTION
DES IMPOTS CAS DE LA DIRECTION GENERALE DES IMPOTS
62
IV.1. APPORT DE L'INFORMATIQUE DECISIONNELLE A L'ENTREPRISE
62
IV.2. ANALYSE DES BESOINS 63
IV.3. CHOIX DE METHODE 63
IV.4. CHOIX DU MODELE 64
IV.5. PROPOSITION DU NOUVEAU SYSTEME 64
IV.6. TABLEAU DES SPECIFICATIONS DES BESOINS 65
IV.6.1. Identifier les activités à
modéliser : 66
IV.6.2. Identifier le sous schéma conceptuel
66
IV.6.3. Classification des entités et
détermination du gain 67
IV.6.4. Identification des Hiérarchies 67
IV.6.5. Production du Modèle dimensionnel : 67
IV.6.6. Rappel des règles de passage pour le
schéma en étoile : 68
IV.7. DEFINITION DES CONTRAINTES D'AGREGATION 69
IV.8. DIFFERENTS ETAPES D'IMPLEMENTATION DU CUBE DGI
70
CONCLUSION 87
BIBLIOGRAPHIE 88
TABLE DES MATIERES 89
Mémoire KIAKA MUSITU Héritier Page 91
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
|