I
REPUBLIQUE DEMOCRATIQUE DU CONGO MINISTERE DE
L'ENSEIGNEMENT SUPERIEUR ET UNIVERSITAIRE
UNIVERSITE SAINT LAURENT DE KANANGA
« USLKA »
B.P.70 KANANGA
FACULTE DE SCIENCES INFORMATIQUES
« Modélisation et implémentation
d'un système décisionnel pour la gestion du personnel à
la Régie des Voies Aériennes de Kananga ».
Présenté par KABEYA ILUNGA
Paulin
Mémoire présenté et défendu en
vue de l'obtention du Grade de Licencié en Sciences
Informatiques.
Option : Conception de
système d'information et programmation Avancée
Octobre 2021
EPIGRAPHE
« Il faut appeler science que l'ensemble des recettes
qui réussissent toujours. Tout le reste est littérature, car
la science n'a pas de patrie ».
Paulin KABEYA ILUNGA
IN MEMORIAM
A vous cher père François ILUNGA,
chère mère Marthe BUKAWU et très chère
grand-mère Madeleine KABEDI, que la terre de nos ancêtres
avait arraché si tôt, vos souvenirs innombrables
marquants ne m'ont pas laissé indifférent, de
là où vous êtes, sachez que votre semence a porté
des fruits. Je ne saurai vous oublier.
Paulin KABEYA ILUNGA
III
DEDICACE
A ma charmante épouse Jeannette
MBOMBO
En témoignage de nos moments de liesse, de
fraternité, d'amour et des épreuves difficiles qu'on a pu
surmonter ensemble et de tout ce qu'on a partagé et qu'on
partagéra toujours ensemble. Ton soutien moral,
matériel
et financier ainsi que ta compréhension ont toujours
été présents aux moments les plus difficiles.
Aucun mot, aucune dédicace ne saurait exprimer mon
respect, ma gratitude, pour m'avoir laissé la liberté
du choix, pour avoir eu confiance
en moi.
Je vous rends hommage par ce modeste travail en guise de
ma reconnaissance éternelle et mon infini amour.
Paulin KABEYA ILUNGA
IV
REMERCIEMENTS
Le développement de tout homme implique des longues
années du dur labeur aux cours desquelles, il recherche par les
expériences vécues avec les autres et dans un silence
antérieur à pénétrer le mystère de son
être pour acquérir certaine maturité et donner un sens
à son existence.
Dans notre pèlerinage et plus
précisément durant l'élaboration de notre mémoire
de fin de cycle, des nombreuses personnes ont jouées des rôles
actifs, certaines par leurs conseils et dévouements, d'autres par leurs
soutiens moraux que matériaux.
Ainsi, au moment où nous publions notre
mémoire, nous nous sentons redevable envers eux. C'est pourquoi nous
voudrons nous acquitter de l'agréable devoir d'exprimer toute notre
reconnaissance à tous ceux qui de loin ou de prêt ont
contribué à donner à cette dissertation sa forme
actuelle.
Nos remerciements à notre Directeur le Professeur
Pierre KAFUNDA KATALAY pour son entière
disponibilité, son aide inestimable et ses conseils, sans lesquels ce
mémoire n'aurait pu aboutir.
Nous remercions de tout coeur le co-directeur de ce
mémoire en la personne de l'Ingénieur Cédrick
MUAMBA Muya pour ses différentes remarques et orientations dans
l'élaboration; qu'il trouve ici l'expression de nos sentiments de
gratitude.
Nous remercions également aussi les membres du
Comité de Gestion de l'Université Saint Laurent de Kananga pour
le suivi, disponibilité, leurs précieux conseils et remarques
constructives tout au long de nos cinq années d'études.
Que tous les enseignants de l'USLKA qui ont
contribué à notre formation, le long de ces cinq années
trouvent ici l'expression de ma gratitude et plus particulièrement
l'Assistant Pierrot MUKENDI ainsi que les Chefs des travaux Anaclet TSHIKUTU et
Nobla TSHILUMBA.
Mes remerciements s'adressent au professeur
Laurent LUMU NGALAMULUME Tu es l'être le plus cher sur terre,
toi qui a pris la place d'un parent et qui a toujours su être à
mon écoute et me réconforter au moment opportun ; à tes
encouragements et tes prières qui m'ont toujours soutenue et
guidé ; ta bonté, ton honnêteté, ta
générosité et tes grandes qualités humaines
demeurent pour moi le meilleur exemple à suivre.
A ma jolie soeur Ivette KABEDI, mes chers frères
Serge KAYEMBE et Jean-Pierre TSHITENGE ; nul mot ne saurait exprimer l'amour,
la tendresse et l'attachement que j'ai pour vous. Je vous dédie ce
travail en témoignage de l'amour et des liens de sang qui nous unissent.
Puissions-nous rester unis dans la tendresse et fidèles à
l'éducation que nous avons reçue.
V
Mes remerciements s'adressent aussi plus
particulièrement à mes Oncles : Martin MADIMBA LUKUSA et Hubert
BEYA pour leur soutien moral, matériel et financier ; que le bon Dieu
vous bénisse.
Mes remerciements à mes meilleurs amis : Emmanuel
KABIENA, Joseph NTUMBA, Jean KAYIMUSUMBA et Michel BITANGALO, je vous dis que
la cohorte est atteinte.
Je remercie également mes compagnons,
collaborateurs et collaboratrices : Josée-Lyska NTUMBA, Christine
TSHILANDA, Angel MBUYI et Christophe KALONGA.
Je ne peux clore cette page sans remercier mes camarades
de lutte : Achille MALUNDU et Judith TSHIBOLA eux qui ont souffert ensemble
avec moi.
Que toute personne qui de loin ou de près à
contribuer à mes études trouve ici l'expression de ma
gratitude.
Paulin KABEYA ILUNGA
VI
SIGLES
CUBE : Schéma Multidimensionnel
DGRKOC : Direction Générale des Recettes du
Kasaï Occidental
DW : Data Warehouse
ECD : Employé de Courte Durée
EFA : Employé de Fonction Auxiliaire
ELD : Employé de Longue Durée
ETL : Extraction Transformation an Loading
GKN : Général Kinshasa Company
HDD : Hard Drive Disk
HOLAP : Hybrid On Line Analytic Processing
MCD : Modèle Conceptuel de Données
MLD : Modèle Logique de Données
MOA : Maîtrise d'Ouvrage
MOE : Maître d'oeuvre informatique
MOLAP : Multidimensinnel On Line Analytic Processing
MPD : Modèle Physique de Données
OLAP : On Line Analytic Processing
OLTP : On Line Transaction Processing
OMG : Object Management Group
OMT : Obect Modeling Technique
OOSE : Object Oriented Software Engineering
PC : Personnal Computer
PV : Procès-Verbal
RAM : Radom Access Memory
ROLAP : Relational On Line Analytic Processing
RVA : Régie des Voies Aériennes
SABENA : Société Anonyme Belge pour
l'Exploitation de la Navigation Aérienne
SARL : Société à
Résponsabilité Limitée
SGBD : Système de Gestion de Base de Données
SID : Système d'Information Décisionnel
UML : Unified Modeling Language
VII
LISTE DE FIGURES
Figure 1 : Architecture
Générale d'un système décisionnel
Figure 2: schéma en étoile
Figure 3: schéma d'un modèle en
flocon
Figure 4: Exemple de schéma
multidimensionnel
Figure 5: Architecture d'un Data
Mart
Figure 6 : Architecture ROLAP
Figure 7: Architecture MOLAP
Figure 8 : Architecture HOLAP
Figure 9: Arbre de décision construit
à partir de l'attribut âge
Figure 10 : Arbre de décision
finale
Figure 11 : graphe connexe
Figure 12 : Arbres
Figure 13 : arborescence
Figure 14 : Diagramme de cas
d'utilisation de la gestion du personnel
Figure 15 : diagramme de
séquence de cas d'utilisation engager
Figure 16 : diagramme
d'activité de cas Engager
Figure 17 : diagramme de
séquence lister personnel
Figure 18 : diagramme
d'activité lister personnel
Figure 19 : diagramme de
séquence modifier_personnel
Figure 20 : diagramme
d'activité modifier personnel
Figure 21 : diagramme de classe de
la gestion du personnel
Figure 22 : SQL Server
Figure 23 : Microsoft SQL Server
Management Studio
Figure 24 : création de la
base de données
Figure 25 : nouvelle base de
données
Figure 26 : table
Figure 27 : Business Intelligence
Figure 28 : Assistant Source de
données
Figure 29 : Gestionnaire de
connexion
Figure 30 : Assistant source de
données
Figure 31 : Sélection des
tables
Figure 32 : création
dimensions
Figure 33 : création de
cube
VIII
LISTE DE TABLEAUX
Tableau 1 : Différence entre SGBD et
entrepôts de données
Tableau 2 : compare les
caractéristiques des systèmes
Tableau 3: le processus du
datamining.
Tableau 4: les taches et technique du
datamining.
Tableau 5: exemples pratiques
Tableau 6: Liste des matériels
existants
Tableau 7: Autres matériels
Tableau 8 : Dictionnaire de
données
Tableau 9 : Identification Engager
personnel
Tableau 10 : identification de
Lister personnel
Tableau 11 : identification de
modifier personnel
1
0. INTRODUCTION GENERALE
C'est lorsque la fumée des annonces se dissipe et
lorsque le tapage médiatique s'apaise que l'on peut voir,
éventuellement, les projets se mettre en place. L'innovation arrive sur
le terrain au moment où elle quitte la scène.
La raison d'être d'un Système d'Information
Décisionnel est l'établissement de ponts entre opérations
et stratégie, entre automatisation et conduite, entre détail et
synthèse, entre situation et évolution. On lui demande, en
quelque sorte, de faire le grand écart entre des notions
indépendantes ou opposées. On peut se demander pourquoi un tel
besoin apparaît aujourd'hui avec une telle ampleur.
En réalité, l'information décisionnelle
est une notion ancienne ; l'idée de Système d'Aide à la
Décision (Decision Support System) est en effet âgée d'un
bon quart de siècle. Elle est donc largement plus ancienne que toutes
les techniques auxquelles on l'associe aujourd'hui. Elle a toutefois
fondamentalement évolué depuis sa naissance. Cette
évolution a été rendue possible, mais non pas
provoquée, par l'innovation technologique.
En particulier, l'expansion actuelle des entrepôts de
données découle presque directement des nouvelles
caractéristiques de l'« écosystème » dans lequel
vivent les organisations. Dans un univers marqué par des
phénomènes de déréglementation et de
mondialisation, même si la portée de ces phénomènes
a été jusqu'à présent largement
exagérée, la compétition et le changement imposent un
nouveau cadre de prise de décisions et une nouvelle conception de la
stratégie. Cette nouvelle donne et affecte en premier lieu les
entreprises intervenant dans les secteurs les plus concurrentiels, pour
lesquelles l'adaptation au changement est une question de survie
immédiate.
Le modèle du commandement central, de l'automatisation
et du contrôle a posteriori, qui correspondait à l'environnement
plus stable des précédentes décennies, n'est pas assez
souple pour ce nouveau contexte.
C'est aujourd'hui la logique de la détection
avancée et de l'adaptation rapide qui tend à prévaloir, de
manière inégale mais réelle. Tout ceci implique
nécessairement une redistribution de la responsabilité
décisionnelle. Il en résulte une gigantesque dissémination
de l'information décisionnelle et un foisonnement de projets aussi
variés dans leur envergure que dans leur contenu.
Un modèle de données sans données ne
serait bien entendu qu'une coquille vide. A la problématique de la
modélisation succède donc naturellement celle de l'alimentation.
Or l'alimentation d'un entrepôt de données décisionnel
n'est pas qu'un problème de connectique et de transfert physique. C'est
même le problème politique, conceptuel et architectural le plus
délicat du système, et le plus susceptible de décider de
la réussite d'un projet.
Le marché met progressivement à notre
disposition un certain nombre d'outils et de composants susceptibles de jouer
un rôle dans la construction des solutions décisionnelles. Nous
croyons utile de résumer ici les grandes alternatives technologiques.
2
Enfin, il nous a semblé indispensable de
présenter le présent travail sur « la
modélisation et l'implémentation d'un système
décisionnel pour la gestion du personnel à la RVA Kananga
».
0.1. Choix et intérêt du sujet 0.1.1.
Choix du sujet
Nous avons choisi ce sujet pour deux raisons :
Aider les décideurs de la Régie des Voies
Aériennes du Kasaï Central d'avoir toutes les données
nécessaires à la prise de décision en un temps
réduit et d'éviter les erreurs dans l'analyse et
l'interprétation de données ;
La seconde réside sur l'obligation qu'à tout
étudiant de présenter et défendre un mémoire
à la fin du deuxième cycle en Informatique afin de faire la
liaison des théories apprises dans notre formation à la
pratique.
0.1.2. Intérêt du
sujet
Ce mémoire présente pour nous un triple
intérêt :
? Il nous permet d'obtenir le grade de Licencié en
Sciences Informatiques dès qu'il est défendu et accepté
;
? Pour la RVA Kasaï Central, cette étude permettra
d'améliorer son système de
gestion du personnel et surtout dans la prise de
décisions par les décideurs ; ? Pour les futurs chercheurs qui
embrasseront le domaine du système décisionnel, c'est
un document de référence.
0.2. Etat de la question
Dans cette partie, il nous convient de signaler que nous
n'avons pas la présentation de faire de ce mémoire une
originalité scientifique personnelle d'autant plus certains de nos
prédécesseurs ont déjà abordé ce sujet d'une
manière ou d'une autre. Parmi eux, voici ceux qui ont retenu notre
attention :
? MANKAMBA YANKUMBA Jean-Luc, UKA 2015-2016 : « Mise
en place d'un système décisionnel basé sur le Data Mart et
l'arbre de décision pour le recrutement du personnel à la DGRKOC
» ; il s'est penché sur les problèmes liés
à la gestion du personnel en général et en particulier sur
la gestion des recrutements.
Quant à nous, nous allons nous basés sur «
la modélisation et l'implémentation d'un système
décisionnel pour la gestion du personnel à la RVA Kananga »,
tout en se focalisant sur la gestion de recrutement, de congé ainsi
que la retraite du personnel de cette Régie des Voies
Aériennes.
3
0.3. Problématique et hypothèses 0.3.1.
Problématique
La problématique se présente dans toute
recherche scientifique comme un ensemble des préoccupations que posent
un chercheur et qui nécessite des réponses dès que l'on
descend sur terrain. Cela étant, elle est définie comme
l'ensemble des questions que l'on se pose devant un constat que soulève
une étude ou une recherche pour arriver à la
vérité.1
Ainsi, notre problématique se résume en ces termes
:
? Le déploiement d'un système décisionnel
pour la gestion du personnel pourra-t-il
aider les décideurs de la RVA Kasaï Central à
prendre des bonnes décisions ? ? La gestion du personnel tenue
manuellement donne-t-elle satisfaction?
? Comment le système décisionnel peut-il
contribué à l'amélioration de la prise de décision
?
0.3.2. Hypothèses
Les hypothèses sont définies comme des
suppositions liées à un phénomène donné dont
on veut se proposer de vérifier si elle est pertinente ou non à
travers la mise en oeuvre de diverses méthodes de
recherche.2
Les hypothèses sont des propositions des réponses
provisoires émises par le chercheur comme fil conducteur qui seront
infirmées ou affirmées.3
Nous pensons que le déploiement d'un système
décisionnel pour la gestion du personnel constituera une solution pour
pallier aux difficultés majeures dans la prise de décisions par
les décideurs; il permettra à la RVA de se doter d'un outil
rentable pour un bon rendement car il consiste au déploiement de Cube
afin de manipuler les données et fouiller ces dernières pour la
prise de décisions en un temps très court.
De ce qui concerne la gestion du personnel tenue manuellement,
elle ne donne pas satisfaction du fait qu'elle présente quelques
erreurs, plus de lourdeur et lenteur dans la prise de décisions.
D'où, le système décisionnel contribuera
à l'amélioration de la prise de décisions par les
décideurs dès qu'il est mis en place, car il mettra les
données nécessaires à la disposition des décideurs
à un temps réduit pour que les bonnes décisions soient
prises.
0.4. Méthodes et techniques 0.4.1.
Méthodes
La méthode est un ensemble des principes, des
règles et d'opérations intellectuelles permettant d'analyser les
données collectées en vue d'atteindre les
résultats.4
1 MALENGA M. ; Notes de cours d'initiation à la
Recherche Scientifique, G1 Informatique, USLKA, 2016-2017,
inédit
2 MUKADI C. ; Notes de Cours de Méthodes de Recherche
Scientifique, G2 Informatique, USLKA, 2017-2018, inédit
3 GRAWITZ M. ; Les méthodes des Sciences Sociales,
Paris, édition Dalloz, 1955, p.10
4 FREYSSINET J. ; Méthode de recherche en Sciences
Sociales, éd.Mont Chrétien, Paris, 1997, p.12
4
En outre, la méthode est un ensemble ordonné des
principes et règles permettant de comprendre la structure fonctionnelles
de l'institution et avoir une idée sur son organisation
interne.5
Pour bien mener notre étude, nous avons recourus aux
méthodes suivantes:
Méthode analytique: qui nous
a permis à faire l'analyse des faits. Cette méthode va de l'effet
aux causes. Hélas! Comme elle ne suffisait pas, nous avons fait appel
à deux autres méthodes;
La méthode historique:
celle-ci nous a permis de connaitre l'origine des événements du
fait qu'elle est une méthode descriptive, sa démarche est parfois
chronologique. Et enfin;
La méthode structurale: qui a
consisté à connaitre les relations que l'élément
entretien avec la structure. Ces principes opératoires consistent
à identifier un phénomène ou une entité sociale
à étudier et ensuite analyse ce phénomène ou
entité dans sa totalité.
0.4.2. Techniques
En vue de récolter les données
nécessaires dans Régie et correspondantes à notre
problématique, nous nous sommes référer aux techniques
ci-dessous:
? Technique d'interview: elle nous a
servi à interviewer les agents de la place avec une série des
questions plus détaillées et face auxquelles des réponses
nous ont été données et ont aidées à
l'élaboration de ce mémoire;
? Technique documentaire: celle-ci
nous a aidés plus dans la récolte de données utiles et
fiables tout en lisant les ouvrages et les archives ayant trait aux faits qui
causent le disfonctionnement dans la gestion du personnel;
? Technique d'observation: cette
dernière nous a permis quant à elle d'observer le
déroulement des activités faisant l'objet de notre
étude.
0.5. Objectif de la recherche
Notre objectif est d'apporter des solutions nouvelles pour la
modélisation et le développement d'entrepôts. Face à
la profusion d'informations hétérogènes, la conception et
le développement de systèmes décisionnels adaptés
s'avèrent primordiaux. Le cadre applicatif de notre mémoire de
fin de cycle se situe dans le domaine décisionnel notamment sur
«Le déploiement d'un système décisionnel pour le
gestion du personnel au sein de la Régie des Voies Aériennes de
Kananga».
Par ailleurs, les applications décisionnelles (et plus
généralement toutes les applications décisionnelles)
utilisent fréquemment des données temporelles. Malgré
l'intérêt que portent les décideurs aux évolutions
des données, les systèmes commerciaux actuels n'intègrent
pas l'historisation des données dans les entrepôts. En outre, peu
de travaux de recherche sur les entrepôts traitent de cet aspect. C'est
ainsi que notre étude est d'une grande importance car les
résultats obtenus à la fin pourraient aider le service du
5 GRAWITZ M. ; Op.cit, p.14
5
personnel de la RVA à adopter des nouvelles
stratégies dans la prise de décisions sur la gestion du
personnel.
Enfin, le présent mémoire apportera une solution
à la modélisation d'un système décisionnel qui
prendra en compte les problèmes difficiles à gérer et
trouver une solution voulue. C'est ainsi que dans le cadre de notre formation
spécifique entant que concepteur
de système d'information, celui-ci facilitera à
la communauté scientifique à pouvoir identifier les
problèmes similaires à celui que nous tentons de résoudre
ici pour y trouver
des solutions dans un court délai.
0.6. Délimitation de la recherche
Vu que le terrain de recherche est trop vaste, il est
impérieux que chaque chercheur limite ses recherché dans le temps
et dans l'espace.
a) Dans le temps: notre
étude va de 2020 à 2021, l'année 2020 est choisie comme
point de départ de nos recherches et 2021 comme l'année de fin de
nos investigations, ou soit une année de recherches.
b) Dans l'espace: elle porte sur la
Régie des Voies Aériennes Central précisément dans
le service Administratif, Financier et Commercial ayant en charge la gestion du
personnel.
La raison majeure qui nous a amené à faire ce
choix sur la gestion du personnel se justifie qu'entend que chercheur,
certaines observations sur la RVA nous ont prouvés qu'elle a les
difficultés dans la gestion à ce qui concerne le personnel.
0.7. Subdivision du travail
Hormis l'introduction et la conclusion générale, ce
mémoire portera sur cinq chapitres à savoir:
? Chapitre premier qui abordera les
Généralités sur le Système Décisionnel (e
Business);
? Chapitre deuxième qui portera sur les entrepôts de
données (Data Warehouse); ? Chapitre troisième qui parlera de
Datamining ;
? Chapitre quatrième qui traitera sur la
présentation du cadre d'étude et spécification de besoins
;
? Chapitre cinquième qui chutera par
l'implémentation de la Solution.
6
CHAPITRE I : GENERALITES SUR LES SYSTEMES
DECISIONNELS
I.0. Introduction
Toute entreprise qui veut atteindre des performances est
censée prendre des décisions rationnelles en se basant sur un
système décisionnel. La faillite de bon nombre d'entreprises est
due au manque d'un personnel qualifié, à une mauvaise gestion et
à une prise de décisions non adéquate.
I.1. Présentation du
décisionnelle
Avant de rentrer dans des considérations techniques,
il est bon de faire un point sur ce qu'est le décisionnel et ce que ce
terme sous-entend. Pour faire très simple, l'informatique
décisionnelle recouvre tous les moyens informatiques destinés
à améliorer la prise de décision des décideurs
d'une organisation. Cette définition pose trois nouvelles questions :
? Qu'est-ce qu'un décideur ?
? Qu'est-ce qui peut permettre d'améliorer la prise de
décision ?
? Quels sont les moyens informatiques disponibles ?
I.2. Définition d'un système
décisionnel
Les systèmes décisionnels sont un ensemble de
technologies destinées à permettre aux collaborateurs d'avoir
accès et de comprendre les données de pilotage plus rapidement,
de telle sorte qu'ils prennent des décisions meilleures et plus rapides
pour enfin atteindre les objectifs de leur organisation. Les systèmes
décisionnels dans leur version la plus complète. 6
1.2.1. La notion de décideur
Sous le modèle du taylorisme et jusque dans les
années 1890, les organisations étaient organisées de
manière pyramidale. Les décisions étaient prises au sommet
de la pyramide et les ordres étaient transmis de manière
descendante et unilatérale à tous les niveaux
opérationnels. Dans ce type d'organisation, les décideurs
étaient seulement les dirigeants de l'organisation.
Ce type d'organisation était efficace tant que le
marché était localisé et qu'il suffisait de produire pour
vendre. Depuis, nous sommes confrontés à une complexité
grandissante du marché liée :
? À la mondialisation : les concurrents sont plus
nombreux, plus innovants, mieux armés.
6 KAFUNDA KATALAYI JP,
Entrepôts des données, L2 informatique option Gestion, cours
inédit, U.K.A 2015-2016.
7
? À une modification des comportements d'achats :
l'organisation se doit d'être centrée client. En effet, les
Produits sont de plus en plus personnalisés (on parle de one-to-one).
? Au fait que le monde va de plus en plus vite : le
critère de délai de livraison ou de disponibilité de
l'information7 jours sur 7, 24h sur 24 associé à la
mondialisation et la personnalisation du besoin client, démultiplie la
complexité de l'écosystème de l'organisation.
Cette logique, facile à comprendre dans un cadre
commercial, s'applique dans tous les domaines de l'entreprise. La prise de
décision ne peut plus être centrale, celle-ci doit être
déléguée. Du fait, dans une entreprise moderne, tout cadre
devient un décideur de terrain et dispose d'une autonomie relative.
C'est cette explosion du nombre de décideurs qui pose un gros
problème à :
? L'informatique, qui se voit démultiplier le nombre de
demandes de rapports et d'extraction de données.
? La direction, qui a besoin d'outils pour manager ses
décideurs : de la cohérence est nécessaire afin que les
décisions prises à tous les niveaux de l'entreprise, le soient en
accord avec la stratégie d'entreprise.
1.2.1.1. Les facteurs d'amélioration de la
prise de décision
Généralement, on présente les trois facteurs
de prise de décision comme étant :
o La connaissance et l'analyse du passé ;
o La représentation du présent ;
o L'anticipation du futur.
Les informations permettant d'appréhender ces facteurs
peuvent être de deux natures différentes :
a) Les informations quantitatives : ce
sont toutes les données chiffrées telles que les montants,
quantités, pourcentages, délais...
b) Les informations qualitatives :
ce sont toutes les informations non quantifiables telles qu'un
commentaire accompagnant un rapport, des mécontentements, un sentiment,
une directive, une nouvelle procédure...
Ces facteurs n'ont pas le même sens suivant le type de
décideur. Leurs horizons fonctionnels et temporels sont trop
différents pour être traités de manière uniforme.
Les décideurs stratégiques ont besoin d'une vision à
360° de leur organisation. S'ils ont besoin d'une évaluation
régulière de leur politique, ils travaillent surtout sur
l'anticipation de l'avenir. Ils ont besoin de projections chiffrées
internes et externes à l'organisation (données quantitatives),
mais aussi de beaucoup de données qualitatives remontant du terrain :
commentaires, comptes rendus. La conviction repose sur des chiffres, mais aussi
sur
8
l'appréhension et la compréhension d'un contexte
et d'un climat interne ou externe à l'organisation.
Les décideurs tactiques sont souvent les plus grands
demandeurs d'outils décisionnels, car ils sont comprimés entre
des décideurs stratégiques, qui leur demandent des
évaluations de leur politique, et des décideurs de terrain,
parfois très nombreux, qu'il faut cadrer et suivre. Ces décideurs
tactiques ont besoin d'une parfaite compréhension du passé,
travaillent peu avec le présent, mais se doivent de travailler avec des
prévisions pour recadrer leur politique. Les données
chiffrées sont bien évidemment essentielles, encore faut-il que
les différents systèmes s'accordent entre eux. Les
décideurs opérationnels travaillent surtout avec le
présent : il leur faut des données opérationnelles brutes
instantanées. L'analyse du passé relève surtout d'un suivi
opérationnel pour vérifier l'adéquation avec les
objectifs. L'anticipation de l'avenir relève de la fourniture de
données opérationnelles en amont du service.
1.2.1.2. L'informatique
décisionnelle
L'informatique décisionnelle couvre toutes les
solutions informatisées pour améliorer la prise de
décision des décideurs dans l'organisation. Dans ses
débuts, l'informatique décisionnelle s'est contentée tout
d'abord de dupliquer les bases de données des systèmes de
gestion, afin d'isoler les requêtes d'analyse de données des
requêtes opérationnelles. Les requêtes d'analyse
étant souvent très lourdes, l'objectif était surtout de
préserver les performances des systèmes opérationnels.
Ensuite cette base de données dédiée aux requêtes et
à l'analyse a progressivement muté et s'est organisée.
Partant du constat qu'il est difficile de croiser des
données contenues dans des bases de données distinctes, le plus
simple a été de regrouper ces données éparses. Le
concept de la base unique pour centraliser les données de l'entreprise
est plus que jamais d'actualité. Il s'agit du concept d'entrepôt
de données (ou Data Ware house). S'il est plus simple d'analyser ces
données une fois qu'elles sont dans l'entrepôt de données,
il n'en reste pas moins qu'il faut tout de même remplir l'entrepôt
de données l'extraction et le croisement des données des
différents systèmes opérationnels puis le chargement dans
l'entrepôt de données, ont fait émerger des outils
dédiés à cette tâche, avec des concepts
métiers qui leur sont propres : les outils d'ETL (Extract Transform
Load).
Si au début, les requêtes d'analyses portaient
sur une base relationnelle (dites OLTP pour On Line Transaction Processing), le
concept de base multidimensionnelle (dites OLAP pour On Line Analytical
Processing) s'est démocratisé fin des années 90. Ce
concept de bases de données offrait des performances très
largement supérieures aux bases OLTP pour répondre à des
requêtes d'analyse. Ces bases OLAP se sont alors couplées
avantageusement avec l'utilisation de l'entrepôt de données. En
effet, elles offraient à la fois un environnement plus performant, mais
permettaient également aux utilisateurs finaux de
bénéficier d'une interface simplifiée d'accès aux
données, beaucoup plus intuitive qu'une base de données OLTP. On
parle alors de méta-modèle.
9
L'ensemble des moyens informatiques et techniques
destiné à améliorer la prise de décision est
appelé système décisionnel ou encore Système
Informatique d'Aide à la Décision (SIAD).
I.3. Historique des systèmes
décisionnels
La prise de décision est un problème essentiel
qui préoccupe les gestionnaires des entreprises. Cette prise de
décision passe par la modélisation de différents
problèmes qu'ils rencontrent dans la gestion d'où la
nécessité d'un modèle basé sur l'arbre de
décision.
De nos jours pour qu'une entreprise puisse bien marcher, elle
doit avoir besoin d'outils d'aide à la décision. Ces outils
permettront alors aux dirigeants de bien prendre des décisions. Ces
décisions concernent tous les services de cette entreprise. Le
système décisionnel englobe tous les services de l'entreprise
ainsi que leurs informations.
Les systèmes décisionnels travaillent comme des
systèmes opérationnels sur de gros volumes de données.
La décision concerne tous les départements de
l'entreprise : finances, ressources humaines, ventes, et la direction
générale. Les applications utiles dans le processus de prise de
décision sont nombreuses, et déjà présentes dans le
système d'information des entreprises.
I.4. L'informatique décisionnelle
L'informatique décisionnelle désigne les
moyens, les outils et les méthodes qui permettent de collecter,
consolider, modéliser et restituer les données,
matérielles ou immatérielles d'une entreprise, en vue d'offrir
une aide à la décision et de permettre aux dirigeants de prendre
des stratégies pour l'entreprise et d'avoir une vue d'ensemble de
l'activité traitée au sein de l'entreprise7.
En général ce type d'applications utilise un
entrepôt de données pour stocker des données provenant de
plusieurs sources hétérogènes et fait appel à des
traitements par lots pour la collecte de ces informations.
I.5. Définition d'un système
décisionnel (Business intelligence)
Un système est un ensemble de technologies
destinées à permettre aux collaborateurs d'avoir accès et
de comprendre les données de pilotage rapidement, de telle sorte qu'ils
prennent une décision meilleure a temps, résultant d'un processus
comportant le choix conscient entre plusieurs solutions en vue d'atteindre un
objectif précis.
7 P.F. Drucker, « Managing in a Time of Great Change
(The Post-Capitalist Executive) », Penguin 1995.
8 G.A. Gorry et M.S. Scott-Morton, « A framework for
management information systems », Sloane Management Review 1971,
p.15.
10
Un système décisionnel permet de répondre
aux questions suivantes :
y' Que s'est-il passé ? (tableau de bord)
;
y' Pourquoi cela s'est-il passé ?
(analyse) ;
y' Que va-t-il se passé ?
(prédiction) ;
y' Que se passe-t-il en ce moment ? (aide
opérationnelle) ;
y' Que devrait- il se passer ou que faire ?
(prise de décision ou entrepôt actif).
I.5.1 Architecture de systèmes
décisionnels8
L'architecture générale d'un système
décisionnel se décompose en trois processus : extraction et
intégration, organisation et interrogation.
Le processus d'extraction et intégration, situé
les sources de données et l'entrepôt est responsable de
l'identification des données dans les diverses sources internes et
externes dans l'extraction de l'information et de la préparation et de
la transformation (nettoyage, filtrage, etc..) des données à
l'intérieur de l'entrepôt, nous trouvons le processus
d'organisation. Il est responsable de la structuration des données par
rapport à leur niveau de granularité (agrégats).
Différents outils permettent de réaliser
l'analyse des données, pour les différents utilisateurs de
l'entreprise.
Figure 1 : Architecture Générale
d'un système décisionnel
Les sources de données sont nombreuses, variées,
distribuées et autonomes. Elles peuvent être internes (bases de
production) ou externes (Internet, bases des partenaires) à
l'entreprise.
11
L'entrepôt de données est le lieu de stockage
centralisé des informations utiles pour les décideurs. Il met en
commun les données provenant des différentes sources et conserve
leurs évolutions.
Les magasins de données sont des extraits de
l'entrepôt orientés sujet. Les données sont
organisées de manière adéquate pour permettre des analyses
rapides à des fins de prise de décision.
Les outils d'analyse permettent de manipuler les
données suivant des axes d'analyses. L'information est visualisée
au travers d'interfaces interactives et fonctionnelles dédiées
à des décideurs souvent non informaticiens (directeurs, chefs de
services,...).
I.6. Les différents éléments
constitutifs du système décisionnel I.6.1 Les sources de
données :
Les sources de données sont souvent diverses et
variées et le but est de trouver des outils et en fin de les extraire,
de les nettoyer, de les transformer et de les mettre dans l'entrepôt de
données. Ces sources de données peuvent être de fichiers de
type Excel, des bases de données opérationnelles d'une entreprise
ou fichiers plats.
I.6.2 L'entrepôt de données
:
Il est le coeur du système décisionnel et
demande une analyse profonde de la part de maitre d'ouvrage.
La conception d'un data warehouse diffère de la
conception d'une base de données relationnelles.
En effet, alors que les bases de données relationnelles
tendant le plus souvent à être normalisées, les bases des
données multidimensionnelles, elles sont normalisées en
respectant le modèle en étoile ou en flocon.9
I.6.3. Le service OLAP ou serveur
d'analyse
Le serveur OLAP est opposé à OLTP et a pour but
d'organisé les données à analyser par domaine ou par
thème et d'en ressortir des résultats pertinents pour le
décideur. Les résultats sont obtenus par différents
algorithmes de datamining (fouille de données) du serveur d'analyse. Ces
résultats peuvent amener l'organisation à prendre de très
bonnes décisions en vue d'améliorer le rendement de leurs
entreprises.
9 Bertino E., Ferrari E., Guerrini G., Merlo I., "Extending
the ODMG Object Model with Composite Objects", OOPSLA'98, Vancouver
(Canada), 1998, p.56
12
I.7. Les fonctionnalités d'un système
décisionnel
Les besoins des utilisateurs peuvent être regroupés
en quatre catégories : Simuler, analyser les données,
réduire des états de gestion, suivre et contrôler.
1°) Simuler
? Gestion de modèles de calcul (calculs automatiques
d'ensemble de données complexe en fonction de paramètre par
l'utilisateur et de règles de gestion)
Exemple d'utilisation :
élaboration de business plan ; ? Elaboration collaborative
;
EX : l'élaboration
budgétaire.
2°) Analyse de données
Fonctionnalité OLAP (établissement d'analyse
dynamique multidimensionnelle avec possibilité de trié, filtrer,
zoomer a l'intérieure de données) ;
EX : chiffre d'affaire.
Fonctionnalités avancées de datamining, ensemble
des techniques statistiques sophistiquées permettant de faire apparaitre
des corrélations, des tendances et des prévisions.
3°) Produire des Etat de
gestion
Fonctionnalités de reporting raquetteurs permettant de
produire de façon simple et rapide, des tableaux de données
incorporant des calculs plus ou moins sophistiquées.
4°) 4°) Suivre et contrôler
Elaboration de tableau de bord produit et diffusion
automatiquement à fréquence régulière de tableaux
de bord regroupent des données hétérogènes.
EX : production de tableaux de bord
graphique à destination de responsables opérationnels·
Emission d'alerte génération conditionnelle de
message sur différents supports (email, sms,...) plus ou moins complexes
en fonction de la configuration de données.
Nous avons constaté que l'ensemble de ces
fonctionnalités sont rarement mise en place dans une entreprise.
Les mises en oeuvre sont en outre souvent réalisées
par domaine fonctionnel(les ventes, achats,...). Par ailleurs, il n'existe pas
de produit couvrent l'ensemble de ces fonctionnalités.
13
Chaque progiciel en fonction de son origine et du
positionnement que souhaite lui donner son éditeur est plus au moins
avancé sur l'un ou l'autre thème.
Il est donc crucial de déterminer
précisément ses besoins présent et future, ainsi que les
contraintes liées à son organisation ou à son
activité avant de choisir une solution.
I.8. Les apports des systèmes
décisionnels
Dans beaucoup de nos entreprises ; il est difficile
d'expliquer aux dirigeants que l'on doit parfois dépenser beaucoup
d'argent pour analyser et manipuler des données existant dans le
système d'information de l'entreprise10.
Les apports de systèmes décisionnel sont aussi
défais réels. Ils peuvent être classés en deux
catégories.
? L'amélioration de l'efficacité de la
communication et de la distribution des informations de pilotage ;
? L'amélioration du pilotage des entreprises
résultant de meilleures décisions à prendre plus
rapidement ;
Si le premier point est aisément compréhensible,
présente peu de risque de mise en oeuvre et pose peu de problème
d'évaluation ce n'est clairement pas en revanche une source de gains
significative. Il sera difficile le plus souvent de justifier les couts d'un
projet sur cette seule promesse.
La seconde catégorie a nettement plus de potentiel de
gains. Mais il faut bien reconnaitre que le risque de ne pas atteindre les
objectifs initiaux sont réels sans parler d'énormes
difficultés d'évaluation des bénéfices
escomptés.
Les bénéfices de ce type le plus souvent
cités sont les suivants :
y' Unicité des chiffres, une seule
vérité acceptée par tous ;
y' Meilleure planification ;
y' Amélioration de la prise de
décision ;
y' Amélioration de l'efficacité
des processus ;
y' Amélioration de la satisfaction des
clients et des fournisseurs ;
y' Amélioration de la satisfaction des
employés.
10 S. Kelly, « Data Warehousing - The Route to Mass
Customization », John Wiley & Sons 1996, p.13.
14
I.9. Les Enjeux De L'informatique
Décisionnelle
De nos jours, les données applicatives métier
sont stockées dans une ou plusieurs bases de données
relationnelles ou non relationnelles. Ces données sont extraites,
transformées et chargées par un outil de type ETL.
Un entrepôt de données (data warehouse) peut
prendre la forme d'un data Mart. En règle générale, le
data warehouse globalise toutes les données applicatives de l'entreprise
tandis que les data Marts, généralement alimentés à
partir des données du data warehouse sont des sous-ensembles
d'information concernant un métier particulier de l'entreprise.
I.10. Les fonctions essentielles de l'informatique
décisionnelle
Un système d'information décisionnel assure
quatre fonctions fondamentales, à savoir : la collecte,
l'intégration, la diffusion et la présentation des
données. A ces quatre fonctions s'ajoute une fonction de contrôle
du système d'information décisionnelle lui-même,
l'administration.11
a) Collecte
La collecte est l'ensemble des taches consistant à
détecter, sélectionner, extraire et à filtrer les
données brutes issues des environnements pertinents compte tenu du
périmètre du système d'information décisionnel
(SID).
Les sources de données internes ou externes
étant souvent hétérogène tant sur le plan technique
que sur le plant sémantique, cette fonction est la plus délicate
à mettre en place dans un système décisionnel complexe.
Elle s'appuie notamment sur les outils d'ETL.
Cette alimentation utilise les données sources issues
des systèmes transactionnels de production, le plus souvent sous forme
de compte rendu, d'inventaire ou compte rendu d'opération qui est le
constat au fil du temps des opérations (achats, ventes, écriture,
comptable), le film de l'activité de l'entreprise ; compte rendu
d'inventaire ou compte rendu de stock qui est l'image photo prise a un instant
donné (à une fin de période, mois, trimestre) de
l'ensemble du stock (les clients, les contrats, les commandes). La fonction de
collecte joue également au besoin un rôle de recodage. Une
donnée représentée différemment d'une source
à une autre impose le choix d'une représentation unique pour les
futures analyses.
11 Bret F., Teste O., "Construction Graphique
d'Entrepôts et de Magasins de Données", INFORSID'99, La Garde
(France), Juin 1999.
15
b) Intégration
L'intégration consiste à concentrer les
données collectées dans un espace unifié, dont le socle
informatique essentiel est l'entrepôt.
Élément central du dispositif, il permet aux
applications décisionnelles de bénéficier d'une source
d'information commune, homogène, normalisée et fiable,
susceptible de masquer la diversité de l'origine des données.
Au passage les données sont épurées ou
transformées par un filtrage et une validation des données en vue
du maintien de la cohérence d'ensemble (les valeurs acceptées par
les filtres de la fonction de collecte mais susceptibles d'introduire des
incohérences de référentiel par rapport aux autres
données doivent être soit rejetées, soit
intégrées avec un statut spécial).
Une synchronisation (d'intégrer en même temps ou
à la même date de valeur des événements reçus
ou constatés de manière décalée ou
déphasée).
Une certification (pour rapprocher les données de
l'entrepôt des autres systèmes légaux de l'entreprise comme
la comptabilité ou les déclarations réglementaires).
C'est également dans cette fonction que sont
effectués éventuellement les calculs et les agrégations
(cumuls) communs à l'ensemble du projet. La fonction
d'intégration est généralement assurée par la
gestion de métadonnées, pour l'interopérabilité
entre toutes les ressources informatiques, des données
structurées (bases de données accédées par des
progiciels ou applications), ou des données non structurées.
c) La diffusion ou la distribution
La diffusion met les données à la disposition
des utilisateurs, selon des schémas correspondant au profil ou au
métier de chacun, sachant que l'accès direct à
l'entrepôt ne correspondrait généralement pas aux besoins
d'un décideur ou d'un analyste. L'objectif prioritaire est de segmenter
les données en contextes informationnels fortement cohérents,
simples à utiliser et correspondant à une activité
décisionnelle particulière.
Alors qu'un entrepôt de données peut
héberger de centaines ou de milliers de variables ou indicateurs, un
contexte de diffusion raisonnable n'en présente que quelques dizaines au
maximum.
Chaque contexte peut correspondre à un DataMart, bien
qu'il n'y ait pas de règles générales concernant le
stockage physique.
12 Chaudhuri S., Dayal U., "An Overview of Data
Warehousing and OLAP Technology", ACM SIGMOD Record, 26(1), 1997, p.112
16
Très souvent, un contexte de diffusion est
multidimensionnel, c'est-à-dire modélisable sous la forme d'un
hyper cube, il peut alors être mis à disposition à l'aide
d'un outil OLAP.12
Les différents contextes d'un même système
décisionnel n'ont pas tous besoin du même niveau de
détail.
De nombreux agrégats ou cumuls, n'intéressant que
certaines applications et n'ayant donc pas lieu d'être gères en
tant qu'agrégats communs par la fonction d'intégration,
relèvent donc de la diffusion.
Ces agrégats peuvent être, au choix,
stockés de manière persistante ou calculés dynamiquement
à la demande.
On peut distinguer trois questions à élucider
pour concevoir un système de reporting : À qui s'adresse le
rapport spécialisé ? (choix des indicateurs a présenter,
choix de la mise en page)
? Par quel trajet ? (circuit de diffusion type workflow pour les
personnes, circuits de transmission télécoms pour les moyens)
;
? Selon quel agenda ? (diffusion routinière ou sur
événement prédéfini).
d) Présentation
Cette quatrième fonction, la plus visible pour
l'utilisateur, régit les conditions d'accès de l'utilisateur aux
informations. Elle assure le fonctionnement du poste de travail, le
contrôle d'accès, la prise en charge des requêtes, la
visualisation des résultats sous une forme ou une autre.
Elle utilise toutes les techniques de communication possibles
comme les outils bureautiques, raquetteurs et générateurs
d'états spécialises, infrastructure web,
télécommunications mobiles, etc.
e) Administration
C'est la fonction transversale qui supervise la bonne
exécution de toutes les autres; elle pilote le processus de mise
à jour des données, la documentation sur les données et
sur les métadonnées, la sécurité, les sauvegardes,
la gestion des incidents.
17
I.11. Définition des Modèles de
Données Décisionnels
Un modèle de données s'applique
généralement à une application ou à un ensemble
d'applications dont le périmètre et la définition sont
arrêtés en amont du projet. Ceci est valable pour toute
application informatique. Mais ce principe d'applique d'une manière
particulière dans les projets décisionnels.
Consommateur de données et producteur d'informations,
un SID est nécessairement un dispositif à double face puisque
:
? Il combine des données d'origines diverses,
généralement opérationnelles ;
? Il met des données à disposition selon des
objectifs informationnels.
? Par rapport aux sources de données qui l'alimentent,
le data warehouse est sous-tendu par un modèle fédérateur
ou intégrateur. Mais ce modèle n'est pas directement
représentatif des points de vue informationnels - éventuellement
multiples et changeants des utilisateurs du SID. Or le SID ne vaut que pour les
restitutions informationnelles qu'il offre. Le véritable modèle
de données décisionnel est donc celui qui reflète la mise
à disposition ou encore la diffusion des données, et non leur
concentration.
Cette mise à disposition se conçoit par
domaines, sachant que le périmètre d'un domaine
décisionnel ne coïncide pas avec les frontières d'une
application de production.
Un domaine applicatif concerne un utilisateur ou un ensemble
cohérent d'utilisateurs, et implique un vocabulaire commun et une
manière commune d'appréhender l'information. C'est en quelque
sorte l'univers du discours.
Quelles que soient les modalités de conduite de projet
et les éventuels raccourcis qui seront pris à certaines
étapes, le Modèle Conceptuel des Données (MCD) du domaine
d'application est un passage obligé.
Les modèles dérivés du MCD (MLD et MPD)
sont ensuite élaborés en liaison étroite avec la
technique, selon une démarche fortement tributaire des produits. Quant
au MCD lui-même, rappelons que sa structure ne dépend que de la
sémantique des données et de la vue qu'en ont les utilisateurs.
L'analyste doit par conséquent résister à deux sortes
d'influences pernicieuses qui pèsent, à divers degrés, sur
tous les projets :
? les structures opérationnelles dans lesquelles le SID
puise ses données ;
? les modalités de fonctionnement des outils de gestion
et de présentation.
Les seules bases sur lesquelles il convient de s'appuyer pour
spécifier les objectifs du SID sont les vues externes des utilisateurs.
Ces vues doivent donc être collectées et intégrées
dans le modèle.
18
Un SID comporte donc en réalité au moins deux
Modèles Conceptuels de Données. L'un des deux représente
l'intégration des sources opérationnelles à partir
desquelles s'alimente le système. Il se conçoit et se normalise
selon une démarche traditionnelle de génie logiciel50, qui n'a
pas lieu d'être développée ici. L'autre, celui que nous
examinons dans ce chapitre, correspond à la structure informationnelle
destinée à supporter les requêtes des utilisateurs. C'est
le MCD de diffusion. C'est ce dernier qui représente la structure selon
laquelle l'information doit être mise à disposition ; il constitue
la spécification fonctionnelle du SID13.
La collecte des vues est une affaire de conduite de projet,
dont nous n'ignorons pas la difficulté pratique. La qualité de
cette collecte auprès des utilisateurs est cependant un facteur critique
de succès, et on ne peut pas en faire l'économie sans prendre un
gros risque.
De point de vue de la modélisation proprement dite,
l'intégration des vues n'est pas une simple opération de
juxtaposition. Elle passe par une normalisation.
Les normes d'intégration du MCD, dans un domaine
décisionnel, reposent sur les principes fondamentaux suivants :
Compte tenu de la nature consultative et non transactionnelle
des applications, la structure des vues externes se déduit directement
des requêtes des utilisateurs, et non des connexions
opérationnelles possibles entre les entités ;
A l'intérieur d'un domaine, il existe un ou plusieurs
sous-ensembles de vues liées entre elles par certains critères de
cohérence sémantique et structurelle. C'est sur l'identification
et la validation formelle de ces sous-ensembles, appelés contextes, que
repose toute la démarche de construction du MCD ;
Une requête décisionnelle a pour objet
d'établir un rapprochement non programmé entre des entités
conceptuelles plus ou moins nombreuses. De ce fait, les résultats
attendus sont systématiquement déterminés par des
associations51. La structure des vues reflète celle des associations
possibles. Chaque vue a pour élément central une association
autour de laquelle gravitent deux ou plusieurs entités, et correspond
à une représentation des informations sous forme de tableau
à deux ou plusieurs dimensions ;
La liste exhaustive des requêtes possibles n'est jamais
figée. Celle des vues qui en découlent ne l'est donc pas non
plus. La normalisation du MCD doit permettre d'anticiper et d'intégrer
automatiquement dans chaque contexte le plus grand nombre possible de «
vues probables » d'après la structure des « vues connues
» ; Entre deux entités intervenant dans une même vue, il doit
exister un et un seul chemin de navigation sémantique, et ce chemin doit
être le plus court possible.
13 Groupe EVOLUTION. F. Bret. T. Cruanees. I. Guessarian. E.
Metais. M-C. Rousset. S. Schwer. O. Teste. G. Zurfluh, Ingénerie des
systèmes d'information , édition HERMES, 2001, p.38
19
Conclusion partielle
Dans ce chapitre, nous avons traité les
généralités sur les systèmes décisionnels
(Business Intelligence) ; avons défini l'informatique
décisionnelle, l'architecture de systèmes décisionnels et
ses différents enjeux avec leurs fonctions ; et avons abordé les
systèmes décisionnels qui sont des systèmes qui permettent
aux décideurs des entreprises de prendre des décisions optimales
et importantes pour une meilleure gestion des leurs entreprises. Le chapitre
suivant abordera les notions de l'entrepôt de données et son
fonctionnement.
14 Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P.,
"Fundamentals of Data Warehouses", Ed. Springer Verlag, ISBN
3-540-65365-1, 1999, p.187
20
CHAPITRE II: LE DATA WAREHOUSE
II.1. Introduction
Les entrepôts des données intègrent des
informations en provenance de différentes sources, souvent reparties et
hétérogènes ayant pour objectif de fournir une vue globale
de l'information aux analystes et aux décideurs.
La construction et la mise en oeuvre d'un entrepôt de
données représentent une tâche complexe qui se compose de
plusieurs étapes.
La première est l'analyse des sources de
données et l'identification des besoins des utilisateurs, la
deuxième correspond à l'organisation des données à
l'intérieur de l'entrepôt. En fin, la troisième sert
à établir divers outils d'interrogation, d'analyse, et de fouille
de données.
Chaque étape présente des problèmes
spécifiques. Ainsi, par exemple, lors de la première
étape, la difficulté principale consiste en l'intégration
des données, de manière à ce qu'elles soient de
qualité pour leur stockage. Pour l'organisation, il existe plusieurs
problèmes comme la sélection des vues à
matérialiser, le rafraichissement de l'entrepôt, la gestion de
l'ensemble de données courantes et historisées.
En ce qui concerne le processus d'interrogation, nous avons
besoin des outils performants et conviviaux pour l'accès et l'analyse de
l'information.
II.2. Définition d'un data warehouse
(DW)14
Un entrepôt de données est une collection de
données orientées sujet, intégrées, non volatiles
et historisées, organisées pour le support d'un processus d'aide
à la décision. Nous détaillons ces caractéristiques
:
? Orientées sujet : les données
des entrepôts sont organisés par sujet plutôt que par
application, par exemple, une chaine de magasins d'alimentation organise les
données de son entrepôt par rapport aux ventes qui ont
été réalisées par produit et par magasin, au cours
d'un certain temps.
? Intégrées : les
données provenant de différentes sources doivent être
intégrées, avant leur stockage dans l'entrepôt de
données. L'intégration, c'est à dire la mise en
correspondance des formats, permet d'avoir une cohérence
de l'information.
15 Samos J., Saltor F., Sistrac J., Bardés A.,
"Database Architecture for Data Warehousing: An evolutionary
Approach", DEXA'98, Vienna (Austria), 1998, p.72
21
? Non volatiles : à la
différence des données opérationnelles, celles de
l'entrepôt sont permanentes et ne peuvent pas être modifiées
.le rafraichissement de l'entrepôt consiste à ajouter de nouvelles
données, sans modifier ou perdre celles qui existent.
? Historisées :la prise en
compte de l'évolution des données est essentielle pour la prise
de décision qui, par exemple, utilise des techniques de
prédication en s'appuyant sur les évolutions passées pour
prévoir les évolutions futures.
II.2.1. Objectif Du Data Ware house
L'atout principal d'une entreprise réside dans les
informations qu'elle possède. Les informations se présentent
généralement sous deux formes : les systèmes
opérationnels qui enregistrent les données et le Data Ware house.
En bref, les systèmes opérationnels représentent
l'emplacement de saisie des données, et l'entrepôt de
données l'emplacement de restitution15.
Ainsi voici les objectifs fondamentaux du data warehouse :
Rendre accessibles les informations de
l'entreprise : le contenu de l'entrepôt doit être
compréhensible et l'utilisateur doit pouvoir y naviguer facilement et
avec rapidité. Ces exigences n'ont ni frontières, ni limites. Des
données compréhensibles sont pertinentes et clairement
définies. Par données navigables, on n'entend que l'utilisateur
identifie immédiatement à l'écran le but de ses recherches
et accède au résultat en un clic.
Rendre cohérente les informations d'une
l'entreprise : les informations provenant d'une branche de
l'entreprise peuvent être mise en corrélation avec celles d'une
autre branche. Si deux unités de mesure portent le même nom, elles
doivent alors signifier la même chose. A l'inverse, deux unités ne
signifiant pas la même chose doivent être définie
différemment. Une information cohérente suppose une information
de grande qualité. Cela veut dire que l'information est prise en compte
et qu'elle est complète.
Constituer une source d'information souple et
adaptable : l'entrepôt de données est conçu
dans la perspective de notifications perpétuelle, l'arrivé de
question nouvelles ne doit bouleverser ni les données existantes ni les
technologies. La conception de Data Mart distincts composant un entrepôt
de données doit être répartie et incrémentielle.
16 AHMED T., MIQUEL M., LAURINI R., « Continuous data
warehouse : concepts, challenges and potentials », Proc. of the 12th
International Conference on Geoinformatics, 2004, p.
157-164.
22
Représenter un bastion
sécurisé qui protège la capitale information :
l'entrepôt de données ne contrôle pas
seulement l'accès aux données, mais il offre à ses
gestionnaires une bonne visibilité des utilisations.
Constituer la base décisionnelle de
l'entreprise : l'entrepôt de données recèle
en son sein les informations propres à faciliter la prise de
décisions.
II.2.2. Les Composants de base du Data
Warehouse16
a) Le système source :
système opération d'enregistrement, dont la
fonction consiste à capturer les transactions liées à
l'activité.
b) Zone de préparation des données
: ensemble des processus qui nettoient, transforment, combinent,
archivent, suppriment les doublons, c'est-à-dire prépare les
données sources en vue de leur intégration puis de leur
exploitation au sein du Data Warehouse. La zone de préparation des
données ne doit offrir ni service des requêtes, ni service de
présentation.
c) Serveur de présentation :
machine cible sur laquelle l'entrepôt de données est
stocké et organisé pour répondre en accès direct
aux requêtes émises par des utilisateurs, les
générateurs d'état et les autres applications.
d) Data Mart : sous-ensemble
logique d'un Data Warehouse, il est destiné à quelques
utilisateurs d'un département.
e) Entrepôt de données :
source de données interrogeable de l'entreprise. C'est
tout simplement l'union des Data Marts qui le composent. L'entrepôt de
données est alimenté par la zone de préparation des
données. L'administrateur de l'entrepôt de données est
également responsable de la zone de préparation des
données.
f) OLAP (On Line Analytic Processing) :
Activité globale de requêtage et de
présentation de données textuelles et numériques contenues
dans l'entrepôt de données ; style d'interrogation et de
présentation spécifiquement dimensionnel.
g) ROLAP (Relational OLAP) :
ensemble d'interface utilisateur et d'applications donnant une
vision dimensionnelle des bases de données relationnelles.
h) MOLAP (Multidimensional OLAP) :
ensemble d'interface utilisateur et d'applications dont l'aspect
dimensionnel est prépondérant.
i) Application utilisateur :
ensemble d'outils qui interrogent, analysent et présente
des informations répondant à un besoin spécifique.
L'ensemble des outils minimal se compose d'outil d'accès aux
données, d'un tableur, d'un logiciel graphique et d'un
23
service d'interface utilisateur, qui suscite les
requêtes et simplifie la présentation de l'écran aux yeux
de l'utilisateur.
j) Outil d'accès aux données :
client de l'entrepôt de données.
k) Outil de requête : types
spécifique d'outil d'accès aux données qui invite
l'utilisateur à formuler ses propres requêtes en manipulant
directement les tables et leurs jointures.
l) Application de modélisation :
type de client de base de données sophistiqués
doté de fonctionnalités analytiques qui transforment ou mettent
en forme les résultats obtenus ; on peut avoir :
? les modèles prévisionnels, qui tentent
d'établir des prévisions d'avenir ;
? les modèles de calcul comportemental, qui
catégorisent et classent les comportements d'achat ou d'endettement des
clients ;
? la plupart des outils de Data mining.
m) Métadonnées :
toutes informations de l'environnement du Data Warehouse qui ne
constituent pas les données proprement dites.
II.3. Caractéristiques d'un Data
Warehouse17
Un Data Warehouse est une base de données conçue
pour l'interrogation et l'analyse plutôt que le traitement de
transactions. Il contient généralement des données
historiques dérivées de données transactionnelles, mais il
peut comprendre des données d'autres origines.
Les Data Warehouse séparent la charge d'analyse de la
charge transactionnelle. Ils permettent aux entreprises de consolider des
données de différentes origines.
Au sein d'une même entité fonctionnelle, le Data
Warehouse joue le rôle d'outil analytique.
En complément d'une base de données, un Data
Warehouse inclut une solution d'extraction, de transformation et de chargement
(ETL), des fonctionnalités de traitement analytique en ligne (OLAP) et
de Data mining, des outils d'analyse client et d'autres applications qui
gèrent le processus de collecte et de mise à la disposition de
données.
17 INMON W.-H., Building the data warehouse, QED
Publishing Group, 1992, p.57.
24
II.4 Entrepôts et Bases de
données
Dans l'environnement des entrepôts de données,
les opérations, l'organisation des données, les critères
de performance, la gestion des métadonnées, la gestion des
transactions et le processus de requêtes sont très
différents des systèmes de bases de données
opérationnels.
Par conséquent, les SGBD relationnels orientés
vers l'environnement opérationnel, ne peuvent pas être directement
transplantés dans un système d'entrepôt de
données.
Les SGBD ont été créés pour les
applications de gestion de systèmes transactionnels. Par contre, les
entrepôts de données ont été conçus pour
l'aide à la prise de décision. Ils intègrent les
informations qui ont pour objectif de fournir une vue globale de l'information
aux analystes et aux décideurs.
Le tableau suivant résume les différences entre
les systèmes de gestion de bases de données et les
entrepôts de données.
|
SGBD
|
Entrepôts de données
|
Objectifs
|
Gestion et production
|
Consultation et analyse
|
Utilisateurs
|
Gestionnaire de production
|
Décideurs, analystes
|
Taille de base
|
Plusieurs giga-octets
|
Plusieurs téra-octéts
|
Organisation de données
|
Par traitement
|
Par métier
|
Types de données
|
Données de gestion
(courantes)
|
Données d'analyse
(résumées, historisées)
|
Requêtes
|
Simples, prédéterminées,
données détaillées
|
Complexes, spécifiques,
agrégations et group by
|
Transactions
|
Courte et nombreuse,
temps réel
|
Longues, peu nombreuses
|
Tableau 1 : Différence entre SGBD et
entrepôts de données II.4.1 Rôle d'un
entrepôt de données
Le rôle primordiale d'un data warehouse apparait ainsi
évident dans une stratégie décisionnelle. L'alimentation
du data warehouse en est la phase la plus critique.
En effet, importer des données inutiles en portera de
nombreux problèmes, cela consommera des ressources système et du
temps. De plus, cela rendra le service d'analyse plus lent. Autre point
à prendre en compte est la périodicité d'extraction des
données ;
25
effectivement, le plus souvent, les opérations de
collecte de données sont couteuses en ressource pour la base
accédée.18
II.4.2 Systèmes transactionnels et
systèmes décisionnels
Les Système de Gestion de Base de Donnée (SGBD)
ont été créés pour gérer de grands volumes
d'information contenus dans les différents systèmes
opérationnels qui appartiennent à l'entreprise.
Ces données sont manipulées en utilisant des
processus transactionnels en ligne, .parallèlement à
l'exploitation de l'information contenue dans ces systèmes
opérationnels, les dirigeants des entreprises ont besoin d'avoir une
vision globale concernant toute cette information pour faire des calculs
prévisionnels, des statistiques ou pour établir des
stratégies de développement et d'analyses des tendances.
|
Système transactionnel
|
Système décisionnel
|
Données
|
Exhaustives, courantes,
dynamiques
|
Résumées historiques
statiques
|
|
Orientées applications
|
Orientées sujets (d'analyse)
|
Utilisateurs
|
Nombreux
|
Peu nombreux
|
|
Varies (employés,
directeurs)
|
Uniquement les décideurs
|
|
Concurrentes
|
Non concurrentes
|
|
Mises à jour et
interrogations
|
Interrogations
|
|
Requêtes prédéfinies
|
Requêtes imprévisibles et
complexes
|
|
Réponses immédiates
|
Réponses moins rapides
|
|
Accès à peu d'informations
|
Accès à des nombreuses
informations
|
Tableau 2 : compare les
caractéristiques des systèmes
II.4.3 Différence entre le système OLTP
et le Data warehouse
Les Data Warehouse et les Systèmes OLTP (On Line
Transaction Processing) répondent à besoins très
différents. Les Data Warehouse conçu pour prendre en charge des
interrogations ad hoc. La taille du Data Warehouse n'est pas connue à
l'avance. Par conséquent, celui-ci doit être optimisé pour
offrir de bonnes performances dans le cadre d'opérations d'interrogation
très diverses. Les systèmes OLTP prennent
généralement en
18 Dayal U., Blaustein B. T., Buchmann A. P., Chakravarthy U. S.,
Hsu M., Ledin R., McCarthy D. R., Rosenthal A., Sarin S. K., Carey M. J., Livny
M., Jauhari R., "The HiPAC Project: Combining Active Databases and Timing
Constraints", ACM SIGMOD Record, 17(3), Chicago (Illinois, USA), 1988,
p.312-322
26
charge des opérations prédéfinies. Les
applications peuvent être réglées ou conçues
spécifiquement pour ces opérations.
Un Data Warehouse est mise à jour
régulièrement par les processus ETL (Extraction, Transformation
and Loading), un système de chargement de données en masse
soigneusement défini et contrôlé. Il n'est pas mise
à jour directement par les utilisateurs. Dans les systèmes OLTP,
les utilisateurs exécutent régulièrement des instructions
qui modifient les données de la base. La base de données OLTP est
à jour en permanence et elle reflète l'état actuel de
chaque transaction19.
Les Data Warehouse utilisent souvent des schémas
dénormalisés ou partiellement dénormalisés (tels
que le schéma en étoile) pour optimiser les performances des
interrogations. A l'inverse, les systèmes OLTP ont souvent recours
à des schémas totalement normalisés pour optimiser les
performances des opérations de mise à jour, d'insertion et de
suppression, et pour garantir la cohérence des données. Il s'agit
là des différences générales, elles ne doivent pas
être considérées comme des distinctions strictes et
absolues.
De manière générale, une interrogation
portant sur un Data Warehouse balaye des milliers voire des millions de lignes.
En revanche, une opération OLTP standard accède à quelque
enregistrement seulement.
Le Data Warehouse contient généralement des
données correspondant à plusieurs mois ou années. Cela
permet d'effectuer des analyses historiques. Les systèmes OLTP
contiennent généralement des données quelque semaine ou
mois. Ils conservent uniquement des données historiques
nécessaires à la transaction en cours.
II.4.4 La problématique de
l'entreprise
L'entreprise construit un système décisionnel
pour améliorer sa performance, elle doit décider et anticiper en
fonction de l'information disponible et capitaliser sur ses
expériences.
Entreprise : est une organisation dotée d'une mission
et d'un objectif métier. Elle doit sa raison d'être et /ou sa
pérennité au travers de différent objectifs
(sécurité, développement, rentabilité ...). Par
voie de conséquence, cette organisation humaine est dotée d'un
centre décision.
? Rôle de décideur : il
peut être le responsable de l'entreprise, le responsable d'une fonction
ou d'un secteur. Il est donc celui qui engage la pérennité ou la
raison d'être de l'entreprise. Pour ces raisons, il doit s'entourer de
différents moyens lui
19 R. Kimball, L. Reeves, M. Ross, W. Thornthwaite, Concevoir
et déployer un data warehouse, Eyrolles, Paris, 2000, page 79
20 Matthias Jarke, Thomas List, Jörg Köller, The
Challenge of Process Data Warehousing, 26th International Conference on
Very Large Databases, Caire, Egypt, 2000, p.112
27
permettant une prise de décision la plus pertinente.
Parmi ces moyens, les Data Warehouse ont une place primordiale.
II.4.5 La Modélisation dimensionnelle et la
Modélisation Entité/Relation
a) Modélisation Entité/Relation :
est une discipline qui permet d'éclairer les relation
microscopique entre les données. Dans sa forme la plus artistique, elle
permet de supprimer toute redondance de données. Ceci apporte de
nombreux avantages au niveau du traitement des transactions, qui deviennent
alors très simples et déterministes.
b) Modélisation dimensionnelle :
est une méthode de conception logique qui vise à
présenter les données sous une forme standardisée
intuitive et qui permet des accès hautement performants. Elle
adhère totalement à la dimensionnalité ainsi qu'à
une discipline qui exploite le modèle relationnel en le limitant
sérieusement. Chaque modèle dimensionnel se compose d'une table
contenant une clé multiple, table des faits, et d'un ensemble de tables
plus petite nommées, tables dimensionnelles.
Chacune de ces dernières possède une clé
primaire unique, qui correspond exactement à l'un des composants de la
clé multiple de la table des faits. Dans la mesure où elle
possède une clé primaire multiple reliée à au moins
deux clés externes, la table des faits exprime toujours une relation n,
n (plusieurs-à-plusieurs).
II.4.6. Relation entre la modélisation
dimensionnelle et la modélisation
entité/relation
Pour mieux appréhender la relation qui existe entre la
modélisation dimensionnelle et la modélisation
entité/relation, il faut comprendre qu'un seul schéma
entité/relation se décompose en plusieurs schémas de table
des faits.
La modélisation dimensionnelle ne se met pas à
son avantage en représentant sur un même schéma plusieurs
processus qui ne coexistent jamais au sein d'une série de données
et à un moment donné. Ce qui le rend indûment complexe.
Ainsi, la conversion d'un schéma entité/relation en une
série de schémas décisionnels consiste à scinder le
premier en autant de sous-schémas qu'il y a de processus métier
puis de les modéliser l'un après l'autre. La deuxième
étape consiste à sélectionner les relations n, n
(plusieurs-à-plusieurs) contenant des faits numériques et
additifs (autres que les clés) et d'en faire autant de table des
faits20.
La troisième étape consiste à
dénormaliser toutes les autres tables en table non séquentielle
dotées de clés uniques qui les relient directement aux tables des
faits. Elles deviennent ainsi des tables dimensionnelles. S'il arrive qu'une
table dimensionnelle soit
Les deux types d'objet les plus courants dans les
schémas de Data Warehouse multidimensionnels sont les tables de faits et
les tables de dimension.
28
reliée à plusieurs tables des faits, nous
représentons cette table dimensionnelle dans les deux schémas et
dirons des tables dimensionnelles qu'elles sont conformes d'un modèle
à l'autre.
II.4.6.1 Avantages de la modélisation
dimensionnelle
Le modèle dimensionnel possède un grand nombre
d'avantages dont le modèle entité/relation est
dépourvu.
Premièrement, le modèle dimensionnel est une
structure prévisible et standardisée. Les
générateurs d'états, outils de requête et interfaces
utilisateurs peuvent reposer fortement sur le modèle dimensionnel pour
faire en sorte que les interfaces utilisateurs soient plus
compréhensibles et que le traitement soit optimisé.
La deuxième force du modèle dimensionnel est que
la structure prévisible du schéma en étoile réside
aux changements de comportement inattendus de l'utilisateur. Toutes les
dimensions sont équivalentes.
La troisième force du modèle dimensionnel
réside dans le fait qu'il est extensible à loisir pour accueillir
des données et des besoins d'analyse non prévus au départ.
Ainsi, il est possible d'accomplir :
o Ajouter des faits nouveaux non prévus initialement ;
o Ajouter des dimensions totalement nouvelles ;
o Ajouter des attributs dimensionnels nouveaux non prévus
initialement ;
o Décomposer les enregistrements d'une dimension
existante en un niveau de détail plus fin à partir d'une date
déterminée.
II.5. Schémas d'un Data Warehouse
Un schéma est un ensemble d'objets de la base de
données tels que les tables, des vues, des vues
matérialisées, des index et des synonymes. La conception du
schéma d'un Data Warehouse est guidée par le modèle des
données source et par les besoins utilisateurs.
L'idée fondamentale de la modélisation
dimensionnelle est que presque tous les types de données peuvent
être représentés dans un cube de données, dont les
cellules contiennent des valeurs mesurées et les angles les dimensions
naturelles de données. Nos conceptions peuvent comporter plus de trois
dimensions. Techniquement, il faudrait parler d'hyper cube, bien que le terme
cube de données ait été adopté par le
métier.
A. Les objets d'un schéma de Data Warehouse
29
? Tables des faits : une table de faits
comprend généralement des colonnes de deux types : celles qui
contiennent des faits numériques (souvent appelés indicateurs) et
celles qui servent de clé étrangère vers les tables de
dimension. Une table de faits peut contenir des faits détaillés
ou agrégées. Les tables contenant des faits agrégés
sont souvent appelées tables agrégées. une table de faits
contient généralement de faits de même niveau
d'agrégation. La plupart des faits sont additifs, mais ils peuvent
être semi-additifs ou non additifs. Les faits additifs peuvent être
agrégés par simple addition arithmétique. C'est par
exemple le cas des ventes. Les faits non additifs ne peuvent pas être
additionnés du tout. C'est le cas des moyennes. Les faits semi-additifs
peuvent être agrégés selon certaines dimensions mais pas
selon d'autres.
? Tables des dimensions et hiérarchies :
une dimension est une structure comprenant une ou plusieurs
hiérarchies qui classe les données en catégories. Les
dimensions sont des étiquettes descriptives fournissant des informations
complémentaires sur les faits, qui sont stockées dans les tables
de dimension. Il s'agit normalement de valeurs textuelles descriptives.
Plusieurs dimensions distinctes combinées avec les faits permettant de
répondre aux questions relatives à l'activité de
l'entreprise. Les données de dimension son généralement
collectées au plus bas niveau de détail, puis
agrégées aux niveaux supérieurs en totaux plus
intéressants pour l'analyse, ces agrégations ou cumuls naturels
au sein d'une table de dimension sont appelés des hiérarchies.
Les hiérarchies sont des structures logiques qui utilisent les niveaux
ordonnées pour organiser les données. Pour une dimension temps,
par exemple, une hiérarchie peut agréger les données selon
le niveau mensuel, le niveau trimestriel, le niveau annuel. Au sein d'une
hiérarchie, chaque niveau est connecté logiquement aux niveaux
supérieurs et inférieurs. Les valeurs des niveaux
inférieurs sont agrégées en valeurs de niveau
supérieur.
a) Le Schéma en Etoile
Le schéma en étoile peut être le type le
plus simple de schéma de Data Warehouse, il est dit en étoile
parce que son diagramme entité/relation ressemble à une
étoile, avec des branches partant d'une table centrale. Un schéma
en étoile est caractérisé par une ou plusieurs tables de
faits, très volumineuses, qui contiennent les informations essentielles
du Data Warehouse et par un certain nombre de tables de dimension, beaucoup
plus petites, qui contiennent chacune des informations sur les entrées
associées à un attribut particulier de la table de faits. Une
interrogation en étoile est une jointure entre une table de faits et un
certain nombre de table de dimensions. Chaque table de dimension est jointe
à la table de faits à l'aide d'une jointure de clé
primaire à clé étrangère, mais les tables de
dimension ne sont pas jointes entre elles.
Les schémas en étoile présentent les
avantages suivants : ils fournissent une correspondance directe et intuitive
entre les entités fonctionnelles analysées par les utilisateurs
et la conception du schéma. Ils sont pris en charge par un grand nombre
d'outils
Le principal avantage du schéma en flocons est une
amélioration des performances des interrogations due à des
besoins réduits en espace de stockage sur disque et la petite
30
décisionnels. La manière la plus naturelle de
modéliser un Data Warehouse est la représenter par un
schéma en étoile dans lequel une jointure unique établit
la relation entre la table de faits et chaque table de dimension. Un
schéma en étoile optimise les performances en contribuant
à simplifier les interrogations et à raccourcir les temps de
réponse.
Les schémas en étoile présentent
néanmoins quelques limites. La table centrale peut devenir très
volumineuse, sa taille maximale étant déterminée par le
produit des nombres de lignes des tables de dimension. En outre, les tables de
dimension ne sont plus normalisées. Elles sont donc plus volumineuses et
plus difficiles à tenir à jour car elles contiennent beaucoup de
données dupliquées.
Figure 2: schéma en
étoile
b) Le Schéma en Flocon
Les schémas en flocons normalisent les dimensions pour
éliminer les redondances. Autrement dit, les données de dimension
sont stockées dans plusieurs tables et non dans une seule table de
grande taille. Cette structure de schéma consomme moins d'espace disque,
mais comme elle utilise davantage de tables de dimension, elle nécessite
un plus grand nombre de jointures de clé secondaire. Les interrogations
sont par conséquent plus complexes et moins performantes.
Dans un schéma en flocon, cette même table de
faits, référence les tables de dimensions de premier niveau, au
même titre que le schéma en étoile.
La différence réside dans le fait que les
dimensions sont décrites par une succession de tables (à l'aide
de clés étrangères) représentant la
granularité de l'information. Ce schéma évite les
redondances d'information mais nécessite des jointures lors des
agrégats de ces dimensions.
Cette figure présente un schéma
multidimensionnel pour les ventes qui ont été
réalisées dans les magasins pour les différents produits
au cours d'un temps donné (jour)
31
taille des tables de dimension à joindre. Le principal
inconvénient de ce schéma est le travail de maintenance
supplémentaire imposé par le nombre accru de tables de
dimension.
Figure 3: schéma d'un modèle en
flocon
c) Schéma multi dimensionnel (CUBE)
Dans le modèle multidimensionnel, le concept central
est le cube, lequel est constitué des éléments
appelés cellules qui peuvent contenir une ou plusieurs mesures. La
localisation de la cellule est faite à travers les axes, qui
correspondent chacun a une dimension.
La dimension est composée de membres qui
représentent les différentes valeurs.
Figure 4: Exemple de schéma
multidimensionnel
32
II.6 Le Data Mart II.6.1
Introduction
Un DataMart est un sous-ensemble d'un entrepôt de
données; il est généralement exploité dans les
entreprises pour restituer des informations ciblées sur un métier
spécifique, constituant pour ce dernier un ensemble d'indicateurs
à vocation de pilotage de l'activité et d'aide à la
décision. Un DataMart, selon les définitions, est issu ou fait
partie d'un Data Warehouse, et en reprend par conséquent la plupart des
caractéristiques.
II.6.2 Les définitions
Le DataMart est un ensemble de données ciblées,
organisées, regroupées et agrégées pour
répondre à un besoin spécifique à un métier
ou un domaine donné. Il est donc destiné à être
interrogé sur un panel de données restreint à son domaine
fonctionnel, selon des paramètres qui auront été
définis à l'avance lors de sa conception.
De façon plus technique, le DataMart peut être
considère de deux manières différentes, attribuées
aux deux principaux théoriciens de l'informatique décisionnelle,
bill inmon et Ralph Kimball :
? Définition d'inmon : le
DataMart est issu d'un flux de données provenant du Data Warehouse.
Contrairement a ce dernier qui présente le détail des
données pour toute l'entreprise, il a vocation à présenter
la donnée de manière spécialisée,
agrégée et regroupée fonctionnellement.
? Définition de Kimball : le
DataMart est un sous-ensemble du Data Warehouse, constitue de tables au niveau
détail et à des niveaux plus agrèges, permettant de
restituer tout le spectre d'une activité métier. L'ensemble des
DataMarts de l'entreprise constitue le Data Warehouse.
II.6.3 La place du datamart dans
l'entreprise
Le DataMart se trouve en toute fin de la chaine de traitement
de l'information. En règle générale, il se situe en aval
d'un Data Warehouse plus global à partir duquel il est alimenté,
dont il constitue en quelque sorte un extrait.
Un DataMart forme la principale interaction entre les
utilisateurs et les systèmes informatiques qui gèrent la
production de l'entreprise (souvent des ERP).
Dans un DataMart, l'information est préparée
pour être exploitée brute par les personnes du métier
auquel il se rapporte. Pour ce faire, il est appelé a être utilise
via des logiciels d'interrogation de bases de données (notamment des
outils de reporting) afin de renseigner ses utilisateurs sur l'état de
l'entreprise à un moment donné (stock) ou sur son activité
(flux).
33
La préparation de la donnée pour une utilisation
directe, inhérente au DataMart, peut revêtir plusieurs formes. Il
faut noter que toutes représentent une simplification par rapport au
niveau de données inferieur ; on peut citer pour exemple :
L'agrégation de données : le DataMart ne contient pas le
détail de toutes les opérations qui ont eu lieu, mais seulement
des totaux, repartis par groupements.
a) Le retrait de données inutiles :
le DataMart ne contient que les données qui sont
strictement utiles aux utilisateurs. L'historisation des données : le
DataMart
contient seulement la période de temps qui
intéresse les utilisateurs.
II.6.4 Datawarehouse Et Datamart
La première étape d'un projet busines
intelligent est de créer un entrepôt central pour avoir une vision
globale des données de chaque service. Cet entrepôt porte le nom
de DataWarehouse.
On peut également parler de DataMart, si seulement une
catégorie de services ou métiers est concernée.
Par définition, un DataMart peut être contenu
dans un DataWarehouse, ou il peut être seulement issu de celui-ci.
II.6.5. Architecture d'un Datamart
Système transactionnel
Figure 5: Architecture d'un Data
Mart
II.6.6. Data Warehouse versus Data
Mart
Les Data Marts représentent de toute évidence
une réponse rapide aux besoins des différents départements
de l'entreprise. Leur coût moindre et leur facilité d'emploi
permettent une implémentation rapide et un retour à
l'investissement presque immédiat. Il faut toutefois être prudent
lorsque des Datamarts sont ainsi crées pour plusieurs divisions.
34
Ces dernières utilisent souvent des
représentations différentes de certains concepts de gestion. Par
exemple, les départements finances et marketing peuvent tous deux
effectué un suivi des ventes réalisées par l'entreprise,
mais défini différemment ce concept. Plus tard, si un
employé du marketing a besoin de recueillir certaines informations
à partir du Data Marts des finances, l'entreprise sera confrontée
à un problème. Par conséquent, une vision unifiée
est nécessaire même pour concevoir des Datamarts par
département.
II.7 Les Serveurs OLAP (On-Line Analytical
Processing)
Les données opérationnelles constituent la
source principale d'un système d'information décisionnel. Les
systèmes décisionnels complets reposent sur la technologie OLAP,
conçue pour répondre aux besoins d'analyse des applications de
gestion21.
Nous exposons dans la suite les divers types de stockage des
informations dans les systèmes décisionnels.
II.7.1 Les Serveur ROLAP (Relational Olap)
Figure 6 : Architecture ROLAP
Dans les systèmes relationnels OLAP, l'entrepôt
de données utilise une base de données relationnelle. Le stockage
et la gestion de données sont relationnels. Le moteur ROLAP traduit
dynamiquement le modèle logique de données multidimensionnel m en
modèle de stockage relationnel r, la plupart des outils
requièrent que la donnée soit structurée en utilisant un
schéma en étoile ou un schéma en flocon de neige.
La technologie ROLAP a deux avantages principaux :
21 Frank Ravat, Olivier Teste, Gilles Zurfluh :
Modélisation et extraction de données pour un entrepôt
objet, Université Paul Sabatier (Toulouse III), IRIT (Institut de
Recherche en informatique de Toulouse), équipe SIG, Toulouse, France
2001, page 47
35
1) Elle permet la définition de données
complexes et multidimensionnelles en utilisant un modèle relativement
simple.
2) Elle réduit le nombre de jointures à
réaliser dans l'exécution d'une requête.
Le désavantage est que le langage de requêtes tel
qu'il existe, n'est pas assez puisant ou n'est pas assez flexible pour
supporter de vraies capacités d'OLAP.
II.7.2 Le Serveur MOLAP (Multidimensional
OLAP)
Les systèmes multidimensionnels OLAP utilisent une base
de données multidimensionnelle pour stocker les données de
l'entrepôt et les applications analytiques sont construites directement
sur elle. Dans cette architecture, le système de base de données
multidimensionnel sert tant au niveau de stockage qu'au niveau de gestion des
données. Les données des sources sont conformes au modèle
multidimensionnel, et dans toutes les dimensions, les différentes
agrégations sont pour le calculées pour des raisons de
performance.
Figure 7: Architecture MOLAP
Les systèmes MOLAP doivent gérer le
problème de données clairsemées, quand seulement un nombre
réduit de cellules d'un cube contiennent une valeur de mesure
associée.
Les avantages des systèmes MOLAP sont bases sur les
désavantages des systèmes ROLAP et elles représentent la
raison de leur création. D'un cote, les requêtes MOLAP sont
très puissantes et flexibles en termes du processus OLAP, tandis que,
d'un autre cote, le modèle physique correspond plus étroitement
au modèle multidimensionnel. Néanmoins, il existe des
désavantages au modèle physique MOLAP. Le plus important, a notre
avis, c'est qu'il n'existe pas de standard du modèle physique.
36
II.7.3 Les Serveur HOLAP (Hybrid
Olap)
Un système HOLAP est un système qui supporte et
intègre un stockage des données multidimensionnel et relationnel
d'une manière équivalente pour profiter des
caractéristiques de correspondance et des techniques d'optimisation donc
c'est l'ensemble des deux serveurs MOLAP et ROLAP.
Dans la figure 7, nous montrons une architecture en utilisant
les types de serveurs ROLAP et MOLAP pour le stockage de données.
Figure 8 : Architecture HOLAP
Nous traitons une liste des caractéristiques principales
qu'un système HOLAP doit
fournir :
a) La transparence du système :
Pour la localisation et l'accès aux données, sans
connaître si elles sont stockées dans un SGBD relationnel ou
dimensionnel. Pour la transparence de la fragmentation.
b) Un modèle de données
général et un schéma multidimensionnel global
: Pour aboutir à la transparence du premier point, tant le
modèle de données général que le langage de
requête uniforme doivent être fournis. Etant donné qu'il
n'existe pas un modèle standard, cette condition est difficile à
réaliser.
c) Une allocation optimale dans le système
de stockage : Le système HOLAP Doit
bénéficier des stratégies d'allocation qui existent dans
les systèmes distribués tels que : le profil de requêtes,
le temps d'accès, l'équilibrage de chargement.
d) Une réallocation automatique :
Toutes les caractéristiques traitées ci-dessus
changent dans le temps. Ces changements peuvent provoquer la
réorganisation de la distribution des données dans le
système de stockage multidimensionnel et relationnel, pour assurer des
performances optimales.
37
Actuellement, la plupart des systèmes commerciaux
utilisent une approche hybride. Cette approche permet de manipuler des
informations de l'entrepôt de données avec un moteur ROLAP, tandis
que pour la gestion des DataMarts, ils utilisent l'approche
multidimensionnelle.
II.7.4. Les différents outils
OLAP
a) Multidimensionnel OLAP (MOLAP)
Il est plus facile et plus cher à mettre en place, il est
conçu exclusivement pour l'analyse multidimensionnelle avec un mode de
stockage optimisé par rapport aux chemins d'accès
prédéfinis.
MOLAP repose sur un moteur spécialisé, qui stocke
le data dans format tabulaire propriétaire (Cube). Pour accéder
aux données de ce cube, on ne peut pas utiliser le langage de
requête sql, il faut utiliser une API spécifique.
b) Relationnal OLAP (ROLAP)
Il est plus facile et moins cher à mettre en place, il
est moins performant lors des phases de calculs. En effet, il fait appel
à beaucoup de jointure et donc les traitements sont plus
conséquents.
Il superpose au-dessus des SGBD/R bidimensionnels un
modèle qui représente les données dans un format
multidimensionnel.
ROLAP propose souvent un composant serveur, pour optimiser
les performances lors de la navigation dans les données. Il est
déconseillé d'accéder en direct à des bases de
données de production pour faire des analyses tout simplement pour des
raisons des performances.
c) Hybride OLAP (OLAP)
Est une solution hybride entre les deux (MOLAP et ROLAP) qui
recherche un bon compromis au niveau du cout et de la performance.
HOLAP désigne les outils d'analyse multidimensionnelle
qui récupèrent les données dans de bases relationnelles ou
multidimensionnelles, de manière transparente pour l'utilisateur.
Ces trois notions se retrouvent surtout lors du
développement des solutions. Elles dépendent du software et
hardware. Lors de la modélisation, on ne s'intéresse qu'à
concevoir une modélisation orientée décisionnelle,
indépendamment des outils utilisés ultérieurement.
38
Conclusion partielle
Dans ce chapitre, nous avons traité l'entrepôt de
données et le data mart. Nous avons donnés l'architecture d'un
entrepôt de données et celle du data mart. Nous avons
expliqué les différents composants qu'il intègre, les
types de données et les différents outils pour arriver à
la visualisation de l'information ; avons décrit les différents
modèles multidimensionnels pour la construction d'un entrepôt de
données, ainsi que les différentes opérations pour la
manipulation des données multidimensionnelles et le parallélisme
entre le deux, nous avons présenté l'apport de DataMart dans les
entreprises. Le chapitre suivant abordera les notions sur le data mining et
l'arbre de décision.
22 Y. Zhuge, H. Garcia-Molina, J. Hammer, J. Widom, "View
Maintenance in a Warehousing Environment", SIGMOD Record, San Jose (USA),
1995, p.87
39
CHAPITRE III : LE DATA MINING ET ARBRE DE DECISION III.0
Introduction
Le terme datamining est souvent employé pour
désigner l'ensemble des outils permettant à l'utilisateur
d'accéder aux données de l'entreprise, de les analyser. Nous
retiendrons ici le terme de data mining aux outils ayant pour objet de
générer des informations riches à partir des
données de l'entreprise, notamment des données historiques, de
découvrir des modèles implicites dans les
données.22
Ces outils peuvent permettre par exemple à un magasin
de dégager des profils de client et des achats types et de
prévoir ainsi les ventes futures. Ils permettent d'augmenter la valeur
des données contenues dans le DataWarehouse.
Les outils d'aides à la décision, qu'ils soient
relationnels ou OLAP, laissent l'initiative à l'utilisateur, de choisir
les éléments qu'il veut observer ou analyser .Au contraire ,dans
le cas du datamining ,le système a l'initiative et découvre
lui-même les associations entre données ,sans que l'utilisateur
ait à lui dire de rechercher plutôt dans telle ou telle direction
ou à poser des hypothèses .
Il est alors possible de prédire l'avenir, par le
comportement d'un client, et de détecte, dans le passé, les
données inusuelles, exceptionnelles.
Ces outils ne sont plus destinés aux seuls experts
statisticiens mais doivent pouvoir être employés par des
utilisateurs connaissant leur métier et voulant l'analyser,
l'explorer.
Seul un utilisateur connaissant le métier peut
déterminer si les modèles, les règles, les tendances
trouvées par l'outil sont pertinentes, intéressantes et utiles
à l'entreprise. Nous pourrions définir le datamining comme une
démarche ayant pour objet de découvrir des relations et des
faits, à la fois nouveaux et significatifs, sur de grands ensembles de
données.
Le terme datamining signifie littéralement forage de
données dont le but est de pouvoir extraire un élément :
la connaissance.
Ces concepts s'appuient sur le constat qu'il existe au sein de
chaque entreprise des informations cachées dans le gisement de
données. Nous appellerons datamining l'ensemble des techniques qui
permettent de transformer les données en connaissances. L'exploration se
fait sur l'initiative du système, par un utilisateur métier, et
son but est de remplir l'une des tâches suivantes : Classification,
estimation, prédiction, regroupement par similitudes, segmentation
(cautérisation), description et, dans une moindre mesure,
l'optimisation.
40
III.1 Objectifs Du Data Mining23
Les objectifs du Data Mining peuvent être regroupés
dans trois axes importants:
1. Prédiction (What-if) :
consiste à prédire les conséquences d'un
événement (ou d'une décision), se basant sur le
passé.
2. Découverte de règles cachées
: découvrir des règles associatives, entre
différents événements (Exemple : corrélation entre
les ventes de deux produits).
3. Confirmation d'hypothèses :
confirmer des hypothèses proposées par les
analystes et décideurs, et les doter d'un degré de confiance.
En considérant le serveur de base données ou le
serveur d'entrepôt de données, le Data mining est
considéré comme un client riche de ces deux serveurs. Notons que
le client serveur est un mode de dialogue entre deux processus, l'un
appelé client qui sollicite des services auprès de l'autre
appelé serveur, par envoie des requêtes (send request en anglais).
Après avoir lancé une requête par rapport au fait à
analyser, le client data ming applique des méthodes ou procédures
sur les données obtenues, afin d'obtenir les informations
nécessaires pour la prise de décision. Ces procédures ou
méthodes, sont classées en deux catégories :
Apprentissage non supervisé et l'apprentissage
supervisé en dehors de ces deux s'ajoute l'autre qui est
l'apprentissage automatique.
a) Apprentissage non
supervisé
Elle consiste à mettre en évidence les
informations cachées par le grand volume de données, en vue de
détecter dans ces données des tendances cachées. Les
techniques utilisées sont : La segmentation (Clustering en anglais),
L'analyse à composante principale, l'analyse factorielle de
correspondance.
b) Apprentissage supervisé
L'apprentissage supervisé consiste à extrapoler
des nouvelles connaissances à partir de l'échantillon
représentatif issu de l'apprentissage non supervisé. Les
techniques utilisées sont : Les réseaux de neurones, le SVM,
l'arbre de décision, les réseaux de bayes, etc.
c) Apprentissage automatique
L'apprentissage automatique (machine learning en
anglais), un des champs d'étude de l'intelligence artificielle, est la
discipline scientifique concernée par le développement, l'analyse
et l'implémentation de méthodes automatisables qui permettent
à une machine (au sens large) d'évoluer grâce à un
processus d'apprentissage, et ainsi de remplir des tâches
23 ADIBA .M, Entrepôts de données et fouille de
données, Paris 2002, p.19
41
qui sont difficiles ou impossible d'être
réalisées par des moyens algorithmiques plus classiques.
Des systèmes complexes peuvent être
analysés, y compris pour des données associées à
des valeurs symboliques (ex: sur un attribut numérique, non pas
simplement une valeur numérique, juste un nombre, mais une valeur
probabilisée, c'est-à-dire un nombre assorti d'une
probabilité ou associé à un intervalle de confiance) ou un
ensemble de modalités possibles sur un attribut numérique ou
catégoriel.
L'analyse peut même concerner des données
présentées sous forme de graphes ou d'arbres, ou encore de
courbes (par exemple, la courbe d'évolution temporelle d'une mesure ; on
parle alors de données continues, par
opposition aux données discrètes
associées à des attributs-valeurs classiques).
Le premier stade de l'analyse est celui de la
classification, qui vise à « étiqueter »
chaque donnée en l'associant à une classe.
III.1.1. Processus Du Datamining
Le datamining est un processus méthodique : une suite
ordonnée d'opérations aboutissant à un résultat.
Le data ming est décrit comme un processus
itératif complet constitué de quartes divisées en six
phases qui sont représenté dans le tableau suivant :
PROCESSUS DU DATAMINING
|
Acteur
|
Etapes
|
Phases
|
Maitre d'oeuvre
|
Objectifs
|
1. Compréhension du métier :
|
2. Compréhension des données
|
|
|
Traitements
|
4 .Modélisation
|
5.Evaluation de la modélisation
|
Maître d'ouvrage
|
Déploiement
|
6. Déploiement des résultats de l'étude
|
Tableau 3: le processus du
datamining.
a) Compréhension du Métier
:
Cette phase consisté à :
? Enoncer clairement les objectifs globaux du
projet et les contraintes de l'entreprise.
42
· Traduire ses objectifs et ses contraintes en un
problème de data mining
· Préparer une stratégie initiale pour
atteindre ces objectifs.
b) Compréhension des données Cette phase
consiste à :
Recueillir les données, utiliser l'analyse
exploratoire pour se familiariser avec les données, commencé
à les comprendre et imaginer ce qu'on pourrait en tirer comme
connaissance. Evaluer la qualité des données, Eventuellement,
sélectionner des sous-ensembles intéressants.
c) Préparation des données
Cette phase aide à préparer, à partir des
données brutes, l'ensemble final des données qui va être
utilisé pour toutes les phases suivantes :
· Sélectionner les cas et les variables à
analyser, réaliser si nécessaire les transformations de certaines
données, réaliser si nécessaire la suppression de
certaines données.
d) Modélisation
La phase de la modélisation consiste à :
· Sélectionner les techniques de
modélisation appropriées (pouvant être utilisées
pour le même problème) calibrer les paramètres des
techniques de modélisation choisies pour optimiser les résultats
;
· Eventuellement revoir la préparation des
données pour l'adapter aux techniques utilisées.
e) Evaluation de la modélisation
· Pour chaque technique de modélisation
utilisée, évaluer la qualité (la pertinence) des
résultats obtenus ;
· Déterminer si les résultats obtenus
atteignent les objectifs globaux identifiés pendant la phase de
compréhension du métier ;
· Décider si on passe à la phase suivante
(le déploiement) ou si on souhaite reprendre l'étude en
complétant le jeu de données.
f) Déploiement des résultats obtenus
Cette phase est externe à l'analyse du datamining
.Elle concerne le maître d'ouvrage. Prendre les décisions en
conséquence des résultats de l'étude de data mining.
· Préparer la collecte des informations futures
pour permettre de vérifier la pertinence des décisions
effectivement mis en oeuvre.
43
III.1.2. Les Tâches Du Datamining
Contrairement aux idées reçues, le Data Mining
n'est pas le remède miracle capable de résoudre toutes les
difficultés ou besoins de l'entreprise cependant, une multitude de
problèmes d'ordre intellectuel, médical, économique
peuvent être regroupés, dans leurs formalisations, dans l'une des
tâches suivantes :
1. Classification ;
2. Estimation ;
3. Prédiction ;
4. Discrimination ;
5. Segmentation.
III.I.2.1. Les Tâches Et Technique Du
Datamining
TACHES
|
TECHNIQUE
|
Classification
|
L'arbre de décision
|
Le raisonnement par cas
|
L'analyse de lien
|
Estimation
|
Le réseau de neurones
|
Prédiction
|
L'analyse du panier de la ménagère
|
Le raisonnement base sur le mémoire
|
L'arbre de décision
|
Les réseaux de neurones
|
Extraction de connaissance
|
L'arbre de décision
|
Tableau 4: les taches et
technique du datamining.
En outre, hormis ces quelques techniques et tâches du
datamining, nous signalons qu'il existe d'autres que nous n'avons pas
énumérez dans notre travail.
44
III.2. Arbre de décision
III .2.1. Introduction à l'arbre de
décision
Un arbre de décision est une structure qui permet de
déduire un résultat à partir de décisions
successives. Pour parcourir un arbre de décision et trouver une
solution, il faut partir de la racine. Chaque noeud est une décision
atomique.24
Proche en proche, on descend dans l'arbre jusqu'à
tomber sur une feuille. La feuille représente la réponse
qu'apporte l'arbre au cas où l'on vient de tester.
a) Début à la racine de l'arbre
Descendre dans l'arbre en passant par les noeuds de test, la
feuille atteinte à la fin permet de classer l'instance testée.
Très souvent on considère qu'un noeud pose une question sur une
variable, la valeur de cette variable permet de savoir sur quels fils
descendre. Pour les variables énumérées, il est parfois
possible d'avoir un fils par valeurs, on peut aussi décider que
plusieurs variables différentes mènent au même sous
arbre.
Pour les variables continues, il n'est pas imaginable de
créer un noeud qui aurait potentiellement un nombre de fils infini, on
doit discrétiser le domaine continu (arrondis, approximation), donc
décider de segmenter le domaine en sous-ensembles. Plus l'arbre est
simple, et plus il semble techniquement rapide à utiliser.
En fait, il est plus intéressant d'obtenir un arbre qui
est adapté aux probabilités des variables à tester. La
plupart du temps un arbre équilibré sera un bon
résultat.
Si un sous arbre ne peut mener qu'à une solution
unique, alors tout ce sous arbre peut être réduit à sa
simple conclusion, cela simplifie le traitement et ne change rien au
résultat final.
III.2.2. Définition
Un arbre de décision est un outil d'aide à la
décision et à l'exploration de données. Il permet de
modéliser simplement, graphiquement et rapidement un
phénomène mesuré plus ou moins complexe. Sa
lisibilité, sa rapidité d'exécution et le peu
d'hypothèses nécessaires a priori expliquent sa popularité
actuelle.25
III.2.3. Caractéristiques et
Avantages
La caractéristique principale est la lisibilité
du modèle de prédiction que l'arbre de décision fourni, et
de faire comprendre ses résultats afin d'emporter l'adhésion des
décideurs.
24 VINCENT GUIJARRO, Les Arbres de Décisions
L'algorithme ID3, lile, 2006, p.16
25 RAKOTOMALALA. : Graphes d'induction apprentissage et data
mining, hermès, 2000.THESE, p.43
26 KANGIAMA LWANGI Richard : Extraction des connaissances
a partir d'un entrepôt des données à l'aide de l'arbre de
décision application aux données médicales, UNIKIN
2010-2011.
45
Cet arbre de décision a également la
capacité de sélectionner automatiquement les variables
discriminantes dans un fichier de données contenant un très grand
nombre de variables potentiellement intéressantes. En ce sens, constitue
aussi une technique exploratoire privilégiée pour
appréhender de gros fichiers de données.
III.2.4. Algorithme ID3
L'algorithme ID3 a été développé
à l'origine par ROSS QUINLAN. C'est un algorithme de classification
supervisé. C'est-à-dire il se base sur des exemples
déjà classés dans un ensemble de classes pour
déterminer un modèle de classification. Le modèle que
produit ID3 est un arbre de décision. Cet arbre servira à classer
de nouveaux échantillons. Il permet aussi de générer des
arbres de décisions à partir de données. Imaginons que
nous ayons à notre disposition un ensemble d'enregistrements ayant la
même structure, à savoir un certain nombre de paires attribut ou
valeur. L'un de ses attributs représente la catégorie de
l'enregistrement. Le problème consiste à construire un arbre de
décision qui sur la base de réponses à des questions
posées sur des attributs non cible peut prédire correctement la
valeur de l'attribut cible. Souvent l'attribut cible pend seulement les valeurs
vrai, faux ou échec, succès.
III.2.5. Principes
Les principales idées sur lesquels repose ID3 sont les
suivantes :
Dans l'arbre de décision chaque noeud correspond
à un attribut non cible et chaque arc a une valeur possible de cet
attribut. Une feuille de l'arbre donne la valeur escomptée de l'attribut
cible pour l'enregistrement testé décrit par le chemin de la
racine de l'arbre de décision jusqu'à la feuille.
(Définition d'un arbre de décision). Dans l'arbre de
décision, à chaque noeud doit être associé
l'attribut non cible qui apporte le plus d'information par rapport aux autres
attributs non encore utilisés dans le chemin depuis la racine.
(Critère d'un bon arbre de décision). L'entropie est
utilisée pour mesurer la quantité d'information apportée
par un noeud. (Cette notion a été introduite par Claude Shannon
lors de ses recherches concernant la théorie de l'information qui sert
de base à énormément de méthodes du
datamining).26
Algorithme
Entrées : ensemble d'attributs A; échantillon E;
classe c
Début
Initialiser à l'arbre vide;
Si tous les exemples de E ont la même classe c
46
Alors étiqueter la racine par c;
Sinon si l'ensemble des attributs A est vide
Alors étiqueter la racine par la classe majoritaire
dans E;
Si non soit a le meilleur attribut choisi dans A;
Étiqueter la racine par a;
Pour toute valeur v de a
Construire une branche étiquetée par v;
Soit Eav l'ensemble des exemples tels que e(a) = v;
ajouter l'arbre construit par ID3 (A-{a}, Eav, c);
Fin pour Fin sinon
Fin sinon
Retourner racine;
Fin
III.2.6. Exemple Pratique d'un Algorithme
ID3
Pour introduire et exécuter "à la main"
l'algorithme ID3 nous allons tout d'abord considérer l'exemple
ci-dessous: Une entreprise possède les informations suivantes sur ses
clients et souhaite pouvoir prédire à l'avenir si un client
donné effectue des consultations de compte sur Internet.
Client
|
Moyenne des montants
|
Age
|
Lieu de Résidence
|
Etudes supérieures
|
Consultation par internet
|
1
|
Moyen
|
Moyen
|
Village
|
Oui
|
Oui
|
2
|
Elevé
|
Moyen
|
Bourg
|
Non
|
Non
|
3
|
Faible
|
Age
|
Bourg
|
Non
|
Non
|
4
|
Faible
|
Moyen
|
Bourg
|
Oui
|
Oui
|
5
|
Moyen
|
Jeune
|
Ville
|
Oui
|
Oui
|
6
|
Elevé
|
Agé
|
Ville
|
Oui
|
Non
|
7
|
Moyen
|
Agé
|
Ville
|
Oui
|
Non
|
8
|
Faible
|
Moyen
|
Village
|
Non
|
Non
|
Tableau 5: exemples pratiques
Log (P (C[ville)))
47
Ici, on voit bien que la procédure de classification
à trouver, qui à partir de la description d'un client, nous
indique si le client effectue la consultation de ses comptes par Internet,
c'est-à-dire la classe associée au client.
o Le premier client est décrit par (M : moyen, Age :
moyen, Résidence : village, Etudes : oui) et a pour classe Oui.
o Le deuxième client est décrit par (M :
élevé, Age : moyen, Résidence : bourg, Etudes : non) et a
pour classe Non.
Pour cela, nous allons construire un arbre de décision qui
classifie les clients. Les arbres sont construits de façon descendante.
Lorsqu'un test est choisi, on divise l'ensemble d'apprentissage pour chacune
des branches et on
Réapplique récursivement l'algorithme.
H(C[Lieu) = -P (bourg). (P (C[bourg) log (P (C[bourg)) + P (C
[bourg)
a) Choix du meilleur attribut :
Pour cet algorithme deux mesures existent pour choisir le meilleur
attribut : la mesure d'entropie et la mesure de fréquence:
b) L'entropie : Le gain (avec pour
fonction il'entropie) est également appelé l'entropie de
Shannon et peut se réécrire de la manière suivante :
Pour déterminer le premier attribut test (racine de
l'arbre), on recherche l'attribut d'entropie la plus faible. On doit donc
calculer H(C[Solde), H(C[Age), H(C[Lieu), H(C[Etudes), où la classe C
correspond aux personnes qui consultent leurs comptes sur Internet.
H(C[Solde) = -P (faible).(P (C[faible) log(P (C[faible)) + P (C
[faible) log(P (C[faible)))-P (moyen).(P (Cmoyen) log(P (Cmoyen)) + P (Cmoyen)
log(P (Cmoyen)))-P (eleve).(P (C[eleve) log(P (C[eleve)) + P (C[eleve)
log(P(C[eleve)))H(C[Solde)
H(CSolde) = -3/8(1/3.log(1/3) + 2/3.log(2/3)-3/8(2/3.log(2/3) +
1/3.log(1/3) -2/8(0.log (0) + 1.log(1)
H (C[Solde) = 0.20725
H(C[Age) = -P (jeune).(P (C[jeune) log(P (C[jeune)) + P (C
[jeune) log(P (C[jeune)))-P (moyen).(P (C[moyen) log(P (C[moyen)) + P (C
[moyen) log(P (C[moyen)))-P (age).(P (C[age) log(P (C[age)) + P (C[age) log(P
(C[age)))
H(C[Age) = 0.15051
Log (P (C[bourg)))-P (village).(P (C[village) log(P (C[village))
+ P (C [village) log(P (C[village)))-P (ville).(P (C[ville) log(P (C[ville)) +
P (C[ville)
48
H(C[Lieu) = 0.2825
H(C[Etudes) = -P (oui).(P (C[oui) log(P (C[oui)) + P (C [oui)
log(P (C[oui)))
-P (non).(P (C[non) log(P (C[non)) + P (C[non) log(P (C[non)))
H(C[Etudes) = 0.18275 Le premier attribut est donc l'âge (attribut dont
l'entropie est minimale). On obtient l'arbre suivant :
Age
Jeune moyen âgé
Consultation ? Consultation
Figure 9: Arbre de décision construit à partir de
l'attribut âge
Pour la branche correspondant à un âge moyen, on ne
peut pas conclure, on doit donc recalculer l'entropie sur la partition
correspondante.
H(C|Solde) = -P (faible).(P (C|faible) log(P (C|faible)) + P (C
|faible) log(P
(C|faible)))-P (moyen).(P (C|moyen) log(P (C|moyen)) + P
(C|moyen)
Log (P (C|moyen)))-P (eleve). (P (C|eleve) log(P (C|eleve)) + P
(C|eleve) log(P
(C|eleve)))
H(C|Solde) = -2/4(1/2.log(1/2) + 1/2.log(1/2)-1/4(1.log(1) +
0.log(0)
-1/4(0.log (0) + 1.log (1)
H (C|Solde) = 0.15051
H(C|Lieu) = -P (bourg).(P (C|bourg) log(P (C|bourg)) + P (C
|bourg) log(P
(C|bourg)))-P (village).(P (C|village) log(P (C|village)) + P (C
|village) log(P
(C|village)))-P (ville).(P (C|ville) log(P (C|ville)) + P
(C|ville) log(P (C|ville)))
H (C|Lieu) = 0.30103
H (C|Etudes) = -P (oui).(P (C|oui) log(P (C|oui)) + P (C |oui)
log(P (C|oui)))
-P (non). (P (C|non) log(P (C|non)) + P (C|non) log(P (C|non)))
H(C|Etudes) = 0
L'attribut qui a l'entropie la plus faible est « Etudes
».
49
L'arbre devient alors :
Figure 10 : Arbre de décision
finale
L'ensemble des exemples est classé et on constate que sur
cet ensemble d'apprentissage, seuls deux attributs sur les quatre sont
discriminants.
III.3 Concepts Théoriques Sur Le
Graphe
III.3.1. Définition : Un graphe
G est un couple G=(X, U), X est un ensemble non vide et au plus
dénombrable.
Nota : X est un ensemble fini, les éléments de x X
sont appelés les sommets ou noeuds. U = une famille
d'éléments du produit cartésiens X€X .
Les éléments de U=(x,y) , x,y X, sont
appelés : soit des arcs lorsqu'on tient compte de l'orientation, soit
les arêtes lorsqu'on ne tient pas compte de
l'orientation.27
III.3.2. Graphe connexe a) Définition
:
Un graphe est connexe si l'on peut atteindre n'importe quel
sommet à partir d'un sommet quelconque en parcourant les
différentes arêtes.
Exemple : soit G=(X, U) qui est un
graphe connexe
Figure 11 : graphe connexe
27 MANYA NDJADI, Recherche opérationnelle, G3
informatique option Gestion, cours inédit, U.K.A 2013-2014.
Figure 13 : arborescence
50
U6 U5
U7
U8
EX :
U4
U3
U1 U2
III.3.2. Arbres et arborescence
1. Arbres
a) Définition : Un arbre est un
graphe connexe sans cycle. C'est-à-dire dont on peut atteindre n'importe
quel sommet à partir d'un sommet quel- conque en parcourant
différents arêtes et ses arêtes ne coïncide pas.
EX :
Figure 12 : Arbre
2) Arborescence
a) Définition : une structure
qui permet de déduire un résultat à partir de
décision successive.
Soit G=(X, U) on dit que le sommet rX est une racine de G si V
X, (avec xr) un chemin de r à x .c'est -à -dire un arbre ayant
une racine.
51
Conclusion partielle
Dans ce chapitre nous avons présenté le
datamining avec ses différentes méthodes, tâches,
techniques et nous avons fait un briefing sur la notion relative à la
théorie de graphe. Nous avons aussi construit un arbre de
décision ou nous nous somme basé sur l'attribut âge et
l'étude pour la démonstration. Le chapitre suivant aborder a les
notions sur présentation du cadre d'étude et spécification
de besoins.
52
CHAPITRE IV : PRESENTATION DU CADRE D'ETUDE ET
SPECIFICATION
DE BESOINS
VI.1. La Présentation Cadre d'étude
VI.1.1. Situation géographique
La Régie des Voies Aériennes de Kananga se
trouve dans la ville de Kananga et dans la commune du même nom, plus
précisément à l'Est de la ville. Elle est bornée au
nord par la cité Mulombodi (Fondateur de l'Eglise Christ-Roi), au sud
par la localité Kabanza, à l'Est par la rivière Lungandu
et à l'Ouest par le marché Laurent Désiré KABILA
communément appelé Tshiambandiba
VI.1.2. Historique
En 1928 une circonscription urbaine est érigée
au nord de la Gare. La même année la SABENA «
Société Anonyme Belge pour l'Exploitation de la Navigation
Aérienne » établit une piste d'atterrissage à
l'emplacement actuel de l'institut Kananga I (ex Athénée Royal de
Luluabourg).
Mais le véritable aérodrome comme le premier
pour la ville de Kananga a vu jour en 1940 à l'actuelle Radio
Télé Nationale Congolaise (ancienne la Voix du Congo) sous
gérante de l'aéronautique civile. En 1941, le nouvel
aérodrome fut érigé à l'Oasis par l'OACI sur la
rive droite de la route Kananga-Mbuji-Mayi. La piste de cet endroit demeura
inopérationnelle pendant un temps, l'érosion l'ayant
ravagé.
En 1972 l'entreprise qui s'appelait « aéronautique
civile » a changé de dénomination pour adopter l'appellation
« Régie des Voies Aériennes », R.V.A. en sigle depuis
le 21 février 1972.
Au niveau du siège national de la Régie des
Voies Aériennes, un programme fut mis en place, celui d'assurer la
sécurité des aéronefs qui exploitent ses aéroports
en vue de développer le transport aérien. L'exécution de
programme à Kananga fut confiée aux 3 sociétés de
construction qui sont affectées à ces travaux à partir du
mois de mai 1975 jusqu'au Janvier 1976.
Il s'agissait de la Générale de Kinshasa Company
(GKN) sous le commandement de SIR FREDERIC SNOU de l'International Limited
London (pour les travaux de construction) et la société Plessy
Services LTD wey Bridge (pour les travaux de balisage de la piste).
Ces travaux qui ont duré pratiquement 9 mois, permirent
à l'Aéroport National de Kananga d'être compté parmi
les aéroports capables de pouvoir supporter les poids des gros porteurs
tels que DC-8, Boeing 707, 727, 737 et Iloshin, car sa piste qui fut de 200 m
de longueur sur 30 m de largeur, était passé à 2200m de
longueur et 45 m de largeur, cette piste pouvait désormais recevoir les
aéronefs la nuit ou quand il fait mauvais temps sans inquiétude.
(Les explications du chef du personnel lors de l'entretien)
53
Lors de l'assemblée générale
extraordinaire du septembre 2014, il a été décidé
de la transformation de la forme de la Société par Action
à Responsabilité Limitée (SARL) en nouvelle forme de
Société Anonyme Unipersonnelle, selon que le droit OHADA n'admet
pas la SARL de l'ancienne forme du droit congolais.
C'est une Société Anonyme qui est
l'équivalente de l'ex SARL.
VI.1.3. Statuts juridiques
La Régie des Voies Aériennes a été
initialement créée par Ordonnance-Loi n°72/013 du 21
février 1972 comme entreprise publique à caractère
technique et commercial et dont les statuts ont été fixés
par l'Ordonnance n°78-200 du 05 mai 1978 en application de la loi
n°78-02 du 6 janvier 1978 portant dispositions générales
applicables aux entreprises publiques.
Elle a été transformée en
Société Commerciale de forme « Société par
Actions à Responsabilité Limitée » dont l'Etat est
l'unique actionnaire aux termes des articles 4 et 5 de la Loi n°08/007 du
7 juillet 2008 portant dispositions générales relatives à
la transformation des entreprises publiques du Décret n°09/12 du 24
avril 2009 portant liste des entreprises publiques transformées en
sociétés commerciales, Etablissements publics et services publics
pris en exécution de la Loi n°08/007 du juillet 2008 susdite.
Elle est régie par les statuts dressés,
notariés et publiés au journal officiel de la République
Démocratique du Congo numéro spécial du 29 Décembre
2010, 5ème Année.
Au cours de l'assemblée générale
extraordinaire de la Régie des Voies Aériennes tenue à
Kinshasa le 06 septembre 2014, le président de ladite assemblée a
expliqué aux participants la mise en harmonie des statuts de
l'entreprise publique avec le droit OHADA rend obligatoire la transformation de
la forme actuelle de Société par Actions à
Responsabilité Limitée (SARL) pour remplacer par une des formes
sociales prévues par l'acte uniforme relatif au droit des
sociétés commerciales et du groupement d'intérêt
économique. (PV de l'assemblée générale
extraordinaire de l'actionnaire unique tenue à Kinshasa le 06/09/2014
:4)
VI.1.4. Objet social de la
R.V.A.
La société a pour objet :
? De concevoir, de construire, d'aménager, d'exploiter et
de développer les aéroports ainsi que leurs dépendances en
République Démocratique du Congo ;
? De fournir en République Démocratique du Congo
et à l'étranger, dans ses domaines de compétence tout
service technique, toute prestation de nature industrielle, commerciale ou
intellectuelle relatif aux opérations et à l'exploitation des
aéroports notamment les services d'assistance au sol, de lutte contre
l'incendie et tout autre service spécifié par la
réglementation internationale ;
? D'assurer la conception, la mise en oeuvre, la gestion et le
contrôle de l'espace aérien à travers des installations et
services ayant pour l'objet :
? Les télécommunications aéronautiques ;
? Les aides à la navigation et à l'atterrissage
;
? La surveillance de l'espace et trafic aériens ;
54
? Le contrôle de la circulation aérienne,
l'information en vol et l'alerte ;
? La gestion des flux de trafic aérien, la production
et la fourniture des informations de météorologie
aéronautique, aussi bien pour la circulation en route que pour
l'approche et l'atterrissage sur les aérodromes et aéroports
relevant de sa gestion ; et
? L'information aéronautique.
+ De vendre tous les services et prestations, d'en fixer le
prix, d'en percevoir les montants et, le cas échéant, d'en
modifier les tarifs au titre de redevances aéronautiques et
extra-aéronautiques ; et plus généralement de recouvrer
tous autres revenus par son activité sociale ;
+ De créer, de déposer, d'acquérir, de
vendre, d'échanger, de céder ou d'exploiter, directement ou
indirectement, tous actifs mobiliers et immobiliers, ainsi que tous brevets,
licences, procédés et marques de fabrique, et en concéder
toutes les licences d'exploitation.
VI.1.5. La durée de la R.V.A
La durée de la société est fixée
à quatre-vingt-dix-neuf ans à compter de la date de son
immatriculation au registre de commerce et du crédit mobilier, sauf
dissolution anticipée ou prorogation décidée par
l'Assemblée Générale de l'Etat Actionnaire.
En cas de prorogation de la durée de la
société, un an au moins avant la date de son expiration,
l'Actionnaire Unique devra être consulté par le conseil
d'administration à l'effet de décider si la société
doit être prorogée. A défaut de convocation par l'organe
précité, l'Actionnaire Unique peut demander en justice la
désignation d'un mandataire de justice chargé de provoquer ladite
consultation.
La modification de la durée de la
société, la prorogation de la société comme sa
dissolution anticipée sont décidées par l'Assemblée
Générale de l'Etat Actionnaire Unique.
VI.1.6. Les rôles de la R.V.A
Généralement, aucun pays ne peut manquer un
aéroport ou un aérodrome. Mais cela n'exclut pas à
signaler que malgré l'existence de ceux-ci, ils jouent les
différents rôles selon les diverses provinces.
Il conviendrait de reconnaitre que la Régie des Voies
Aériennes ayant le monopole de tous les aéroports et
aérodromes officiels du pays, son rôle demeure
prépondérant dans la mesure où son fief apporte à
la ville de Kananga beaucoup d'avantages sur plusieurs plans. Elle joue
plusieurs rôles sur la ville de Kananga qui sont :
V' Rôle technique ;
V' Rôle économique ;
V' Rôle social ;
V' Rôle politique ou stratégique ;
V' Rôle humanitaire.
55
VI.1.7. Projet d'avenir de la R.V.A
Dans l'avenir, il y a des prévisions pour le rallongement
et l'agrandissement de l'actuelle piste d'atterrissage pour avoir une nouvelle
piste d'atterrissage de l'aéroport national de Kananga qui sera du type
international.
Cependant, l'aéroport du type international aidera la
communauté Centre-Kasaïenne à leur ravitaillement en
marchandises et autres choses qui viendront directement d'outre-mer ou d'autres
continents.
56
VI.1.8. Organisation Et Fonctionnement VI.1.8.1.
Organigramme de la R.V.A
COMMANDEMENT D'AEROPORT
SECRETARIAT
STAFF COODINATION
SERVICE MOYENS GENERAUX
SERVICE TECHNIQUE
SERVICE ADMINISTRATIF, FINANCIER ET
COMMERCIAL
SERVICE CIRCULATION AERIENNE
SERVICE SURETE ET FACILITATION
BUREAU FINANCIER
BUREAU
NAVIGATION AERIENNE
BUREAU
CIRCULATION
BUREAU ANTI-INCENDIE
BUREAU STATISTIQUE
BUREAU
TELECOMMUNICATI
BUREAU
COMMERCIAL
BUREAU
ADMINISTRATIF
BUREAU MEDICAL
BUREAU CHARROI AUTOMOBILE
BUREAU
ENTRETIE N
BUREAU
ELECTRICITE ET BALISAGE
BUREAU TELECOMS NAVAIDS
BUREAU POLICE
BUREAU
FACILITATION
Source : R.V.A/Kananga, les documents internes
du secrétariat
57
VI.1.8.2. Fonctionnement de la RVA
1. Commandement d'aéroport
Il est le premier service ayant une préséance
sur tous les autres services au sein de l'aéroport. Tous les autres
services sont obligés à lui faire leurs rapports en vue d'une
harmonisation.
Par commandement d'aéroport, il faut entendre la
direction d'aéroport. Ce changement d'appellation est dû au fait
qu'au début, un aéroport était géré par un
Directeur d'aéroport qui devait être administratif ou
technicien
Depuis un certain temps vers les années nonante, le
terme commandement d'aéroport est resté le seul dont on se sert.
Car, un commandant d'aéroport doit obligatoirement être un
ingénieur en aviation civile pour une mise en application des
règles de la navigation aérienne adoptées par
l'aéronautique civile et l'organisation de l'aviation civile
internationale
2. Staff coordination
C'est un service qui, en absence du commandant
d'aéroport, a le devoir de prise de décision sur n'importe quel
problème survenu à l'aéroport. Il contient 3 coordinateurs
dont un responsable appelé Chef Staff-coordination qui est
secondé par ses deux collègues.
Ce service joue le rôle de maximisation de recettes au
moyen de contrôle sur les accès, l'embarquement, le domanial, le
terrain nu, etc. bref sur les taxes aéronautiques et
extra-aéronautiques pour faire rapport à la hiérarchie. De
ce fait, les coordonnateurs sont toujours au tarmac en vue de veiller sur les
embarquements. Ils restent au bureau dans le souci de surveiller les
entrées pour prendre à l'objectif de leur service.
3. Secrétariat
C'est une cellule qui joue le rôle de communication
entre le service du personnel et le commandement d'aéroport. Il s'occupe
aussi des tâches suivantes : les appels téléphoniques
entrants et sortants, la saisie de courriers, l'organisation de
déplacement et de réunions, l'accueil de visiteurs. Son
rôle d'interface ne se limite pas non seulement au niveau interne de
l'entreprise mais va plus loin au niveau extérieur.
4. Le service administratif, financier et
commercial
Ce service supervise 4 bureaux qui sont : administratif,
financier commercial et médical. Le chef de ce service est appelé
chef de service Administratif, Finances et commercial en abrégé
SAFCO. Nous comprendrons son fonctionnement à travers les bureaux sous
sa dépendance.
58
+ Bureau administratif
Ce bureau est chargé d'harmonisation de différents
rouages et s'occupe essentiellement d'établir le rôle des
congés annuels, circonstanciels, les bons de consultation, le
contrôle des présences et des absences, tenue des dossiers
administratifs du personnel, prépare les sanctions, les dossiers du
pensions, enregistre le décès et naissance. Il traite
généralement tous les problèmes liés aux ressources
humaines.
+ Bureau de financier
C'est un bureau qui s'occupe de la gestion des recettes et des
dépenses. Tout ce qui est produit comme recettes est gardé dans
ce bureau mais à dépenser sur ordre du commandant
d'aéroport suivant le programme établi par lui et le
chargé de finances.
+ Bureau commercial
C'est le bureau générateur des recettes en
dollars et francs congolais. Il tire ses redevances sur l'embarquement, route,
stationnement, etc.
+ Bureau médical
C'est un bureau qui assure le suivi médical de
salariés et conseille l'entreprise. Il est encore là pour la
prévention des risques professionnels. Il veille sur la santé de
salariés et conseille l'employeur sur l'ensemble de
problématiques liées aux conditions de travail.
5. Service de circulation aérienne
Comme l'indique la structure organique, la circulation
aérienne est le service purement technique qui justifie l'importance de
la RVA du fait qu'elle se préoccupe surtout de la sécurité
aérienne, la navigation, l'anti-incendie, sécurité
aéronautique et transmission aéronautique.
+ Bureau circulation aérienne
Ce bureau remplit le rôle de garantir la
sécurité des aéronefs dans l'espace aérien, son
fonctionnement est assuré par les contrôleurs de trafic
aérien dont la plupart sont ressortissants de l'ISTA (Institut
Supérieur de Techniques appliquées). Le lieu de travail des ATC
(mot anglais qui signifie Contrôleurs Transports aériens) est la
tour de contrôle qui est en contact avec tous aéronefs se trouvant
en l'air en vue de leur assurer la sécurité.
+ Bureau navigation
Ce bureau constitue une charnière entre la RVA et les
exploitations. Toutes les informations sur les mouvements des aéronefs
sont transmises par lui. Il reçoit les plans de vol des exploitants
qu'il transmet à la tour de contrôle, tient à jour le
relevé des
Il est chargé de gérer tous les matériels
roulants de l'entreprise ; ce qui expliquerait l'appartenance des chauffeurs
mécaniciens des engins à ce bureau.
59
mouvements aériens, contrôle les documents de
bord (licence, certificat de navigabilité etc.), manifeste des
passagers, les frets, calcule les redevances atterrissages, route,
stationnement à mettre à la disposition de bureau commercial pour
facturation. Les agents de ce bureau sont appelés commis piste. Ils ont
le pouvoir de contrôler les documents de bord.
? Bureau anti-incendie
Ce bureau est chargé de combattre tout incendie
à l'aéroport, il est doté de 2 véhicules
anti-incendie laissés par la MONUSCO; ceux-ci peuvent répondre
à toute ses préoccupations du fait qu'ils sauvegardent les biens
et les vies humaines au sol.
? Bureau télécommunication
aéronautique
Bureau vide, il a le rôle de transmettre les messages
officiels de service, les heures de décollages ou d'atterrissages des
avions d'une entité à une autre à l'intérieur du
pays. De ce fait, il fait aussi partie de la sécurité à la
navigation aérienne dans la mesure où tout aéronef
décollant ou atterrissant à telle ou telle autre entité
vers l'autre est attendu à destination avec précision de l'heure
prévue de son atterrissage. De même que les personnages officiels
dans l'aéronef sont signalés pour une prise de disposition.
? Bureau statistiques
C'est celui qui s'occupe de mouvements des aéronefs y
compris la ventilation des passagers, frets ainsi que les bagages y
afférents ; pour parvenir à dépister le chiffre
réel de passagers, les types d'avions au départ et à
l'arrivée et les frets au bout d'un mois, d'une année, etc.
suivant la demande.
6. Service moyens
généraux
Composé de deux bureaux : celui de l'entretien et celui
du charroi automobile. Ce service s'occupe de l'entretien des infrastructures
de la RVA ; il s'agit précisément de l'entretien de la piste de
l'aéroport, des charrois automobiles, des bâtiments. Il se charge
de tous les approvisionnements à la RVA.
? Bureau entretien
Ce bureau s'occupe de l'entretien de l'infrastructure piste et
bâtiments de l'entreprise. De ce fait, il commande les peintres, les
maçons, les architectes, les nettoyeurs des installations, les
ingénieurs en construction.
? Bureau charroi automobile
60
7. Service technique
Composé de 2 bureaux : celui de télécoms
navaids qui est vacant pour le moment et celui d'électricité et
balisage. Ce service se charge de l'aménagement et réparation des
appareils de télécommunication (Orthophonie, radiophonie etc.)
tout en veillant à la permanence de l'énergie au niveau de
l'aéroport.
? Bureau électricité et
balisage
Ce bureau a comme agents : les RTC (radio techniciens
contrôle) électriciens qui sont les ingénieurs
formés pour la réparation des moteurs et ravitaillement des
installations de la RVA en énergie électrique.
? Bureau télécoms
navaids
Les agents de ce bureau s'appellent R.T.C /
Télécoms. Ils sont également ingénieurs
formés en tant qu'électroniciens. Ce sont ceux qui
préparent les appareils électriques de
télécommunication comme micro, radio etc.
8. Service de sûreté et
facilitation
Il est composé de 2 bureaux : ceux de facilitation et
de la police. Ce service joue le rôle du maintien de l'ordre dans les
installations aéronautiques étant donné que
l'aéroport est un endroit stratégique pour une province. C'est
ainsi qu'on exige l'identification de toute personne qui désire y
accéder.
? Bureau facilitation
C'est un bureau est chargé du protocole de
l'entreprise. C'est ce bureau qui s'occupe de l'organisation de fête de
l'entreprise, accueil des missionnaires, etc.
? Bureau police
Ce bureau a pour rôle la sécurité des
installations aéroportuaires, des biens, des passagers, des visiteurs et
des travailleurs.
Source : R.V.A / Kananga, les
documents internes du bureau personnel
61
IV.1.8.3. Critique de l'existant
Après notre passage à la RVA Kananga pour mener
notre étude, nous avons remarqué les points faibles suivants :
- La gestion du personnel est soumise à une gestion
manuelle ; c'est-à-dire, tout ce qui est fait là est manuel ;
- Il n'y a pas un système de gestion de performance du
personnel. Ce qui cause une prise de décision hasardeuse pour ce qui
concerne leur prise en charge. Avec ce système de performance, la RVA
sera capable de savoir les effectifs des agents salariés et
non-salariés, les agents éligibles au congé et ceux
éligibles à la retraite, ce qui leur sera une source
d'inspiration pour les décisions concernant le personnel.
IV.8.4. Proposition de solution
Pour ainsi pallier aux failles constatées et
soulevées au point ci-haut, nous proposons les solutions suivantes :
- Par rapport au recrutement de personnel, nous souhaitons
mettre en place un système informatique qui va premièrement
pallier la difficulté par rapport au temps de traitement des dossiers
des agents. La façon de gérer manuellement le recrutement retarde
certaines opérations car c'est l'Etre humain qui doit passer au constat
des dossiers reçus.
- Nous mettrons également un système de gestion
du personnel pour permettre aux gestionnaires de bien prendre des
décisions optimales et importantes sur la gestion du personnel.
IV.2. Spécification de besoins
IV.2.1. Source de l'Application
La gestion des agents de la RVA est l'une des tâches
effectuées par le Chef du personnel pour la régularisation de la
situation administrative des personnels en suivant et respectant la
hiérarchie qui existe depuis son recrutement jusqu'à sa
retraite.
En général , les gens pensent que tous les
agents de la RVA sont fonctionnaires, mais il y a des agents non fonctionnaires
; c'est-à-dire agent non encadré par la RVA ou personnel
contractuel tels que l'employé de courte durée (ECD),
employé de longue durée (ELD), et l'employé de fonction
auxiliaire (EFA).
? Concours direct : les concours
directes sont ouverts à tous les agents non fonctionnaires ;
62
a) L'employé de courte
durée
Sa décision d'engagement est renouvelée chaque
6 mois ou 12 mois selon le cas dit dans le contrat. Après 6 ans de
service, le personnel est intégré et après
intégration il effectue un stage pendant 1 an pour devenir
fonctionnaire.
b) L'employé de longue
durée
C'est une attestation de classification ou engagement
directe. Il a une majoration de 10% de son salaire à tous les 2 ans
jusqu'à son intégration. Pour accorder la majoration, il faut
faire une demande et évaluer par un bulletin individuel de note ou
BIN.
c) L'Employé de fonction
auxiliaire
Ce personnel est recruté par décision
d'engagement. Ce contrat est renouvelé tous les 2 ans ; après 6
ans de service le personnel est devenu intégré et effectue un
stage pendant 1 an avant d'être fonctionnaire.
IV.2.2. Gestion de recrutement
Le recrutement est défini comme une action d'embaucher
un nouvel personnel pour travailler dans une entreprise, une
société, etc. l'objectif principal est de trouver l'agent
possédant la compétence et les aptitudes au poste à
pourvoir pour le meilleur rendement et pour assurer la survie de
l'entreprise.
a) Le mode de recrutement
Les candidats sont recrutés soit : ? Par voie de concours
:
- Concours directe ;
- Concours professionnel.
? Par voie d'intégration ; ? Sur titre ;
? Sélection de dossiers.
1. Voie de concours :
63
· Concours professionnels :
les concours professionnels sont fixés à tous les
agents déjà fonctionnaires.
2. Voie d'intégration : le
recrutement par voie d'intégration est réservé aux agents
non encadré.
3. Sur titre : le recrutement sur
titre est ouvert à tous.
4. Sélection des dossiers :
tous personnels aptes physiquement et moralement peuvent
participer à la sélection de dossiers. La sélection de
dossiers dépend du profil exigé par la RVA.
b) Droits et obligations du
fonctionnaire
1. Les droits
Le fonctionnaire a pour droit :
> Les fonctionnaires ont droit conformément aux
règles fixées par la loi
pénale et les lois spéciales, à une
protection contre les menaces, outrages,
injures ou diffamation quel que soit la cause, sans qu'il ait
abus de droit ; > De grever pour la défense de leurs
intérêts professionnels.
2. Les obligations
Les agents de la RVA sont tenus aux obligations :
y' De ponctualité, d'assiduité, de plein emploi,
d'honnêteté et d'efficacité ; y' De l'exécution des
tâches qui lui sont confiées ;
y' D'assurer la marche de son service à l'égard
de ses chefs, de l'autorité qui lui a été
conférée pour cet objet et de l'exécution des ordres qu'il
a donnée.
c) Le poste d'affectation
L'affectation est la désignation du poste de travail
d'un fonctionnaire. Le fonctionnaire est affecté à un poste de
travail vacant régulièrement et normalement prévu dans
l'organigramme par décision règlementaire des supérieurs
hiérarchiques.
1) La prise de décision :
c'est la date d'entrée dans l'administration ou date
d'embauche. Le personnel doit avoir un numéro d'immatriculation et un
certificat administratif. Ces 2 pièces justifient que le personnel est
dès maintenant fonctionnaire.
2) Le stage : le candidat
nommé après concours à un emploi de fonctionnaire est
soumis à un stage dont la durée est fixée
uniformément à 1 an.
64
d) Le contrat de travail
Normalement le contrat de travail ne se termine que par la
mise à la retraite du travailleur ; mais il peut y avoir d'autre
arrêt de contrat qui dépend du travailleur.
1) Renouvellement du contrat : le
renouvellement du contrat est réservé pour les agents non
encadrés de la RVA. A chaque fin du contrat, le renouvellement doit
être systématique. Il est fixé à chaque 6 mois.
2) L'intégration :
l'intégration est tenue pour les personnels contractuels.
Il effectue son service pendant 6 ans consécutifs à compter
à la date d'entrée dans l'administration. Si le personnel est
devenu fonctionnaire, il doit avoir aussi un certificat administratif ;
après 6 ans de prise de service, il fait l'intégration.
Après l'intégration, le personnel
réalise un stage dont la durée est fixée à 6 mois.
Il y a redoublement de stage si le stage si le stage effectué n'est pas
satisfaisant.
3) La titularisation : la
titularisation se fait après l'expiration de ce stage. S'il n'y a pas
redoublement de stage le personnel est directement titularisé.
IV.2.3. Gestion de Formation
a) Le reclassement : tous les
agents de la RVA ayant obtenu des diplômes, titres universitaires ou
qualifications professionnelles reconnus par l'Etat Congolais, avant ou en
cours de la période d'emploi, est reclassé ou assimilé aux
codes des fonctionnaires correspondant à ces diplômes au titre
suivant la réglementation en vigueur.
b) L'avancement : l'avancement a
lieu au profit de tous les agents de la RVA dépend de
l'ancienneté de service.
Il y a deux sortes d'avancement de personnel :
Avancement d'échelon ; Avancement de classe.
1. L'avancement d'échelon :
est un profit des agents de l'Etat. Le personnel jouit d'un
avancement automatique d'échelon au bout de 2 ans d'ancienneté
après la titularisation.
2. L'avancement de classe : il se
fait après la procédure d'échelon. Le corps des
fonctionnaires comprend régulièrement une hiérarchisation
et un échelonnement à 4 classes :
? La première classe a trois échelons ; ? La
deuxième classe a trois échelons ; ? La principale a trois
échelons ;
65
> La classe exceptionnelle a deux échelons.
3. La pension : les fonctionnaires mis
à la retraite bénéficient des différents types de
pension à compter à la date de prise de service jusqu'à la
cessation de service.
IV.2.4. Gestion de congé
Tous les personnels ou agents de la RVA ont un congé
qui dure 30 jours chaque année. Les personnels peuvent prendre un
congé en fonction de ce qu'il veut ou cela (la prise de congé)
dépend de leur choix, c'est-à-dire le nombre de jours de
congé et même le temps du congé. La prise de congé
dépend aussi de l'état de la société ou de
l'entreprise dans laquelle on travaille ; en d'autres termes si l'entreprise ou
la société est en pleine activité, on ne peut pas prendre
du congé de plus si les autres personnels sont en congé. La prise
de congé pour soi est presque impossible. Comme toutes choses, plusieurs
facteurs poussent les personnels à prendre un congé tels que dans
le domaine de santé, familiale ou autre. A noter que lorsque ces 30
jours sont tous pris ; c'est-à-dire qu'il n'y a plus de congé
restant ; le personnel ne peut pas prendre un congé sauf un cas
exceptionnel et lorsqu'il y a un reste cela est additionner avec celui de
l'année suivante.
IV.2.5. Objectif de l'application
L'objectif de cette application est de mettre à la
disposition du Chef de personnel un système permettant :
> D'enregistrer les informations concernant le personnel ;
> De bien suivre les mouvements concernant la retraite du
personnel ;
> De connaitre si ce personnel est vraiment un fonctionnaire
ou non
fonctionnaire déjà intégré ou pas
encore, c'est-à-dire contractuel ;
> De faire les analyses sur la prestation du personnel ;
> De mettre à la disposition des gestionnaires la
situation du personnel en un
temps réduit pour permettre une meilleure prise de
décision ;
> De prendre toutes les décisions nécessaires
pour la meilleure gestion du
personnel.
IV.2.6. Problématique du
projet
Les problèmes qui ont motivé à la
réalisation de ce projet sont :
· L'inexistence d'un système de gestion du
personnel à la RVA : tout est fait manuellement et c'est ce qui entraine
un décalage de la gestion dans le traitement des informations ;
· Le chef du personnel ne sait pas le nombre du
personnel facilement et aussi toutes les informations concernant son personnel
;
66
? La prise de décision sur la gestion du personnel qui
tarde chaque fois qu'on a besoin d'améliorer cette gestion ;
? En cas de décès, le déroulement des
différentes procédures dispensent beaucoup de temps par manque de
système permettant de gérer son personnel.
a) Liste des matériels
existants
Type
|
Processeur
|
RAM
|
HDD
|
Nombre
|
PC
|
Pentium IV 2,4GHZ
|
512Mb
|
80Gb
|
1
|
Pentium IV 2,6GHZ
|
512Mb
|
80Gb
|
1
|
Pentium IV 2,8
|
512Mb
|
80Gb
|
2
|
1Gb
|
160Gb
|
1
|
Pentium IV 3 GHZ
|
1Gb
|
80Gb
|
1
|
1 Gb
|
160Gb
|
1
|
2Gb
|
120Gb
|
1
|
2Gb
|
320Gb
|
1
|
Pentium IV 3,2GHZ
|
1Gb
|
120Gb
|
1
|
Dual Core 2GHZ
|
1Gb
|
160Gb
|
1
|
Dual Core 2,5GHZ
|
4Gb
|
240Gb
|
1
|
AMD Athlon 64 2,2GHZ
|
2Gb
|
160Gb
|
1
|
TOTAL
|
14
|
Portables
|
AMD Turion 64 1,6GHZ
|
768Mb
|
80Gb
|
1
|
Core2 Duo 2GHZ
|
4Gb
|
500Gb
|
3
|
Total
|
4
|
Total Général
|
18
|
Tableau 6: Liste des matériels
existants
b) Répartition autres
matériels
Désignation
|
Marque
|
Modèle
|
Nombre
|
Onduleur 400VA
|
SENDON
|
UPS-600
|
2
|
Onduleur 850VA
|
UPS Technology
|
Upson
|
5
|
Onduleur 1500VA
|
UPS Technology
|
Upson
|
2
|
Imprimante jet
d'encre
|
HP
|
D1360
|
1
|
Imprimante Laser
|
EPSON
|
LQ-2180
|
1
|
Imprimante Laser
|
OKI
|
Microline 4410
|
1
|
Imprimante Laser
|
LEXMARK
|
120n
|
1
|
Scanneur
|
Canon
|
Canoscan lide 100
|
1
|
Switch
|
LINKSYS
|
Wireless-G
|
1
|
Tableau 7: Autres matériels
28 KAFUNDA KATALAYI JP, Entrepôts des
données, L2 informatique option Gestion, cours inédit, U.K.A
2015-2016
67
IV.2.7. Les méthodologies des systèmes
d'informations
Plusieurs méthodes existent, mais pour notre projet, nous
allons utiliser la notation
UML.
a) La notation UML
UML (Unified Modeling Language) est une méthode de
modélisation orientée objet développée en
réponse à l'appel à propositions lancé par l'OMG
(Object Management Group) dans le but de définir la notation standard
pour la modélisation des applications construites à l'aide
d'objets. Elle est héritée de plusieurs autres méthodes
telles que OMT (Object Modeling Technique) et OOSE (Object Oriented Software
Engineering) et Booch. Les principaux auteurs de la notation UML sont Grady
Booch, Ivar Jacobson et Jim Rumbaugh.
Elle est utilisée pour spécifier un logiciel
et/ou pour concevoir un logiciel. Dans la spécification, le
modèle décrit les classes et les cas d'utilisation vus de
l'utilisateur final du logiciel. Le modèle produit par une conception
orientée objet est en général une extension du
modèle issu de la spécification. Il enrichit ce dernier de
classes, dites techniques, qui n'intéressent pas l'utilisateur final du
logiciel mais seulement ses concepteurs. Il comprend les modèles des
classes, des états et d'interaction. UML est également
utilisée dans les phases terminales du développement avec les
modèles de réalisation et de déploiement.
UML est une notation utilisant une représentation
graphique. L'usage d'une représentation graphique est un
complément excellent à celui de représentions textuelles.
En effet, l'une comme l'autre sont ambigus mais leur utilisation
simultanée permet de diminuer les ambigüités de chacune
d'elle. Un dessin permet bien souvent d'exprimer clairement ce qu'un texte
exprime difficilement et un bon commentaire permet d'enrichir une figure.
Il est nécessaire de préciser qu'une notation
telle qu'UML ne suffit pas à produire un développement de
logiciel de qualité à elle seule. En effet, UML n'est qu'un
formalisme, ou plutôt un ensemble de formalismes permettant
d'appréhender un problème ou un domaine et de le
modéliser, ni plus ni moins. Un formalisme n'est qu'un outil. Le
succès du développement du logiciel dépend
évidemment de la bonne utilisation d'une notation comme
UML mais il dépend surtout de la façon dont on
utilise cette méthode à l'intérieur du cycle de
développement du logiciel.28
68
b) Les qualités d'UML
1. Langage standard de fait
UML est reconnu parfois comme un des standards du
marché. Deux facteurs ont permis à UML d'accéder à
ce statut :
? -Il résulte de la fusion de trois outils
préexistant complémentaires qui déjà avaient une
audience non négligeable ;
? -Il a bénéficié de la force
commerciale d'un éditeur particulièrement offensif : Rational,
éditeur de l'outil Rose basé sur UML. Aujourd'hui, Rational est
une entité membre d'IBM (depuis début 2003). Rappelons que
Rational n'est pas le seul éditeur à oeuvrer dans le monde UML et
que certains des outils sont gratuits dans leur version personnelle. Enfin
l'utilisation d'UML est libre de droits.
2. Large spectre d'utilisation
Ce langage peut avoir un domaine d'application très
étendu et les exemples cités par Dominique Vauquier prouvent
qu'UML apporte des bénéfices à toute l'entreprise et pas
uniquement à ceux qui s'occupent de son SI.
3. Capacité à décrire en
emboîtant les niveaux d'abstraction
Les exemples cités ne seraient pas crédibles si
UML ne savait pas gérer les niveaux
d'abstraction habituellement reconnus et hiérarchiser les
représentations.
Ainsi, une entité du modèle (que ce soit un
processus, une instance, un événement,
un flux) pourra être située dans son niveau
hiérarchique :
? Le métier de l'Entreprise (niveau stratégique)
;
? Les blocs fonctionnels, concourant à l'accomplissement
de ce métier (niveau
tactique) ;
? Les fonctions (processus), chargées d'une mission
identifiée (niveau opérationnel I)
;
? Les activités unitaires (niveau opérationnel
II).
4. Méta modèle
accessible
Le langage UML donne accès à son méta
modèle. Dominique Vauquier ne cite pas cette qualité non
négligeable ; je me permets de la signaler. Un méta modèle
est une représentation (une modélisation donc) des concepts
utilisés par le langage lui-même. Cette représentation
permet de théoriser sur l'outil, permet de l'enrichir facilement, permet
de dégager des règles de bonne utilisation.
Par exemple, l'un des principes recommandés pour
assurer la cohérence entre les diagrammes du modèle se formule
ainsi :
y' Toute instance citée dans un diagramme des
séquences doit être membre d'une classe citée dans un
diagramme des classes ;
y' Toute classe doit avoir une entrée dans le
dictionnaire des concepts métier et être citée dans au
moins un Cas d'Utilisation. Dès lors qu'on se préoccupe des
relations
69
entre les éléments constitutifs du langage, on
attaque le méta modèle. Les promoteurs d'UML nous fournissent
beaucoup de descriptions sur ses éléments constitutifs, nous
permettant de formuler quelques critères qualité.
5. Points forts d'UML
UML est un langage formel et normalisé
· Gain de précision
· Gage de stabilité
· Encourage l'utilisation d'outils
UML est un support de communication performant
· Il cadre l'analyse.
· Il facilite la compréhension de
représentations abstraites complexes.
· Son caractère polyvalent et sa souplesse en font
un langage universel.
c) Pourquoi et comment modéliser
?
1. Qu'est-ce qu'un modèle ?
Un modèle est une représentation abstraite et
simplifiée (i.e. qui exclut certains détails), d'une
entité (phénomène, processus, système, etc.) du
monde réel en vue de le décrire, de l'expliquer ou de le
prévoir. Modèle est synonyme de théorie, mais avec une
connotation pratique : un modèle, c'est une théorie
orientée vers l'action qu'elle doit servir.
Concrètement, un modèle permet de
réduire la complexité d'un phénomène en
éliminant les détails qui n'influencent pas son comportement de
manière significative. Il reflète ce que le concepteur croit
important pour la compréhension et la prédiction du
phénomène modélisé, les limites du
phénomène modélisé dépendant des objectifs
du modèle.
Un modèle est avant tout une représentation
abstraite du monde réel. A ce titre, ce n'est pas le monde réel
et donc ce n'est pas, exactement le monde réel. Un modèle offre
donc une vision schématique d'un certain nombre d'éléments
que l'on veut décrire ; un dessin quoi ! On a coutume de dire : «
Un dessin vaut mieux qu'un beau discours » ; et bien écoutons et
tentons de comprendre nos ancêtres, nos parents ou tout ceux qui ont pu
nous répéter cette phrase. Réaliser un modèle c'est
avant tout dessiner ce que l'on a compris d'un problème dans une syntaxe
précise (la syntaxe UML ou Merise).
Un modèle va donc nous servir à communiquer et
échanger des points de vue afin d'avoir une compréhension commune
et précise d'un même problème.
2. Les niveaux d'abstractions :
Lorsque l'on a à traiter un problème complexe,
il est conceptuellement impossible de l'appréhender d'un seul bloc, dans
son ensemble. Notre esprit à besoin de « dégrossir » le
problème afin de pouvoir le comprendre pas à pas, petit à
petit. Une fois le problème découpé en
sous-problèmes de taille plus petite, l'analyse de chacun de ces
sous-problèmes nécessite de commencer à en comprendre les
grandes lignes puis d'affiner sa compréhension pour enfin comprendre
tous les détails.
70
Ce mode de résonnement est à la base même
des niveaux d'abstraction que l'on retrouve dans les méthodes comme
Merise (niveau conceptuel, niveau logique, niveau physique) ou RUP (niveau
fonctionnel, niveau analyse, niveau conception).
Il faut donc bien comprendre la signification de ces niveaux
et le nécessaire enrichissement d'un modèle de niveau N par
l'analyse de niveau N+1.
3. Pourquoi modéliser ?
Modéliser un système avant sa
réalisation permet de mieux comprendre le fonctionnement du
système. C'est également un bon moyen de maîtriser sa
complexité et d'assurer sa cohérence. Un modèle est un
langage commun, précis, qui est connu par tous les membres de
l'équipe et il est donc, à ce titre, un vecteur
privilégié pour communiquer. Cette communication est essentielle
pour aboutir à une compréhension commune aux différentes
parties prenantes (notamment entre la maîtrise d'ouvrage et
maîtrise d'oeuvre informatique) et précise d'un problème
donné.
4. Qui doit modéliser ?
La modélisation est souvent faite par la maîtrise
d'oeuvre informatique (MOE). C'est malencontreux, car les priorités de
la MOE résident dans le fonctionnement de la plate-forme informatique et
non dans les processus de l'entreprise.
Il est préférable que la modélisation
soit réalisée par la maîtrise d'ouvrage (MOA) de sorte que
le métier soit maître de ses propres concepts. La MOE doit
intervenir dans le modèle lorsque, après avoir défini les
concepts du métier, on doit introduire les contraintes propres à
la plate-forme informatique.
d) Les Diagrammes
UML utilise plusieurs diagrammes mais les plus utilisées
sont les suivantes :
1. Diagramme De Cas D'utilisation a.
Généralité
Bien souvent, la maîtrise d'ouvrage et les utilisateurs
ne sont pas des informaticiens. Il leur faut donc un moyen simple d'exprimer
leurs besoins. C'est précisément le rôle des diagrammes de
cas d'utilisation qui permettent de recueillir, d'analyser et d'organiser les
besoins, et de recenser les grandes fonctionnalités d'un système.
Il s'agit donc de la première étape UML d'analyse d'un
système29.
Un diagramme de cas d'utilisation capture le comportement d'un
système, d'un sous-système, d'une classe ou d'un composant tel
qu'un utilisateur extérieur le voit. Il scinde la fonctionnalité
du système en unités cohérentes, les cas d'utilisation,
ayant un sens pour les acteurs. Les cas d'utilisation permettent d'exprimer le
besoin des utilisateurs d'un système, ils sont donc une vision
orientée utilisateur de ce besoin au contraire d'une vision
informatique.
29
https://www.memoireonline.com
71
Il ne faut pas négliger cette première
étape pour produire un logiciel conforme aux attentes des utilisateurs.
Pour élaborer les cas d'utilisation, il faut se fonder sur des
entretiens avec les utilisateurs.
Les diagrammes des cas d'utilisation identifient les
fonctionnalités fournies par le système (cas d'utilisation), les
utilisateurs qui interagissent avec le système (acteurs), et les
interactions entre ces derniers. Les cas d'utilisation sont utilisés
dans la phase d'analyse pour définir les besoins de "haut niveau" du
système. Les objectifs principaux des diagrammes des cas d'utilisation
sont:
? fournir une vue de haut-niveau de ce que fait le
système ;
? Identifier les utilisateurs ("acteurs") du système
;
? Déterminer des secteurs nécessitant des
interfaces homme-machine (IHM).
Les cas d'utilisation se prolongent au-delà des
diagrammes imagés. En fait, des descriptions textuelles des cas
d'utilisation sont souvent employées pour compléter ces derniers
et représentent leurs fonctionnalités plus en détail.
b. Éléments des diagrammes de cas
d'utilisation :
Les composants de base des diagrammes des cas d'utilisation sont
l'acteur, le cas d'utilisation, et l'association.
? Acteur
Un acteur est un utilisateur du système, et est
représenté par une figure filaire. Le rôle de l'utilisateur
est écrit sous l'icône. Les acteurs ne sont pas limités aux
humains. Si le système communique avec une autre application, et
effectue des entrées/sorties avec elle, alors cette application peut
également être considérée comme un acteur.
? Cas d'utilisation
Un cas d'utilisation représente une
fonctionnalité fournie par le système, typiquement décrite
sous la forme Verbe+objet (par exemple
immatriculer voiture, effacer
utilisateur).
Les cas d'utilisation sont représentés par une
ellipse contenant leurs noms.
? Association
Les associations sont utilisées pour lier des acteurs
avec des cas d'utilisation. Elles indiquent qu'un acteur participe au cas
d'utilisation sous une forme quelconque. Les associations sont
représentées par une ligne reliant l'acteur et le cas
d'utilisation.
IV.3. Conception
Nous entrons maintenant dans la phase de conception y compris
les études nécessaires, le dictionnaire de données, les
règles de gestion et ensuite les diagrammes de notre projet.
72
IV.3.1. Quelques études nécessaires
IV.3.1.1. Etude d'opportunité
Cette étape d'avant-projet permet d'étudier la
demande de projet et de décider si le concept est viable. Cette
étape a pour enjeu de valider la demande des utilisateurs par rapport
aux objectifs généraux de l'organisation.
Elle consiste à définir le
périmètre du projet (on parle également du contexte),
notamment à définir les utilisateurs finaux, c'est-à-dire
ceux qui l'ouvrage est destiné (on parle de ciblage ou profilage). A ce
stade du projet il est donc utile d'associer les utilisateurs à la
réflexion globale.
Lors de la phase d'opportunité, les besoins
généraux de la maitrise d'ouvrage doivent être
identifiés. Il est nécessaire de s'assurer que ces besoins
correspondent à une attente de l'ensemble des utilisateurs cibles et
qu'ils prennent en compte les évolutions probables des besoins.
Dans l'étude d'opportunité aussi on parle des
avantages attendus par le projet et ici les avantages attendus par ce projet
sont les suivants :
Facilité au niveau du traitement de l'information,
c'est-à-dire que toute est faite automatiquement, le traitement devient
de plus en plus simple et on a un gain du temps dans le domaine de travail ;
Simplifie le travail du Chef personnel, les mises à jour
et les consultations qui sont faite manuellement au paravent sont tous
traité par cette application ; L'automatisation de la gestion de
personnel permet d'aider le chef personnel ou le service dont elle utilise pour
faciliter la gestion, il suffit de cliquer pour effectuer certains traitements
dans un minimum de temps.
IV.3.1.2. Etude de faisabilité
D'une manière générale, l'étude de
faisabilité occupe une phase importante dans l'étude
préalable de la conception d'un grand projet. Dans ce cas cette
étude se subdivise en trois parties tels que : la faisabilité
organisationnelle et ergonomique, faisabilité technique et
faisabilité de la solution de secours.
1. Faisabilité organisationnelle et
ergonomique
Pour la faisabilité organisationnelle et ergonomique :
la présence de cette application nécessite la
disponibilité des personnels occupant cette responsabilité, le
personnel aussi a besoin de faire ou suivre des formations pour qu'il
deviennent capables de manipuler notre logiciel à créer avec la
conception en supposant que nous sommes les formateurs des personnels dans
cette situation, et aussi pour pouvoir adapter aux nouvelles technologies, la
compréhension des fonctionnements de la Nouvelle Technologie de
l'Information et de la Communication (NTIC) est aussi nécessaire pour
les personnels.
2. Faisabilité technique
La nécessité du matériel et logiciel est
fortement recommandé pour bien exercer le processus du fonctionnement du
logiciel que nous allons développer. Nous recommandons vivement à
la société de se procurer de ses ordinateurs au nombre de
préférence avec des
73
équipements complémentaires afin d'adapter
l'automatisation du système. De ce fait, il suffit alors d'installer les
logiciels nécessaires pour l'exécution de notre programme surtout
notre application qui va répondre principalement les besoins de
l'utilisateur. La mise à jour de notre application à créer
peut être effectuée soit par le personnel que nous aurons
formé, soit par nous-même en parlant donc d'un traitement e
maintenance d'une négociation.
3. Faisabilité de la solution de
secours
Pour bien sécuriser toutes les données
importantes de cette société, il vaut mieux sauvegarder au moins
deux exemplaires dans les supports distincts les informations très
essentielles. Alors l'utilisation des supports physiques est nécessaire
et important car dans ces distincts supports, les données sont alors
bien sécurisées. En outre, il est de préférence de
sauvegarder les informations dans le flash disque ou dans le CD-ROM ou dans un
autre support de sauvegarde autre que le Disque Dur de la machine pour
éviter la disparition des informations essentielles de la
société car la plupart de ces supports que nous avons
cités ci-dessus est très fiable et bien
sécurisé.
L'utilisation du système RAID est évidement
faisable parce qu'il suffit tout simplement d'acheter ce logiciel avec licence
et l'utiliser. Le système RAID est un système avec lequel on
utilise deux disques durs et l'utilisation de ce logiciel permet lorsqu'on fait
une écriture à l'un des disques les informations sont aussi
transmises à l'autre disque. Lorsque l'un des disques est en panne, on
récupère les informations à partir de l'autre disque qui
se sert d'une sauvegarde et cela permet la récupération rapide
des informations au lieu de faire des copies à partir de quelques
supports de sauvegarde.
IV.3.2. Dictionnaire de
données
Rubrique
|
Description
|
Type
|
Longueur
|
Etat
|
Remarque
|
Im
|
Immatriculation
|
N
|
10
|
E
|
|
Nom
|
Nom du personnel
|
A
|
20
|
E
|
|
Prenom
|
Prénom du personnel
|
A
|
20
|
E
|
|
Sexe
|
Sexe du personnel
|
A
|
6
|
E
|
|
Grade
|
Grade du personnel
|
N
|
18
|
E
|
|
Tel
|
Téléphone du personnel
|
N
|
10
|
E
|
|
Adrs
|
Adresse du personnel
|
A
|
20
|
E
|
|
Code_dipl
|
Code du diplôme
|
AN
|
12
|
E
|
A créer
|
lib_dipl
|
Libéllé du diplôme
|
A
|
10
|
E
|
A créer
|
num_arrt_intgr
|
Numéro de l'arrêté d'intégration
|
N
|
10
|
E
|
A créer
|
date_arrt_intgr
|
Date de l'arrêté d'intégration
|
D
|
8
|
E
|
JJ/MM/AA
|
num_arrt_titu
|
Numéro arrêté de titularisation
|
N
|
10
|
E
|
A créer
|
74
date_arrt_titu
|
Date de l'arrêté de titularisation
|
D
|
10
|
E
|
JJ/MM/AA
|
code_cg
|
Code du congé
|
AN
|
6
|
E
|
A créer
|
pers_cg
|
Personnel congé
|
A
|
20
|
E
|
A créer
|
datedeb_cg
|
Date de début du congé
|
D
|
8
|
E
|
JJ/MM/AA
|
durée_cg
|
Durée du congé
|
N
|
2
|
E
|
A créer
|
datefin_cg
|
Date de fin congé
|
D
|
8
|
E
|
JJ/MM/AA
|
code_aff
|
Code d'affectation
|
AN
|
6
|
E
|
A créer
|
pers_aff
|
Personnel affecté
|
A
|
20
|
E
|
A créer
|
p_origine
|
Poste d'origine
|
A
|
10
|
E
|
|
p_affectation
|
Poste d'affectation
|
A
|
10
|
E
|
A créer
|
code_appartenir
|
Code appartenir
|
AN
|
6
|
E
|
A créer
|
nom_reg
|
Nom de la région
|
A
|
10
|
E
|
|
district
|
district
|
A
|
10
|
E
|
|
Lieu
|
Lieu
|
A
|
20
|
E
|
A créer
|
Tableau 8 : Dictionnaire de
données
? Liste des abréviations ? A :
Alphabétique ? AN : Alphanumérique ? N : Numérique
? D : Date
? E : Elémentaire
IV.3.3. Les règles de gestion
Les règles de gestion regroupent les contraintes et les
liens entre les données. Voici les règles qui nous ont permis
:
? RG1 : Le service Personnel gère
toutes les données concernant le personnel de la RVA
? RG2 : Ce service veille sur l'information
sur le poste, et on prépare les dossiers qui se rapportent à tous
les droits et avantages ainsi que les obligations des personnels comme
l'avancement, la distinction honorifique, les congés, l'admission
à la retraite et aussi la neutralité d'appartenance politique.
? RG3 : Chaque personnel doit avoir un
classeur de dossier administratif et sur un support électronique.
? RG4 : Toutes les rubriques proposées
dans cette base doivent être remplies.
75
> RG5 : Chaque personnel doit avoir et
remplir une fiche individuelle de renseignements dans laquelle figure son
état civil, sa situation de famille, son état de service, les
sanctions positives et les sanctions négatives.
> RG6 : La section situation
administrative de la fiche de renseignement figure le grade, son cadre avec le
numéro et la date d'arrêté, sa date d'effet et l'indice
correspondant.
> RG7 : Tout personnel nouvellement
recruté ou nouvellement affecté doit aviser son arrivé en
établissant la lettre de prise de service. De même pour ceux qui
vont partir doivent établir une lettre de cessation de service.
> RG8 : Tout personnel peut faire une
demande d'affectation selon leur choix.
> RG9 : Le grade est identifié par
son code, sa classe et son échelon.
> RG10 : Après la période de
stage, les avancements suivants sont automatiques à chaque deux an.
> RG11 : Les personnels titularisés
commencent par le grade du deuxième classe premier échelon.
> RG12 : Les ELD ou contractuels qui sont
récemment titularisés jouissent des anciennetés
conservées qui sont comptées de la date de son dernier avancement
jusqu'à la date de l'arrêté de titularisation.
> RG13 : Tout personnel a un congé
de 30 jours chaque année.
> RG14 : Les congés qui ne sont pas
prise seront additionnés avec celle de l'année suivante.
> RG15 : Lorsque la retraite approche le
personnel peut prendre toute le reste de son congé
> RG16 : Pour la promotion au grade
supérieur il faut se référer à la date d'effet du
dernier avancement et la date de promotion.
> RG17 : Les contractuels peuvent
être intégrés en corps de fonctionnaires.
> RG18 : Les fonctionnaires doivent
être titularisés après un an de stage.
> RG19 : Un fonctionnaire obtient un grade
et une catégorie conforme à son niveau d'instruction et son
diplôme obtenu.
> RG20 : Une fois intégrée,
le personnel doit avoir un grade.
> RG21 : Après le recrutement, tous
les personnels contractuels doivent passer en ECD et est engagé au
premier contrat.
76
IV.4. La conception de diagrammes
IV.4.1. Diagramme de cas
d'utilisation
Figure 14 : Diagramme de cas d'utilisation de la
gestion du personnel
1°) Cas d'utilisation «
Engager »
Ce cas d'utilisation sert à un engagement;
c'est-à-dire le chef du personnel donne les informations du personnel
à recruter.
a) Description textuelle
Identification de cas d'utilisation
|
Nom
|
Engager
|
Objectif
|
Pour pouvoir être parmi les agents de la RVA
|
Acteur principal
|
Chef du personnel
|
Date de création : 29/09/2021
|
Date de modification : 06/10/2021
|
Auteur
|
Paulinsoft
|
Version
|
1.0
|
Description des scénarios
|
Les préconditions
|
Pas encore inscrit
|
Des scénarios nominaux
|
1.1 Authentification
|
|
1.2 Vérification code
|
|
1.3 Affichage menu
|
|
1.4 Saisie information du personnel
|
|
1.5 Enregistrement
|
|
1.6 Enregistrement accepté
|
77
Des scénarios alternatifs
|
Au point 1.3
|
|
2.1 : personnel déjà engagé
|
|
2.2 : engagement annulé
|
Des scénarios d'exceptions
|
Au point 1.4
|
|
3.1. Erreur de saisie
|
|
3.2. Formulaire de saisie
|
Des post conditions
|
Personnel enregistré dans la base de données
|
Tableau 9 : Identification de
engager
b) Description graphique
1. Diagramme de séquence
correspondante
Figure 15 : diagramme de
séquence de cas d'utilisation engager
78
2. Diagramme d'activité correspondante
Figure 16 : diagramme d'activité engager
2°) Cas d'utilisation « Modifier personnel
»
Ce cas d'utilisation sert pour la modification ;
c'est-à-dire faire adapter ce qui est dans le système à la
réalité.
a) Description textuelle
|
Identification de cas d'utilisation
|
Nom
|
|
Modifier personnel
|
Objectif
|
|
Permet de mettre à jour l'information
|
Acteur principal
|
|
Chef du personnel
|
Date de création :
|
29/09/2021
|
Date de modification : 06/10/2021
|
Auteur
|
|
Paulinsoft
|
Version
|
|
1.0
|
|
Description des scénarios
|
79
Les préconditions
|
Pas encore modifié
|
Des scénarios nominaux
|
1.1 Nouvelle modification
|
|
1.2 Modification de l'information
|
|
1.3 Validation information
|
|
1.4 Modification terminée
|
Des scénarios alternatifs
|
Au point 1.3
|
|
2.1 : personnel déjà modifié
|
|
2.2 : modification annulée
|
Des scénarios d'exceptions
|
Au point 1.4
|
|
1.1. Erreur de saisie
|
|
1.2. Formulaire de modification
|
Des post conditions
|
Personnel modifié et enregistrement dans la base de
données
|
Tableau 10 : identification de
modifier personnel b) Description graphique
1. Diagramme de séquence
correspondante
Figure 17 : diagramme de
séquence modifier personnel
80
2. Diagramme d'activité
correspondante
Figure 18 : diagramme d'activité modification
personnel
3°) Cas d'utilisation «
Lister_personnel »
Ce cas d'utilisation sert pour lister le personnel ;
c'est-à-dire afficher la liste du personnel recherché.
c) Description textuelle
|
Identification de cas d'utilisation
|
Nom
|
|
Lister personnel
|
Objectif
|
|
Permet d'afficher la liste de personnel
|
Acteur principal
|
|
Chef du personnel
|
Date de création :
|
29/09/2021
|
Date de modification : 06/10/2021
|
Auteur
|
|
Paulinsoft
|
Version
|
|
1.0
|
|
Description des scénarios
|
81
Les préconditions
|
Pas encore lister
|
Des scénarios nominaux
|
1.1. Nouveau listage
|
|
1.2. listage de l'information
|
|
1.3. Validation information
|
|
1.4. Listage terminé
|
Des scénarios alternatifs
|
Au point 1.3
|
|
2.1 : personnel déjà listé
|
|
2.2 : listage annulé
|
Des scénarios d'exceptions
|
Au point 1.4
|
|
1.3. Erreur de saisie
|
|
1.4. Formulaire de modification
|
Des post conditions
|
Personnel listé et enregistrement dans la base de
données
|
Tableau 11 : identification de
lister personnel d) Description graphique
3. Diagramme de séquence
correspondante
Figure 19 : diagramme de
séquence modifier personnel
82
4. Diagramme d'activité
correspondante
Figure 20 : diagramme d'activité
modification personnel
83
IV.4.2. Diagramme de classe
Figure 21 : diagramme de classe de la
gestion du personnel
84
Conclusion partielle
Ce chapitre comporter deux parties dont : l'analyse de
l'existant et la conception, quant à l'analyse de l'existant nous avons
présenté notre cadre de recherche qui est la RVA Kananga et son
fonctionnement. Quant à la deuxième partie nous a eu à
faire la modélisation à l'aide de Start UML qui nous a faciliter
la tâche de concevoir le diagramme de cas d'utilisation, de
séquence, d'activité et enfin celui de classe. Le chapitre
suivant présentera l'implémentation de notre solution.
85
CHAPITRE V : IMPLEMENTATION DE LA SOLUTION
V.1. Présentation De L'outil
C'est la phase finale de la conception de système
d'information. Elle consiste à concevoir un entrepôt de
données pour arriver aux traitements souhaités pour les besoins
de l'entreprise.
Pour notre mémoire, nous avons choisi SQL Server 2008
comme SGBD afin de stocker nos données qui concernent les personnels de
la RVA. Ce choix est justifié par le fait que le modèle
relationnel offre la possibilité de manipuler facilement les
données rapidement.
V.2. Table de faits
Voici notre table de faits pour l'analyse :
Analyse de la situation du personnel
- Nombre de personnel - Salaires
- Date d'integration
- Date de titularisation
|
|
V.3. Première partie : Système
transactionnel (OLTP)
1. Création d'une base de
données
Voici comment nous avons procéder pour créer
notre base de données :
? Démarrer/SQL Server 2008/SQL Server Management
Studio
? Préciser le mode d'accès à votre server
(Authentification Windows ou
Authentification SQL server)
? Le nom de votre serveur
? Pour l'authentification SQL server vous devez préciser
la connexion (par
exemple sa si on accède au serveur comme
administrateur) et votre mot de
passe. Voir la figure suivante :
? Cliquer sur le bouton se conn
86
Figure 22 : SQL Server
On obtient ensuite la figure suivante :
Figure 23 : Microsoft SQL Server
Management Studio Création d'une nouvelle base de données :
V' Se positionner le noeud racine de l'arbre.
C'est-à-dire sur le noeud base de données
V' Clic droit sur ce noeud base de données
V' Clic sur nouvelle base de données
V' Donner un nom à votre base de
données
V' Clic sur le bouton ok
Voici l'acheminement de ces étapes sur les figures
suivantes :
87
Figure 24 : création de la base
de données
Figure 25 : nouvelle base de
données Notre base de données est nommée Gestion_personnel
Clic sur le bouton ok
Pour la création des tables on procède de la
manière suivante :
? Cliquer sur le symbole + à
côté du noeud base de données pour voir tous ses noeuds
fils,
? Se positionner sur la base de données
Gestion_personnel
88
? Cliquer sur le symbole + à
côté de Gestion_personnel ? Clic droit sur le noeud table
? Clic sur nouvelle table
Voir la figure suivante :
Figure 26 : table
V.4. Deuxième partie : Système
Décisionnel (OLAP)
Lancer le Business Intelligence Management Studio
Cliquer sur Démarrer/Programme/Sql server 2008/ server
Business Intelligence Development Studio
89
Figure 27 : Business Intelligence
Cliquer sur créer projet ou Fichier/Nouveau projet
Sélectionner, projet business intelligence
Sélectionner, projet analysis service
Donner un nom à votre projet
V.5. Création Source de données
Clic droit sur source de données/clic sur nouvelle source
de données
L'assistant source de données s'affiche
Cliquer sur le bouton suivant
Cliquer sur le bouton nouveau
Cliquer sur ok
90
Figure 28 : Assistant Source de
données
Définir le provider (fournisseur)
Prendre Microsoft OLEDB Provider for SQL SERVER
Sélectionner votre base de données
Cliquer sur le bouton suivant
Clic sur nouvelle source de données
91
Figure 29 : Gestionnaire de
connexion
Cliquer sur le bouton suivant
92
Figure 30 : Assistant source de
données
V.6. Création Vue de données
> Clic droit sur vue des sources de données
> Clic droit sur nouvelle source de données
> Clic sur suivant, suivant
> Désactiver la case créer des relations logique
en faisant correspondre les colonnes
> Clic sur suivant
> Sélectionner les tables en cliquant sur le bouton
à deux flèches »
> Clic sur suivant
> Clic sur terminer
93
Voir les figures suivantes :
Figure 31 : Sélection des
tables
Créer votre vue en glissant à partir de table de
fait chaque clé étrangère vers la table de dimension
correspondante
Création d'une nouvelle dimension
? Clic droit sur Dimension/nouvelle Dimension
? Clic sur suivant ? Clic sur suivant
? Choisir Temps comme table principale
94
> Définir la hiérarchie (ex :
Année/Trimestre/Mois/Date)
Figure 32 : création
dimensions
V.7. Création du Cube
> Clic sur droit sur Cubes
> Clic sur nouveau cube
> Clic sur suivant
> Clic sur suivant
> Cocher la case de table de fait
> Clic sur suivant, suivant, suivant, suivant, Terminer
95
Figure 33 : création de
cube
Double cliquer sur chacune de dimension et glisser les attributs
vers la gauche Exécuter en démarrant le débogage (clic sur
le bouton verts ou touche F5) Double clic sur le cube / Clic sur l'onglet
navigateur
96
Conclusion partielle
Mieux vaut la fin d'une chose que son commencement dit-on,
dans ce chapitre nous avons présenté notre solution informatique
qui est l'entrepôt de données dont nous avons abordé le
système OLTP et le système OLAP qui nous ont conduit au
déploiement du cube afin de matérialiser ce qu'a
été notre rêve et notre désir d'aider la RVA afin
d'appliquer l'informatique décisionnel pour une meilleure prise de
décision.
97
CONCLUSION GENERALE
Nous voici arrivé au terme de notre réflexion
scientifique, fruit de nos recherches rendues visibles par ce travail de fin de
notre deuxième cycle qui sanctionne la fin de nos études
universitaires à l'université Saint Laurent de Kananga (USLKA),
dans la faculté de Sciences Informatiques, Option Conception de
système d'information et programmation avancée ; travail qui a
porté sur la modélisation et l'implémentation d'un
système décisionnel pour la gestion du personnel à la
Régie des Voies Aériennes de Kananga.
Dans notre travail, nous avons parlé d'abord du
système décisionnel qui présente l'ensemble des processus
qui permettent de collecter, d'intégrer, de modéliser et de
présenter les données.
Nous avons également parlé des entrepôts
de données qui constituent le coeur du système décisionnel
jouant un rôle référentiel pour l'entreprise puisqu'il
permet de fédérer des données souvent
éparpillées dans les différentes base de données et
nous avons déployé notre entrepôt de données avec le
SQL Server 2012.
Quant à la conception, nous avons utilisé le
langage de modélisation UML afin de dresser les différents
diagrammes nécessaires à notre travail.
De ce qui précède, nous sommes convaincus que
l'ensemble des préoccupations soulevées à la
problématique de notre travail ont été résolues.
Le but de ce modeste travail est de mettre de mettre en place
un système décisionnel afin d'aider le gestionnaire des
ressources humaines en particulier le Chef du personnel de la Régie des
Voies Aériennes de Kananga d'avoir une vue d'ensemble sur les
informations concernant la gestion du personnel.
Notre contribution dans cette étude était de
réaliser un entrepôt de données pour la gestion du
personnel afin que le Chef du personnel établisse au moment opportun son
rapport et prenne des meilleures décisions dans un très bref
délai.
Enfin, nous disons à nos chers lecteurs que ce travail
étant une oeuvre scientifique et humaine peut avoir des imperfections,
ainsi, vos remarques, critiques et suggestions seront les bienvenues pour sa
perfection car il reste ouvert.
98
BIBLIOGRAPHIE
A. Ouvrages
1. ADIBA .M, Entrepôts de données et fouille
de données, Paris 2002
2. AHMED T., MIQUEL M., LAURINI R., « Continuous data
warehouse : concepts, challenges and potentials », Proc. of the 12th
International Conference on Geoinformatics, 2004
3. Bertino E., Ferrari E., Guerrini G., Merlo I., "Extending
the ODMG Object Model with Composite Objects", OOPSLA'98, Vancouver (Canada),
1998
4. Bret F., Teste O., "Construction Graphique
d'Entrepôts et de Magasins de Données", INFORSID'99, La Garde
(France), Juin 1999.
5. Chaudhuri S., Dayal U., "An Overview of Data Warehousing
and OLAP Technology", ACM SIGMOD Record, 26(1), 1997
6. Dayal U., Blaustein B. T., Buchmann A. P., Chakravarthy U.
S., Hsu M., Ledin R., McCarthy
D. R., Rosenthal A., Sarin S. K., Carey M. J., Livny M.,
Jauhari R., "The HiPAC Project: Combining Active Databases and Timing
Constraints", ACM SIGMOD Record, 17(3), Chicago (Illinois, USA), 1988
7. FREYSSINET J. ; Méthode de recherche en Sciences
Sociales, éd.Mont Chrétien, Paris, 1997
8. G.A. Gorry et M.S. Scott-Morton, « A framework for
management information systems », Sloane Management Review 1971
9. GRAWITZ M. ; Les méthodes des Sciences Sociales,
Paris, édition Dalloz, 1955
10. Groupe EVOLUTION. F. Bret. T. Cruanees. I. Guessarian. E.
Metais. M-C. Rousset. S. Schwer. O. Teste. G. Zurfluh, Ingénerie des
systèmes d'information , édition HERMES, 2001
11. INMON W.-H., Building the data warehouse, QED
Publishing Group, 1992
12. Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P.,
"Fundamentals of Data Warehouses", Ed. Springer Verlag, ISBN 3-540-65365-1,
1999
13. Matthias Jarke, Thomas List, Jörg Köller, The
Challenge of Process Data Warehousing, 26th International Conference on Very
Large Databases, Caire, Egypt, 2000
14. P.F. Drucker, « Managing in a Time of Great Change
(The Post-Capitalist Executive) », Penguin 1995.
15. R. Kimball, L. Reeves, M. Ross, W. Thornthwaite,
Concevoir et déployer un data warehouse, Eyrolles, Paris, 2000
16. S. Kelly, « Data Warehousing - The Route to Mass
Customization », John Wiley & Sons 1996
17. Samos J., Saltor F., Sistrac J., Bardés A.,
"Database Architecture for Data Warehousing: An evolutionary Approach",
DEXA'98, Vienna (Austria), 1998
18. VINCENT GUIJARRO, Les Arbres de Décisions
L'algorithme ID3, lile, 2006
19. Y. Zhuge, H. Garcia-Molina, J. Hammer, J. Widom, "View
Maintenance in a Warehousing Environment", SIGMOD Record, San Jose (USA),
1995
B. Notes de cours et
thèses
1. KAFUNDA KATALAYI JP, Entrepôts des
données, L2 informatique option Gestion, cours inédit, U.K.A
2015-2016.
2. KANGIAMA LWANGI Richard : Extraction des connaissances a
partir d'un entrepôt des données à l'aide de l'arbre de
décision application aux données médicales, UNIKIN
20102011.
99
3. MALENGA M. ; Notes de cours d'initiation à la
Recherche Scientifique, G1 Informatique, USLKA, 2016-2017, inédit
4. MUKADI C. ; Notes de Cours de Méthodes de Recherche
Scientifique, G2 Informatique, USLKA, 2017-2018, inédit
5. RAKOTOMALALA. : Graphes d'induction apprentissage et data
mining, hermès, 2000.THESE
C. Webographie
1.
https://www.wikipédia.com/système
decisionnel/
2.
https://www.memoireonline.com
3.
https://www.cyberzoide.developpez.com
100
Table des matières
EPIGRAPHE I
IN MEMORIAM II
DEDICACE III
REMERCIEMENTS IV
SIGLES VI
LISTE DE FIGURES VII
LISTE DE TABLEAUX VIII
0. INTRODUCTION GENERALE 1
0.1. Choix et intérêt du sujet 2
0.2. Etat de la question 2
0.3. Problématique et hypothèses 3
0.4. Méthodes et techniques 3
0.5. Objectif de la recherche 4
0.6. Délimitation de la recherche 5
0.7. Subdivision du travail 5
CHAPITRE I : GENERALITES SUR LES SYSTEMES DECISIONNELS 6
I.0. Introduction 6
I.1. Présentation du décisionnelle 6
I.2. Définition d'un système décisionnel
6
I.3. Historique des systèmes décisionnels 9
I.4. L'informatique décisionnelle 9
I.5. Définition d'un système décisionnel
(Business intelligence) 9
I.6. Les différents éléments constitutifs
du système décisionnel 11
I.7. Les fonctionnalités d'un système
décisionnel 12
I.8. Les apports des systèmes décisionnels 13
I.9. Les Enjeux De L'informatique Décisionnelle 14
I.10. Les fonctions essentielles de l'informatique
décisionnelle 14
I.11. Définition des Modèles de Données
Décisionnels 17
Conclusion partielle 19
CHAPITRE II: DATA WAREHOUSE 20
II.1. Introduction 20
II.2. Définition d'un data warehouse (DW) 20
II.3. Caractéristiques d'un Data Warehouse 23
II.4 Entrepôts et Bases de données 24
II.5. Schémas d'un Data Warehouse 28
II.6 Le Data Mart 32
II.7 Les Serveurs OLAP (On-Line Analytical Processing) 34
Conclusion partielle 38
CHAPITRE III : LE DATA MINING ET ARBRE DE DECISION 39
III.0 Introduction 39
III.1 Objectifs Du Data Mining 40
III.1.1. Processus Du Datamining 41
III.1.2. Les Tâches Du Datamining 43
III.I.2.1. Les Tâches Et Technique Du Datamining
43
101
III.2. Arbre de décision 44
III .2.1. Introduction à l'arbre de décision
44
III.2.2. Définition 44
III.2.3. Caractéristiques et Avantages 44
III.2.4. Algorithme ID3 45
III.2.5. Principes 45
III.2.6. Exemple Pratique d'un Algorithme ID3 46
III.3 Concepts Théoriques Sur Le Graphe 49
Conclusion partielle 51
CHAPITRE IV : PRESENTATION DU CADRE D'ETUDE ET SPECIFICATION
DE BESOINS 52
VI.1. La Présentation Cadre d'étude 52
IV.2. Spécification de besoins 61
IV.3. Conception 71
IV.4. La conception de diagrammes 76
Conclusion partielle 84
CHAPITRE V : IMPLEMENTATION DE LA SOLUTION 85
V.1. Présentation De L'outil 85
V.2. SQL SERVER 2008 85
V.3. Première partie : Système transactionnel
(OLTP) 85
V.4. Deuxième partie : Système
Décisionnel (OLAP) 88
V.5. Création Source de données 89
V.6. Création Vue de données 92
Création d'une nouvelle dimension 93
V.7. Création du Cube 94
Conclusion partielle 96
CONCLUSION GENERALE 97
BIBLIOGRAPHIE 98
|