Epigraphe
La différence entre la théorie et la pratique,
c'est qu'en théorie,
il n'y a pas de différence entre la théorie et
la pratique, mais
qu'en pratique, il y en a une.
Jan van de Sneptscheut
Dédicace
|
A mes très chers parents, papa BIRAMBOVOTE
Hubert et maman TOTYA KAVIRA, à qui je dois tout. Je ne cesserai de leur
être redevable pour leur amour témoigné en ma faveur. Et si
le monde était à refaire, je vous choisirai toujours comme
parents.
|
Avant-propos et
remerciements
Au terme de notre cursus académique à
l'université de Kinshasa, nous tenons tout d'abord à rendre
grâce à l'ETERNEL, le Dieu Tout
Puissance, auteur de toute vie sur terre de nous avoir accordé
le souffle de vie combien importante.
Nous tenons à remercier le professeur MBUYI
MUKENDI Eugènequi, en dépit de ses multiples
occupations, a accepté de diriger ce travail. Ses remarques pertinents,
ses conseils et sa disponibilité nous ont profondément
marqué. Qu'il en soit vivement remercié.
Notre reconnaissance s'adresse également au chef
des travaux J.D BATUBENGA MWAMBA de nous avoir
encadré pendant toute la rédaction de ce travail, il a
été la lumière quant il faisait noir dans ce travail.
Encore une fois nous te disons merci.
Nous profitons également de cette occasion pour
remercier nos autorités de la faculté des sciences en
général et en particulier celles du département des
mathématiques et informatique, pour le dévouement qu'elles ont
fait montre durant notre parcours au sein de cette faculté pour nous
encadrer. Chers professeurs, recevez l'expression de notre reconnaissance
affectueuse.
Merci, rien que merci, se veut le seul mot que nous
adressons à l'endroit de : Papa MAZANGA FRANCOIS et son
épouse MUHINDO Valley, Papa KANGUNGU Médard et son épouse
Jeannine, Mon cousin MUHINDO Paul.
Mes remerciements s'adressent aussi aux membres de ma
famille particulièrement à mon grand frère MUHINDO
BIRAMBOVOTE, KAMBALE BIRAMBOVOTE Jacques et mon cousin MOBYSSA NGESERA Fabrice,
Ma cousine KINYOMA NICOLE.
Nous ne pouvons les oubliés, nos compagnons de
lutte et toute la promotion de deuxième licence informatique
2012-2013.
Nous ne pouvons clore nos propos sans toutefois remercier
nos amis : ELONJA MPANDOTE Jordan, MBIYA MUTAMBAYI Simms et ZAGABE SERUTI
Claude, KASEREKA MUSUMBA Bienfait.
Vrai et réel merci à vous tous, qui de loin
ou de près avez contribué à la réalisation de ce
travail. Sincèrement recevez nos remerciements.
Liste des
abréviations
BD : Base de données
|
CI : Cellule d'infrastructures
|
DW : Data Warehouse
|
EAI : Enterprise Application Integration
|
ED : Entrepôt de Données
|
ETL : Extract-Transform-Load
|
FTP :File Transfer Protocol
|
HTTP : HyperText Transfer Protocol
|
IT : Information technology
|
ISO : International Organization for Standardization
|
MCD : modèle conceptuel des données
|
MLD : Modèle Logique des données
|
MPD : Modèle Physique des données
|
OLAP : Online Analytical Processing
|
OLTP : Online Transaction Processing
|
SI :Systèmed'Information
|
SIG :
Systèmed'InformationGéographique
|
SGBD :
Système
de Gestion de Base de Données
|
SGBDR :Système de Gestion de Base de
Données Relationnel
|
SMTP : Simple Mail Transfer Protocol
|
SOA : Service-Oriented Architecture
|
SQL :Structured Query Language
|
Tableau des figures et de
tableaux
Liste des figures
|
Figure 1 Structure du SGBD
|
Figure 2 Les deux composants d'un système de bases
de données relationnelles
|
Figure 3 Décideur
|
Figure 4 Exemple d'un cube de données
|
Figure 5 : Composants de base d'un data warehouse
|
Figure 6 Approche architecturale de Bill Inmon
|
Figure 7 Approche architecturale de Ralph Kimball
|
Figure 8 Architecture d'un entrepôt de données
|
Figure 9 Schéma d'un modèle en Etoile
|
Figure 10 schémas du modèle en flocon
|
Figure 11 Exemple d'architecture d'un outil ETL moderne
|
Figure 12 Fonctionnement d'un site web statique
|
Figure 13 Fonctionnement d'un site web dynamique
|
Figure 14 Représentation en mode vectoriel
|
Figure 15 Représentation des données
matricielles
|
Figure 16 Représentation des différents types de
données SIG
|
Figure 17 Organisation et fonctionnement du SIG de la Cellule
d'infrastructure
|
Figure 18 Architecture d'un serveur cartographique sur
internet
|
Figure 19 Modèle Conceptuel de données
|
Figure 20 Modèle Logique de données
|
Figure 21 Modèle physique de données
|
Figure 22 Interface de mise à jour Axe Routier
|
Figure 23 Interface d'enregistrement de données
géographique
|
Figure 24 Carte géographique de Kinshasa
|
Figure 25 Carte géographique de la ville de
Lubumbashi
|
Figure 26 Modèle en étoile de notre
entrepôt de données
|
Figure 27 Architecture globale du système
décisionnel.
|
Figure 28 Processus de chargement de données
|
Figure 29 Schémas de construction de la base de
préparation des données.
|
Figure 30 Présentation du cube
|
Figure 31 Histogramme de coût de SAFRICAS
|
Figure 32 Histogramme de coût par province
|
Liste de tableau
|
Tableau 1 Tableau comparatif de deux philosophies actuelles
|
Tableau 2 : présentation des composantes du
système d'information
|
Tableau 3 Représentation des relations
|
Tableau 4 Tableau de dictionnaire de données
|
Tableau 5 Présentation d'un tableau de bord
|
Tableau 6 Tableau de résultat SAFRICAS
|
Tableau 7 Tableau croisé sous Analysis Services pour
la présentation des statistiques.
|
TABLE DES MATIERES
Epigraphe
Erreur ! Signet non
défini.
Dedicace
Erreur ! Signet non
défini.
Avant-propos et remerciements
iii
Liste des abréviations
iv
Tableau des figures et de
tableaux
v
INTRODUCTION
1
CHAP I LES NOTIONS FONDAMENTALES SUR LES
BASES DE DONNEES
4
1.1 Description
d'une Base de données
4
1.1.1
Définition d'une base de données
4
1.1.2 Type des
bases de données
4
1.1.3 Architecture
d'un SGBD
4
1.1.4
Typologie
5
1.2 L'approche
SGBD
5
1.3 Système
de gestion de bases de données relationnelle
7
1.3.1
Définition
7
1.3.2 Composants
d'un système bases de données relationnelles
7
1.3.3Caractéristique d'un
système de gestion de bases données relationnelle
8
1.4 Le
modèle Entité-Association
8
1.4.1
Définition d'un modèle
entité-association
8
1.4.2
Entités et associations
8
1.4.3 Les types
d'associations
9
1.4.4 Les phases de
la construction d'un modèle de données
9
1.5 Les principaux
systèmes de gestion de bases de données
10
1.6 Le langage de
base de données
10
CHAP II SYSTEME DECISIONNEL [3] [5] [8] [9]
[10] [16] [20] [21]
11
2.1 Notion sur le
décideur
11
2.2.1
Entreprise
11
2.2.2
Décideur
11
2.2.3 Les facteurs
d'amélioration de la prise de décision
12
2.2 Système
d'Information
13
2.2.1
Définition
13
2.2.2 Enjeux du
système d'information
13
2.3 Concepts de
base des systèmes d'aide à la décision
14
2.3.1
Entrepôt de Données (data warehouse)
14
2.3.2 La fouille de
données (Data mining)
15
2.3.3 Modèle
Multidimensionnel
15
2.4 Les Composantes
d'un Entrepôt de Données
16
2.4.1 Objet d'un
entrepôt de données
16
2.4.2
Composantes
17
2.4.3 Architecture
d'un entrepôt de données
21
2.5 La
Modélisation Dimensionnelle
24
2.5.1
Terminologie
24
2.5.2
Schématisation
26
2.6 Les outils de
chargement
28
2.6.1 Le concept
ETL (Extract-Transform-Load)
28
2.6.2 Les
qualités d'un bon ETL
28
2.6.3 Les
catégories d'outil ETL
29
2.6.4 Architecture
d'un outil ETL
29
CHAP III TECHNOLOGIE WEB
[4] [7]
31
3.1 Introduction
à l'Internet et le Web
31
3.1.1
Définition
31
3.1.2 Quelques
dates importantes au sujet du Web
31
3.2 Les
applications Internet classiques
32
3.2.1 HTTP
(L'HyperText Transfer Protocol)
32
3.2.2 SMTP (Simple
Mail Transfer Protocol)
32
3.2.3 FTP (File
Transfer Protocol)
32
3.2.4
Telnet
32
3.3 Fonctionnement
d'un site web
32
3.3.1 Cas d'un site
statique
33
3.3.2 Cas d'un site
dynamique
33
3.4 Les langages du
Web
34
3.4.1
HTML
34
3.4.2
XHTML
34
3.4.3
CSS
34
3.4.4PHP
34
3.4.5
JavaScript
34
CHAP IV : SYSTEMES D'INFORMATION
GEOGRAPHIQUE
36
4.1
Définition
36
4.2 Utilité
d'un SIG
36
4.3
Capacités d'un SIG
36
4.4 Typologie des
Données SIG
37
4.4.1 Les
données géographiques
37
4.4.2Les données
attributaires
38
4.5
Représentation des Données SIG
38
4.5.1
Représentation en mode vectoriel
38
4.5.2
Représentation en mode matriciel (raster)
39
4.6 Modelés
des systèmes d'informations géographiques
40
4.6.1 Le
modèle métrique ou spaghetti
40
4.6.2Le modèle
topologique
41
4.7
l'échelle d'une carte
41
4.8 Sorte de
carte
41
4.9 Concepts
liés aux Géodatabase
42
4.6.1
Définition d'une Géodatabase
42
4.6.2Types de
géodatabase
42
4.10Avantage de serveur SIG
43
4.11 Les
composantes d'un SIG
44
4.12
Fonctionnalités d'un SIG
44
4.13 Domaines
d'applications
45
4.14Le Webmapping (Cartographie
Dynamique)
45
4.14.1Généralités
45
4.14.2Fonctionnement du
WebMapping
46
4.14.3Architecture d'un système de
Webmapping
47
4.14.4Fonctionnalités
48
CHAP V RESEAUX ROUTIES EN RDC
50
5.1
Présentation du secteur
50
5.1.1 Situation des
infrastructures routières en RDC
50
5.1.2 Cellule
infrastructures
51
5.2 Système
d'information existant
53
5.2.1 Critique de
l'existant
53
5.2.2
Motivation
53
CHAP VI : CONCEPTION ET
IMPLEMENTATION
[10] [18]
3
6.1 Aperçue
des différents outils utilisées
54
6.1.1 Les SGBD
utilisées
54
6.1.2 Le serveur
web
55
6.1.3 Le serveur
Google Maps
55
6.2 Application de
webmapping
56
6.2.1 Conception et
modélisation de la base de donnes
56
6.2.2
Présentation des quelques interfaces
61
6.2.3 Quelque code
de l'application
64
6.3
Implémentation de l'entrepôt de
données
70
6.3.1
Modélisation multidimensionnelle
70
6.3.2 Architecture
type du data warehouse
71
6.3.3
Implémentation de la base de données du data
Warehouse
72
6.3.4Chargement de données dans les
dimensions
73
6.3.5 Construction
de la base de préparation
74
6.3.6Chargement de la table
fait
74
6.3.7
Déploiement du cube et analyse
76
CONCLUSION
80
INTRODUCTION
Avec la révolution et le changement que l'informatique
a apporté dans la plus part des secteurs de la vie, la République
Démocratique du Congo pourrait considérablement profité
de ses atouts. Avec son défi de construction et modernisation des
infrastructures routières, l'utilisation des outils modernes de gestion
est d'une grande nécessité.
De son temps, Stanley avait dit « sans le chemin
de fer le Congo (RDC) ne vaut pas un pénis ». A travers
cette pensée, nous pouvons comprendre l'importance de voies de
communication pour ce pays à la dimension continentale.Elle garde tout
son sens pour ce qui est du domaine routier.
En RDC, un bon réseau routier constituera un facteur
important pour la croissance économique. Tous les secteurs de la vie
bénéficieront de la fluidité des trafics et, de la
mobilité des personnes, des biens et des services. Pour le secteur
agricole par exemple, l'acheminement des semences vers les zones agricoles,
l'évacuation des récoltes jusque dans les centres de
transformation et la redistribution vers les consommateurs.
L'enjeu pour la RDC consiste à parvenir à
conserver en bon état les routes existantes et d'en construire de
nouvelles pour permettre le développement économique et
désenclaver l'ensemble du territoire national.
Malheureusement le pays débourse beaucoup d'argent dans
ce secteur pour un résultat non proportionnel. La Cellule
d'Infrastructures, organe du ministère d'Infrastructure, Travaux Public
et Reconstruction en charge de la gestion de passation de marchés et
d'inspection des travaux routiers ne dispose pas d'un système
informatique approprié permettant une gestion informatisée
d'immense données dont elle dispose pour en extraire des
éléments statistiques nécessaires à
l'amélioration de la prise de décision.
Cette défaillance a conduit à:
Ø Une appréciation estimative lors de passation
de marchés qui n'est guère soutenue par des statistiques,
cachées pourtant dans leurs immenses bases de données ;
Ø Une mauvaise cotation des inspecteurs qui sont
senséssuperviser les travaux et procéder aux
contrôles ;
Ø L'absence de mécanisme pour contrer les actes
de corruption qui caractérisent certains fonctionnaires ;
Ø Un déficit de confiance de la population
à l'égard du Gouvernement, car ce dernier continue à
attribuer des marchés à des entreprises de construction qui sont
dépourvues d'expertise et de compétences
avérées ;
Ø Une sous information au sujet de l'évolution
et la maintenance des infrastructures.
Il est alors nécessaire de bien conserver le flux
d'information du réseau routier. Le réseau routier
génère un volume significatif de données complexes qui
nécessite un système efficace pour le stockage, le traitement et
les analyses.
Les questions qui ont motivé notre travail sont
alors :
Ø Comment mettre en oeuvre un Système
Décisionnel qui permettra d'améliorer la prise de décision
du gouvernement congolais à travers la Cellule d'Infrastructures dans le
domaine des infrastructures routières ?
Ø Comment mettre en oeuvre une application de
webmapping qui permettra à toute la population congolaise selon son
centre d'intérêt, d'obtenir via internet une carte
géographique contenant les routes qui sont en cours de construction ou
de réhabilitation ?
C'est pour cette raison que nous avons été
motivé de travailler autour du thème intitulé
« Mise en place d'un Data Warehouse et d'une application de
Webmapping pour la gestion du réseau routier : Cas De la
République Démocratique du Congo».
Notre objectif est d'avoir un système d'aide à
la prise de décision qui permettra à l'Etat congolais d'avoir un
aperçu clair et à temps utile sur la performance des
différents acteurs intervenant activement dans le secteur des
infrastructures, en vue d'une gestion moderne et efficace du réseau
routier.
Le Webmapping permettra à la population d'être
informée sur les routes en cours de réhabilitation ou de
(re)construction.
Parmi plusieurs techniques existantes pour la collecte des
données servant à alimenter notre système informatique,
nous avons eu recours à la technique documentaire et interview qui nous
a permis à déceler les difficultés qui acculent le
secteur, mais aussi apprécier les avancées qui y sont
réalisées.
Pour réaliser ce présent travail, nous nous
sommes inspiré d'une documentation constituée d'un grand nombre
d'ouvrages, notes de cours et articles.
Notre travail comptera au-delà de l'introduction six
chapitres puis une conclusion offrant des perspectives.
Le premier chapitre portera sur les notions de base sur les
Bases de Données, utiles pour ce travail. Il contient des points
essentiels sur les bases de données, le modèle
entité-association et les systèmes de gestion des bases de
données.
Le deuxième chapitre est consacré au
Système Décisionnel. Nous nous focaliserons plus sur les concepts
de base du système décisionnel, ses avantages et sur la
Modélisation Multidimensionnelle.
Le troisième aborde les notions sur les technologies
web. Nous présenterons de manière simple et concise l'essentiel
des langages de programmation et techniques utilisées dans cet univers
du web.
Le quatrième chapitre sera dédié au
système d'information géographique (SIG). Il développera
quelques points essentiels sur le fonctionnement du SIG, son architecture et
le webmapping.
Le cinquième chapitre portera sur la
présentation de la Cellule d'infrastructures en suite sur l'analyse de
leur état de la gestion actuelle.
Le sixième chapitre sera réservé à
la description de notre démarche méthodologique. Nous terminerons
par la mise au point de la solution ainsi que la présentation des
principales fonctionnalités de celle-ci.
CHAP I LES NOTIONS
FONDAMENTALES SUR LES BASES DE DONNEES
[1] [11] [12] [13] [19]
1.1Description d'une Base de
données
1.1.1Définition d'une
base de données
Une base de données permet de stocker et de
récupérer facilement des informations. Ces informations sont
structurées de manière à refléter la
réalité tout en respectant quelques règles (unicité
de l'information, chaque élément doit pouvoir être
identifié de manière unique ...).
1.1.2Type des bases de
données
Il existe de nos jours cinq grands types des bases de
données:
Ø Les bases des données hiérarchiques
Ø Les bases des données réseau
Ø Les bases des données relationnelles
Ø Les bases des données déductives
Ø Les bases des données objets
1.1.3Architecture d'un SGBD
251608064
Figure 1 Structure du SGBD
Le SGBD se décomposer en trois sous-systèmes
:
Ø le système de gestion de fichiers :
Il permet le stockage des informations sur un support
physique.
Ø le SGBD interne :
Il s'occupe du placement et de l'assemblage des
données, la gestion des liens et la gestion de l'accès rapide.
Ø le SGBD externe :
Il s'occupe de la présentation et de la manipulation de
données aux concepteurs et utilisateurs. Il s'occupe de la gestion de
langages de requête élabores et des outils de présentation.
1.1.4Typologie
L'usage qui est fait des données diffère d'une
base de données à l'autre. Les bases de données peuvent
être classifiées en fonction du nombre d'usagers, du type de
contenu, notamment s'il est faiblement ou fortement structuré, ainsi que
selon l'usage qui est fait de la base de données, notamment
l'utilisation opérationnelle ou à des fin d'analyse.
La manière la plus populaire de classer les bases de
données est selon l'usage qui en est fait, et l'aspect temporel du
contenu.
Ø Les bases de données
dites opérationnelles ou
OLTP (de
l'anglais Online Transaction Processing) sont destinées à
assister des usagers à tenir l'état d'activités
quotidiennes. Elles permettent en particulier de stocker sur le champ les
informations relatives à chaque opération effectuée dans
le cadre de l'activité. Dans de telles applications l'accent est mis sur
la vitesse de réponse et la capacité de traiter plusieurs
opérations simultanément.
Ø Les bases de données d'analyse dites
aussi
OLAP (de
l'anglais online analyticalprocessing), sont composées
d'informations historiques telles que des mesures sur lesquelles sont
effectuées des opérations massives en vue d'obtenir des
statistiques et des prévisions. Les bases de données sont souvent
des
entrepôts
de données (anglais datawarehouse): des bases de
données utilisées pour collecter des énormes
quantités de données historiques de manière quotidienne
depuis une base de données opérationnelle. Le contenu de la base
de données est utilisé pour effectuer des analyses
d'évolution temporelle et des statistiques telles.
1.2L'approche SGBD
Cette approche est venue résoudre un problème
de gestion de données. A l'époque c'était l'approche
fichier, il s'est avérée que cette solution avec des
imperfections pour palier à ce souci ; on a inventé une
nouvelle approche qu'on a appelé approche SGBD.
Les objectifs de l'approche SGBD sont :
Ø Indépendance physique :
Le SGBD offre une structure canonique permettant la
représentation des données réelles sans se soucier de
l'aspect matériel.
Ø Indépendance logique :
C'est l'une des innovations, car avec cette
indépendance cette indépendance chaque groupe peut se concentrer
sur ce qui les intéresse. D'où chaque utilisateur a son propre
aperçu lorsqu'il travail.
Ø Manipulation par des langages non-procéduraux
et de haut niveau :
Un SGBD doit permettre d'obtenir des données par des
langages non procéduraux ou non. D'où la facilité pour un
informaticien de l'utiliser. Compatible avec des langages des programmations
(java , C++, pascal, vb , delphi , etc .).
Ø Administration facile des données :
Un SGBD doit offrir des outils pour permettre la mise à
jour des données qui est le premier rôle d'un SGBD
Ø Non redondance des données :
Un SGBD doit permettre d'éviter la redondance des
données, car lorsqu'on élabore une base de
données, on doit tenir compte de l'espace mémoire.
Ø Cohérences des données :
Il doit respecter les contraintes d'intégrité.
Une contrainte d'intégrité est une contrainte sur les
données de la base de données, qui doit toujours être
vérifiée pour assurer la cohérence dans cette base de
données.
Ø Souplesse d'accès aux données
Un SGBD doit permettre d'accéder facilement à
n'importe quelle donnée de la base de données.
Ø Sécurité
Un SGBD doit être capable de protéger les
données qu'il gère contre toute sorte d'agressions
extérieures.
Ø Partage des données
L'importance première d'une base de données est
de partager des données entre plusieurs applications.
1.3Systèmede gestion
de bases de données relationnelle
1.3.1Définition
Un système de gestion de bases de données
relationnelle (relationaldatabase management system, en anglais), SGBDR en
abrégé, souvent appelé simplement système de bases
de données relationnelles, est un système intégré
pour la gestion unifiée des bases de données relationnelles. Un
SGBDR dispose de fonctions utilitaires d'une part, et d'un langage descriptif
pour la définition et la manipulation de données d'autre part.
1.3.2Composants d'un
système bases de données relationnelles
Un système de bases de données relationnelles
est constitué d'un composant de stockage et d'un composant de gestion de
données. Le composant de stockage a pour but de réunir dans des
tables l'ensemble des données et tous les liens qui les unissent. On
distingue d'une part les tables qui contiennent des données appartenant
aux applications des utilisateurs, d'autre part les tables systèmes
indispensables au fonctionnement d'une base de données.
Les tables systèmes contiennent les définitions
de données que les utilisateurs peuvent consulter à tout moment
sans être autorisés à les modifier. Le composant de gestion
comporte essentiellement un langage relationnel de définition et de
manipulation des données. Ce composant englobe aussi des fonctions
utilitaires telles que la restauration de la base de données en cas de
panne, la protection et la sécurité des données.
251607040
Figure 2 Les deux composants d'un système de
bases de données relationnelles
1.3.3Caractéristique
d'un système de gestion de bases données relationnelle
Une base de données relationnelle se caractérise
par les éléments suivants :
Ø Un SGBDR permet une organisation structurée
des données, fondée sur une base formelle claire. Toutes les
informations sont stockées dans des tables. Des dépendances entre
les valeurs d'attributs dans une table, ou la présence d'informations
redondantes sont identifiées.
Ø Un SGBDR dispose d'un langage ensembliste pour la
définition et la manipulation de données. C'est un langage
descriptif qui vise à faciliter la formulation des requêtes par
l'utilisateur en le déchargeant des tâches de programmation.
Ø Un SGBDR garantit une grande indépendance des
données, c'est-à-dire la nette séparation entre celles-ci
et les programmes d'application. Cette propriété résulte
du fait que le composant de gestion dissocie les applications du composant de
stockage dans un SGBDR.
Ø Un SGBDR fonctionne dans un environnement
multiutilisateur en permettant à plusieurs personnes d'interroger ou de
traiter simultanément une même base de données.
Ø Un SGBDR dispose de mécanismes garantissant
l'intégrité des données. Ce terme englobe le stockage de
données sans erreur, la protection contre les destructions, les pertes,
les abus et les accès non autorisés.
1.4 Le modèle
Entité-Association
Définition d'un
modèle entité-association
Un modèle de données est une description
formelle et structurée des données et de leurs relations dans un
système d'information.
Entités et
associations
Une entité est un objet spécifique
(c'est-à-dire qui peut être identifié distinctement parmi
d'autres objets) dans le monde réel ou dans notre pensée. Elle
peut désigner une personne, un objet, un concept abstrait ou un
événement. Les entités de même type forment un
ensemble d'entités caractérisées par un certain nombre
d'attributs.
Pour chaque ensemble d'entités, nous définissons
une clé d'identification, formée d'un attribut ou d'une
combinaison d'attributs, qui permet de distinguer chaque entité de
manière unique.
Les associations désignent les liens qui
existent entre différentes entités.
Les types d'associations
Association simple
Dans une association simple (type 1), à chaque
entité dans l'ensemble d'entités EE_1 correspond «une et une
seule» entité dans l'ensemble EE_2.
Association conditionnelle
À chaque entité dans l'ensemble d'entités
EE_1 correspond «zéro ou une entité»,
c'est-à-dire au plus une entité dans l'ensemble EE_2.
Association multiple
Dans une association multiple (type m), à chaque
entité dans l'ensemble d'entités EE_1 correspondent «une ou
plusieurs» entités dans l'ensemble EE_2.
Association multiple conditionnelle
À chaque entité dans l'ensemble d'entités
EE_1 correspondent «aucune, une ou plusieurs» entités dans
l'ensemble EE_2. Le type d'association multiple conditionnelle distingue du
type d'association multiple par le fait que chaque entité dans EE_1
n'est pas forcément reliée aux entités dans EE_2.
Les phases de la construction
d'un modèle de données
Première phase
La première phase, l'analyse de données, vise
à déterminer, en collaboration avec les utilisateurs, les
données nécessaires à un système d'information,
leurs relations ainsi que la structure des ensembles qui en résultent.
C'est ainsi qu'on parvient à délimiter dès le début
les frontières d'un système. À travers une démarche
itérative, les interviews, l'analyse des besoins, les questionnaires,
les formulaires, etc., doivent permettre de produire une documentation
complète.
Deuxième phase
La deuxième phase d'abstraction vise à concevoir
un modèle entité-association où l'on définit les
ensembles d'entités et les ensembles de liens entre ces entités.
Dans ce modèle, les ensembles d'entités sont
représentés graphiquement par des rectangles, et les ensembles de
liens par des losanges. Il convient de souligner ici qu'il n'est pas toujours
facile d'identifier des ensembles d'entités et de liens ainsi que leurs
attributs de manière unique. Bien au contraire, la phase de conception
exige de la compétence et de l'expérience pratique de la part de
l'architecte de données.
Troisième phase
La troisième phase a pour but de convertir le
modèle entité-association en un schéma de base de
données relationnelle. Définir un schéma de base de
données, c'est fournir une description formelle des objets dans la base
de données considérée. Sachant qu'une base de
données relationnelle n'admet que des tables comme objets, on doit donc
exprimer tous les ensembles d'entités et de liens sous forme de
tables.
1.5 Les principaux
systèmes de gestion de bases de données
Les systèmes de bases de données
non-relationnelles ne satisfont que partiellement aux objectifs que nous venons
de présenter. De ce fait, les systèmes de bases de données
relationnelles ont réussi une percée sur le marché ces
dernières années et continuent à gagner du terrain. On
assiste à une amélioration continuelle de leurs performances
malgré le prix à payer qui découle de la conception
ensembliste du traitement. L'expérience pratique des systèmes de
bases de données relationnelles a donné une impulsion aux
nouveaux développements dans le domaine des bases de données
réparties et des bases de connaissances et de méthodes.
Tellement la liste est exhaustifs, on peut que citez qu'une
partie dont les plus connus sont :
Ø Oracle
Ø Mysql
Ø Sql server
Ø PostgreSQL
Ø Paradox
Ø Sybase
Ø Dbase
Ø Visuel Dbase
Ø Access
1.6 Le langage de base de
données
Pour interroger une base de données, on a besoin d'un
langage de base de données, sur ce le plus connu et les plus
utilisé est le langage SQL (StructuredQuery langage).
C'est un langage conçu par le mathématicien
americaincodd en 1970. Il fait appel à des opérations
élémentaires qui manipulent les tables ainsi que leurs
données. Il prépare la conception de requêtes qui seront
traduite en SQL.
Il est composé de deux types
d'opérateurs :
Ø Relationnels : Sélection, Projection,
Jointure et Division.
Ø Ensemblistes : Union, Intersection,
Différence.
Il existe 4 opérations classiques (ou
requêtes) :
Ø La création (ou insertion).
Ø La modification (ou mise-à-jour).
Ø La destruction.
Ø La recherche.
CHAP II SYSTEME
DECISIONNEL
[3] [5] [8] [9] [10] [16] [20] [21]
2.1 Notion sur le
décideur
2.2.1
Entreprise
Une entreprise est une organisation dotée d'une mission
et d'un objectif métier. Elle doit gérer sa raison d'être
et/ou sa pérennité au travers de différents objectifs
(sécurité, développement, rentabilité). Par voie de
conséquence, cette organisation humaine est dotée d'un centre de
décision.
2.2.2
Décideur
Le décideur est une personne dotée d'un pouvoir
de décision, il peut-être le responsable d'une entreprise, le
responsable d'une fonction ou d'un secteur. Il est donc celui qui engage la
pérennité ou la raison d'être de l'entreprise. Pour ces
raisons, il doit être doté de différents moyens lui
permettant une prise de décision la plus pertinente et la plus
appropriée possible. Parmi ces moyens, les data warehouses ont une place
primordiale et privilégié. En effet, ils contiennent les
données de toute l'activité de l'entreprise jugée utile
pour la prise de décision. Le principal problème réside
dans l'exploitation de ces informations. Pour cela, il est primordial de bien
penser le datamining.
Nous pouvons répartir le décideur sous trois
catégories :
Ø Les décideurs stratégiques
Horizon de travail : Long terme.
Périmètre de travail : Tous les services, tous
les territoires.
Leur rôle : Ces décideurs définissent les
grandes lignes que l'entreprise doit prendre et mobilisent les moyens
nécessaires pour y parvenir. Donc ils orientent la politique et les
valeurs de l'organisation.
Ø Les décideurs tactiques
Horizon de travail : Moyen terme.
Périmètre de travail : un service ou un
territoire.
Leur rôle : les décideurs tactiques sont les
relais des caps stratégiques, fixés par les décideurs
stratégiques.
Ce sont eux qui fixent les objectifs de leur direction ou de
leur territoire, qui élaborent et choisissent la meilleure tactique pour
atteindre ces objectifs.
Ø Les décideurs opérationnels
Horizon de travail : court terme.
Périmètre de travail : un service sur un
territoire.
Leur rôle : faire face à la réalité
du terrain, gérer le quotidien.
À ces trois profils de décideurs s'ajoute celui
des analystes. Le rôle des analystes est de récolter et de
travailler l'information, fiabiliser les données, expliquer les
résultats. Leur rôle est d'aider à la prise de
décision des décideurs. Les analystes varient suivant le type
d'organisation (industrie, négoce, service public...) et le service
auquel ils appartiennent.
251595776
Figure 3 Décideur
Cette classification a de l'importance, car elle va
révéler de grosses différences dans le type d'outils dont
chacun a besoin.
2.2.3 Les facteurs
d'amélioration de la prise de décision
Généralement, on présente les trois
facteurs de prise de décision comme étant :
Ø La connaissance et l'analyse du passé.
Ø La représentation du présent.
Ø L'anticipation du futur.
Les informations permettant d'appréhender ces facteurs
peuvent être de deux natures différentes :
Ø Les informations quantitatives : ce sont toutes les
données chiffrées telles que les montants, quantités,
pourcentages, délais...
Ø Les informations qualitatives : ce sont toutes les
informations non quantifiables telles qu'un commentaire accompagnant un
rapport, des mécontentements, un sentiment, une directive, une nouvelle
procédure...
2.2 Système
d'Information
2.2.1
Définition
Un système d'information (noté SI)
représente l'ensemble des éléments participant à
la gestion, au stockage, au traitement, au transport et à la diffusion
de l'information au sein d'une organisation.
2.2.2 Enjeux du
système d'information
Le système d'information coordonne les activités
de l`entreprise. Il est le véhicule de la communication dans
l'organisation. De plus, le SI représente l'ensemble des ressources et
systèmes (personnes, matériels, logiciels) organisés pour
les objectifs suivants :
Ø Saisie des informations
Ø Stockage des informations
Ø Traitement des informations
Ø Restitution des informations
Ø Transmission des informations
2.2.3 Catégorie
Il existe deux grandes catégories de systèmes
d'information, les systèmes transactionnels et les systèmes
décisionnels. Les premiers servent à gérer le quotidien,
l'opérationnel de l'entreprise. Les seconds sont utilisés pour
prendre du recul, et servir de support aux décisions de l'entreprise et
de ses dirigeants.
2.2.4 Les systèmes transactionnels
(opérationnels)
Ce sont les outils que nous utilisons chaque jour. Ils
assurent le bon fonctionnement de l'ensemble d'organisation.
Toutes ses applications répondent à la
même attente : permettre la saisie d'informations, leur traitement, et la
production en sortie de résultats, sous forme de documents papier, de
consultations à l'écran ou d'autres informations.
Les trois principales caractéristiques d'un
système transactionnel sont donc :
Ø la capacité à gérer de grands
volumes de données,
Ø des temps de réponse très
réduits,
Ø mais des requêtes relativement simples du point
de vue informatique.
2.2.5 Les Systèmes
Décisionnels
Le principe même de la prise de décision est de
s'appuyer sur des informations précises pour en déduire des
comportements et passer à l'action.
Toutes ses applications répondent au même
processus : analyser des données préalablement collectées
par les applications opérationnelles de l'entreprise, les mettre en
forme, aider à distinguer les grandes tendances, et publier des
résultats sous forme de graphiques, de tableaux, ou de rapports.
Les trois principales caractéristiques d'un
système décisionnel sont donc :
Ø la capacité à gérer de grands
volumes de données,
Ø appliquent des requêtes beaucoup plus
complexes,
Ø ils disposent de plus de temps pour les
exécuter.
2.3 Concepts de base des
systèmes d'aide à la décision
2.3.1 Entrepôt de
Données (data warehouse)
Un entrepôt de données (ED) ou data warehouse
(DW) se définit selon W. INMON comme étant un ensemble de
données intégrées, orientées sujet, non volatiles,
gérées dans un environnement de stockage particulier,
historisées, résumées, disponibles pour l'interrogation et
l'analyse et organisées pour le support d'un processus d'aide à
la décision.
De part cette définition nous pouvons relève
plusieurs concept qui caractérise un entrepôt de
données : Intégrées- Orientées sujet - Non
volatiles - Historisées - Résumées
Intégrées
Les données de l'entrepôt proviennent de
différentes sources éventuellement
hétérogènes. L'intégration consiste à
résoudre les problèmes
d'hétérogénéité des systèmes de
stockage, des modèles et de la sémantique de données.
Orientées sujet
Après leur intégration dans une sorte de source
globale, les données sont réorganisées autour de
thèmes tels que : les itinéraire, inspecteur,
matériaux...etc.
Chaque décideur d'une organisation doit disposer d'une
vue sur les informations qui lui sont pertinentes, et qui peuvent influer dans
ses décisions pour une meilleure exploitation de ces données.
Non volatiles
Tout se conserve, rien ne se perd : cette
caractéristique est primordiale dans les ED. En effet, et contrairement
aux bases de données classiques, un ED est accessible en ajout ou en
consultation uniquement. Les modifications ne sont autorisées que pour
des cas particuliers (correction d'erreurs...etc.).
Historisées
La conservation de l'évolution des données dans
le temps, constitue une caractéristique majeure des ED. Elle consiste
à s'appuyer sur les résultats passés pour la prise de
décision et faire des prédictions ; autrement dit, la
conservation des données afin de mieux appréhender le
présent et d'anticiper le futur.
Résumées
Les informations issues des sources de données doivent
être agrégées et réorganisées afin de
faciliter le processus de prise de décision.
Disponibles pour
l'interrogation et l'analyse
Les utilisateurs doivent pouvoir consulter les données
en fonction de leurs droits d'accès. L'ED doit comporter un module de
traitement des requêtes, exprimées dans un langage, doté
d'opérateurs puissants, pour l'exploitation de la richesse du
modèle.
2.3.2 La fouille de
données (Data mining)
Au début des années 60, le data mining
s'appelait l'analyse statique. A la fin des années 80, une
sérié de méthodes éclectiques est venue rejoindre
l'analyse statistique classique : la logique floue, le raisonnement
heuristique et les réseaux neuronaux.
Le data mining fait référence à un
ensemble de techniques d'exploration et d'analyse, par des moyens automatiques
ou semi-automatiques, d'une masse importante de données dans le but de
découvrir des tendances cachées ou des règles
significatives (non triviales, implicites et potentiellement utiles) (Inmon,
1996). Les outils de data mining reposent en général, sur des
techniques basées sur les statistiques, la classification ou
l'extraction de règles associatives.
2.3.2.1 Objectifs du data mining
Les objectifs du Data Mining peuvent être
regroupés dans trois axes importants :
Ø Prédiction (What-if) : consiste à
prédire les conséquences d'un événement (ou d'une
décision), se basant sur le passé.
Ø Découverte de règles cachées :
découvrir des règles associatives, entre différents
événements (Exemple : corrélation entre les ventes de deux
produits).
Ø Confirmation d'hypothèses : confirmer des
hypothèses proposées par les analystes et décideurs, et
les doter d'un degré de confiance.
2.3.3 Modèle
Multidimensionnel
Les modèles basés sur le concept
multidimensionnel, sont les plus appropriés, à capturer les
caractéristiques des DW. Ils permettent en effet, de donner une vision
simple, et facilement interprétable par des non informaticiens, et de
visualiser les données selon différentes dimensions.
Le modèle multidimensionnel contient deux types
d'attributs : les dimensions et les mesures. Les mesures sont les valeurs
numériques que l'on compare, les dimensions sont les points de vue
depuis lesquels les mesures peuvent être observées. La
modélisation multidimensionnelle est illustrée par des cubes de
données ou des hyper cubes.
Mesure
251598848
251597824
Figure 4 Exemple d'un cube de données
2.4 Les Composantes d'un Entrepôt de Données
2.4.1 Objectifs d'un
entrepôt de données
Avant de se plonger dans les détails de composantes
constituant un entrepôt de données. Il convient de s'interroger
sur les objectifs fondamentaux de l'entrepôt de données.
L'atout principal d'une entreprise réside dans la
quantité et qualité d'informations qu'elle possède. Ralph
Kimball, l'un des de précurseur du data warehouse, nous parlent des
objectifs fondamentaux d'un data warehouse, il s'agit de:
Ø Rendre accessibles les informations de
l'entreprise
Le contenu de l'entrepôt doit être
compréhensible et l'utilisateur doit pouvoir y naviguer facilement et
avec rapidité. Ces exigences n'ont ni frontières, ni limites.
Ø Rendre cohérente l'information de
l'entreprise
Les informations provenant d'une branche de l'entreprise
peuvent être mises en corrélation avec celles d'une autre branche.
Si deux unités de mesure portent le même nom, elles doivent alors
signifier la même chose. A I' inverse, deux unités ne signifiant
pas la même chose doivent être définies
différemment.Une information cohérente suppose une information de
grande qualité. Cela veut dire que l'Information est prise en compte et
qu'elle est complète.
Ø Constituer une source d'information souple et
adaptable
L'entrepôt de données est conçu dans la
perspective de modifications perpétuelles. L'arrivée de questions
nouvelles ne doit bouleverser ni les données existantes ni les
technologies.
Ø Représenter un bastion sécurisé
qui protège la valeur de l'information
L'entrepôt de données ne contrôle pas
seulement l'accès aux données, mais il offre à ses
gestionnaires une bonne visibilité des Utilisateurs.
Ø Constituer la base décisionnelle de
l'entreprise
L'entrepôt de données recèle en son sein
les Informations propres à faciliter la prise de décisions. Il
n'y a qu'un seul véritable résultat concret à attendre du
data warehouse : les décisions prises grâce aux données
obtenues.
2.4.2
Composantes
Il est d'une importance primordiale de bien comprendre
séparément les éléments constituant l'environnement
d'un entrepôt de données avant de penser les réunir pour
constituer un entrepôt de données. Toute confusion entre ces
différents éléments peut engendrer un échec certain
de l'ensemble.
L'environnement de l'entrepôt de données comporte
quatre parties différentes :
Ø Les applications opérationnelles
sources ;
Ø La préparation des données ;
Ø La présentation des données ;
Ø les outils d'accès aux données.
2.4.2.1 Les applications opérationnelles
sources
La fonction principale des applications opérationnelles
sources est de permettre les captures des transactions au sein de l'entreprise.
Les principales priorités de ces applications sources sont la
performance des traitements et la disponibilité. Nous devons les
considérer comme extérieur à l'entrepôt de
données, car nous n'avons vraisemblablement guère ou pas du tout
de moyens d'influencer le contenu ou le format des données qu'ils
traitent.
Ce sont les différentes origines d'informations de
divers formats, structurées et non structurées. Il peut s'agir de
base de données, de fichiers plats,...Les sources de données sont
nombreuses, variées, distribuées et autonomes.
2.4.2.2 La préparation des données
C'est ensemble de processus permettant la formalisation de
données en vue de leur intégration puis de leur exploitation au
sein du data warehouse. La préparation inclut tout ce qu'il y a entre
les applications opérationnelles source et la présentation des
données.
En résumé c'est une zone ou le processus de
nettoyage, transformation, combinaison, archivage, suppression des doublons
s'effectue avant leur intégration dans l'entrepôt de
données à l'aide des outils ETL que nous présentons au
point 2.6.
2.4.2.3 La présentation des données
Cette zone de présentation de données est
l'emplacement ou les données sont organisées, stockées et
ouvert aux requêtes des utilisateurs, aux logiciels de reporting. La zone
de présentation est l'entrepôt de données, tel qu'il est
perçu par les utilisateurs.
Il est à noter que la majorité d'entrepôt
de données sont implémentés sur des bases de
données relationnelles, ce qui explique le pourquoi, de
l'omniprésence de principe des bases de données relationnelles.
2.4.2.4 Terminologie
Data mart
Sous-ensemble logique d'un data warehouse. Au-delà de
cette définition relativement simple, on considère souvent le
data mart comme la réduction de l'entrepôt de données
à un seul processus ou à un groupe de processus ciblant un groupe
métier spécifique.
OLAP (Online
AnalyticProcessing)
Activité global de requêtage et de
présentation de données textuelles et numériques contenues
dans l'entrepôt de données ; style d'interrogation et de
présentation spécifiquement dimensionnel. La technologie OLAP est
non relationnelle et presque toujours basée sur un cube de
données multidimensionnelles explicites. Les bases de données
OLAP sont également connues sous le terme de bases de données
multidimensionnelles.
ROLAP (relational
OLAP)
Ensemble d'interfaces utilisateur et d'applications qui
donnent une vision dimensionnelle des bases de données
relationnelles.
MOLAP (Multidimensional
OLAP)
Ensemble d'interfaces utilisateur, d'applications et de
technologies de base de données propriétaires dont l'aspect
dimensionnel est prépondérant.
2.4.2.5 Les outils d'accès aux
données
C'est un ensemble de moyens fournis aux utilisateurs pour
exploiter la zone de présentation en vue de prendre des décisions
basées sur des analyses.
Il est constitué :
Ø D'un outil d'accès aux
données ;
Ø D'un tableur ;
Ø D'un logiciel graphique ;
Ø D'un service d'interface utilisateur.
Systèmes sources
Systèmes opérationnls
ZONE DE PREPARATION DES DONNEES
SERVEURS DE PRESENTATION DU DATA WAREHOUSE
Figure 5 : Composants de base d'un data
warehouse
Stockage
Fichiers plats, SGBDR, Autres.
Traitement
Nettoyage, Transformation, Combinaison, Suppression des doublons,
Purge, Standardisation, Mise en conformité des dimensions.
Stockage temporaire.
(Attente de réplication) Archivage, Exportation vers les
data marts.
Pas de service de requêtage utilisateur
DATA MART N°1
Services de requêtage OLAP (ROLAP et/ou MOLAP)
Dimensionnel
Orienté sujet Implanté localement
Dédié à un groupe d'utilisateurs
Peut stocker des données atomiques Peut être
rafraichi régulièrement Conforme au bus du data warehouse
DATA MART N°2
DATA MART N°3
Outils de requêtage ad hoc
Générateurs d'états
Application utilisateur
Application de modélisation
Prévisions Scoring
Affectation budgétaire
Data miningAutres systèmes à flux descendants
Autres paramètres
Interfaces utilisateurs spécifique
Extraire
Peupler
Répliqur
Récupér
Extraire
Extraire
Alimenter
Alimenter
Alimenter
Alimenter
Peupler
Répliquer
Récupérer
Peupler
Répliquer
Récupérer
Bus décisionnel
Bus décisionnel
Dimensions conformes
Faits conformes
Dimensions conformes
Faits conformes
PORTAIL DE RESTITUTION
Chargement des résultats du modèle
Chargement des dimensions nettoyées
2.4.3 Architecture d'un
entrepôt de données
2.4.3.1 Approche théorique
Dans ce domaine d'entrepôt de données deux
auteurs ont défini deux philosophies sur le plan architectural
différente, il s'agit de : Bill Inmon et Ralph Kimball. Deux
philosophies tout à fait différentes mais qui convergent bien.
Ø L'architecture de haut en bas: selon Bill Inmon,
l'entrepôt de données est une base de données au niveau
détail, consistant en un référentiel global et
centralisé de l'entreprise. En cela, il se distingue du DataMart, qui
regroupe, agrège et cible fonctionnellement les données.
Ø L'architecture de bas en haut: Pour Ralph Kimball,
l'entrepôt de données est constitué peu à peu par
les Data Mart de l'entreprise, regroupant ainsi différents niveaux
d'agrégation et d'historisation de données au sein d'une
même base.
Approche de Bill Inmon
251599872
Figure 6Approche architecturale de Bill Inmon
Approche de Ralph Kimball
251600896
Figure 7 Approche architecturale de Ralph Kimball
|
Ralph Kimball
|
Bill Inmon
|
Processus
|
Bottom-Up
|
Top-Down
|
Organisation
|
Data Mart
|
Data Warehouse
|
schématisation
|
Etoile
|
Flocon
|
Tableau 1 Tableau comparatif de deux philosophies
actuelles
L'architecture d'un ED, représentée dans la
figure 1, s'articule autour de trois phases : l'intégration, la
restructuration, et l'exploitation.
2.4.3.2 Approche pratique
L'architecture d'un entrepôt de données,
représentée dans la figure 7, s'articule autour de trois phases :
l'intégration, la restructuration, et l'exploitation
251601920
Figure 8 Architecture d'un entrepôt de
données
Intégration
Cette première étape, est assez délicate,
car elle consiste à extraire et regrouper les données, provenant
de sources multiples, et hétérogènes. Un certain nombre de
problèmes est à résoudre à ce niveau : les
données doivent être filtrées, triées,
homogénéisées et nettoyées.
Structuration
Cette étape consiste à réorganiser les
données, dans des magasins afin de supporter efficacement les processus
d'analyse et d'interrogation, et d'offrir aux différents utilisateurs,
des vues appropriées à leurs besoins.
Interrogation et Analyse
L'exploitation de l'entrepôt, pour l'aide à la
décision peut se faire de différentes façons, dont :
Ø l'interrogation à travers un langage de
requêtes,
Ø La connexion à des composants de report, pour
des représentations graphiques et tabulaires,
Ø L'utilisation des techniques OLAP
(OnLineAnalyticalProcess ),
Ø L'utilisation des techniques de fouille de
données (Data Mining).
2.5 La Modélisation Dimensionnelle
La modélisation dimensionnelle considère les
données comme des points dans un espace à plusieurs dimensions.
Ces points représentent les centres d'intérêts
décisionnels (sujets) analysés en fonction des différents
axes d'analyse.
2.5.1
Terminologie
2.5.1.1 Concept dimension
Une dimension peut être définie comme l'axe sur
lequel on porte les différentes analyses. Lorsqu'on fait un
schéma de Base de données pour un système d'information
classique, on parle en termes de tables et de relations, une table étant
une représentation d'une entité et une relation une technique
pour établir des liens entre ces entités.
2.5.1.2 Concept fait
Un fait est tout ce qu'on voudra analyser. Les faits, en
complément aux dimensions, sont ce sur quoi va porter l'analyse. Ce sont
des tables qui contiennent les mesures de performance qui relatent la vie de
l'entreprise.
2.5.1.3 Processus de modélisation
La construction d'un entrepôt de données
multidimensionnel est itérative et incrémentale. Au fur et
à mesure de sa construction l'entrepôt de données
doit devenir global et transversal via l'intégration de mesures de
processus clés.
Les étapes de construction d'un entrepôt de
données :
Ø Sélection d'un processus clé ;
Ø Choix de la granularité
stockée ;
Ø Choix des axes d'analyse ;
Ø Détermination du Fait.
Sélection d'un processus clé
Le choix du processus clé doit se faire en fonction de
son importance au sein de l'organisation.
Pour arriver à la sélection de processus
clé vous devez arriver à répondre à un certain
nombre de question :
Ø Quel est l'objectif que nous voulons atteindre avec
la mise en place d'un entrepôt de données par rapport au but
premier de notre entreprise ?
Ø Quels sont les processus qu'il est nécessaire
d'analyser ?
Ø Quels sont les indicateurs de performance,
d'éclairage ou de risque pertinents aux niveaux stratégique,
analytique et opérationnel ?
Ø Quels gains réels pour l'organisation
apporteraient ces décisions ?
Choix de la granularité
stockée
Au niveau de cette étape nous devons faire le choix du
niveau de détail de l'information que nous souhaitons conserver. Prendre
ce qui peutinfluence la prise de décision.
Choix des axes d'analyse
Le but de cette étape est de choisir quels sont les
axes d'analyse adéquats pour le processus en question.
Pour trouver les dimensions adéquates au processus
mesuré, posez-vous les questions suivantes :
Ø à qui ces données
pourraient-elles être utiles ?
Ø comment les analystes regrouperaient-ils les
données ?
Ø comment les analystes filtreraient-ils les
données ?
Ø quels sont les titres de colonne des rapports
actuellement produits ?
Détermination du Fait
Nous devons définir les mesures sur lesquels les
analyses doivent se base .En effet, le système décisionnel se
limitera toujours à des faits tangibles.
Une question est très importante :
Ø Quelles mesures de performance, d'éclairage ou
de risque serait-il pertinent de rattacher à au processus
clé.
2.5.2
Schématisation
2.5.3.1 Le schéma en étoile
Une étoile est une façon de mettre en relation
les dimensions et les faits dans un entrepôt de données. Le
principe est que les dimensions sont directement reliées à un
fait (schématiquement, ça fait comme une étoile).Ce nom
vient faite qu'il y a la table de fait qui jouer le rôle de
l'élément centralisateur sur laquelle les dimensions sont
reliées
251602944
Figure 9 Schéma d'un modèle en
Etoile
Le schéma en étoile est reconnu comme une
approche de Ralph Kimball. Il se prête mieux à la
modélisation des data mart.
Avantage : Lisibilité et performance des
requêtes.
2.5.3.2 Le schéma en flocon
C'est un autre modèle de mise en relation des
dimensions et des faits dans un entrepôt de données. Le principe
étant qu'il peut exister des hiérarchies de dimensions et
qu'elles sont reliées aux faits, ça fait comme un Flocon.
251603968
Figure 10 schémas du modèle en flocon
Ce modèle s'inscrit dans l'approche de Bill Inmon. Son
principal avantage est la performance des Updates et aussi un atout du
côté de l'espace disque.
2.5.3.3 Le schéma en Constellation
Le schéma en constellation consiste à placer
plusieurs schémas en étoile avec des tables de faits
reliées hiérarchiquement. Les liens entre les différentes
tables de faits permettent de visionner les différents niveaux de
détail.
Donc ce schéma consiste à fusionner plusieurs
modèles en étoile qui utilisent des dimensions Communes.
2.6 Les outils de chargement
2.6.1 Le concept ETL
(Extract-Transform-Load)
Extract-Transform-Load est connu sous le terme ETL. Il
s'agit d'une technologie informatique
intergicielle (
logiciel tiers qui
crée un réseau d'échange d'informations entre
différentes
applications
informatiques) permettant d'effectuer des synchronisations massives
d'information d'une base de données vers une autre. Selon le contexte,
on est amené à exploiter différentes fonctions, souvent
combinées entre elles : « extraction »,
« transformation », « constitution » ou
« conversion », « alimentation ».
Elle repose sur des connecteurs servant à
exporter ou importer les
données dans
les applications (ex : connecteur
Oracle ou
SAP...),
des transformateurs qui manipulent les
données(agrégations,
filtres, conversions...), et des mises en correspondance (mappages).
L'objectif est l'intégration ou la réexploitation de
données d'un
réservoir source dans un réservoir cible.
À l'origine, les solutions d'ETL sont apparues
pour le chargement régulier de
données agrégées
dans les
entrepôts
de données (ou datawarehouse), avant de se diversifier
vers les autres domaines logiciels. Ces solutions sont largement
utilisées dans le monde bancaire et financier, ainsi que dans
l'industrie, au vu de la multiplication des nombreuses interfaces.
Des technologies complémentaires sont apparues par la
suite : l'
Intégration
d'applications d'entreprise (EAI), puis l'
ESB (Enterprise
Service Bus).
2.6.2 Les qualités
d'un bon ETL
Les qualités qui caractérisent un bon ETL
sont:
Ø Qu'il accélère le travail de
développement des flux de données :
Permet le découpage d'un flux d'alimentation en une
multitude de petites tâches de transformation de
données distinctes et ordonnancées. L'amélioration de la
productivité vient du fait qu'il est plus facile de traiter une
multitude de problèmes très simples, plutôt que de traiter
un grand problème très compliqué.
Ø Qu'il offre une vision claire et maintenable des flux
réalisés :
Les règles de transformation pouvant être parfois
très compliquées, il est important qu'elles puissent être
représentées simplement afin que n'importe quel informaticien,
disposant d'une formation ETL, puisse lire et comprendre le déroulement
d'un flux de données.
Ø Qu'il puisse se connecter et travailler avec de
nombreuses sources hétérogènes:
Le propre d'un ETL est d'être ouvert et pouvoir disposer
d'une certaine universalité de connexion.
Ø Qu'il soit performant :
Un ETL dispose souvent de fenêtres de traitement
très courtes pour se connecter à un système source et pour
charger l'entrepôt de données. Il faut alors que l'outil traite de
très gros volumes, très rapidement. Le secret de la performance
des outils d'ETL réside généralement dans leur
capacité à travailler et faire les transformations sur les
données en mémoire vive.
Ø Qu'il dispose de nombreuses fonctionnalités de
transformation de données :
En ce qui concerne la lettre T de ETL, proposer de nombreuses
tâches de transformation : calcul, contrôle, mise en
cohérence des données, conversion, pivotement, union, jointure,
nettoyage, regroupement, échantillonnage...
Ø Qu'il puisse se déployer facilement :
Tout se passe au sein de fichiers de configuration qui peuvent
être de natures diverses (XML, base de données...). Les flux se
lancent et se planifient, soit par le biais de l'agent SQL, soit par le biais
d'une ligne de commande exécutable, si vous disposez de votre propre
ordonnanceur d'entreprise.
2.6.3 Les
catégories d'outil ETL
Actuellement il existe trois catégories d'outils ETL
:
Ø Engine-based : les transformations sont
exécutées sur un serveur ETL, disposant en général
d'un référentiel. Ce genre d'outilsdisposent d'un moteur de
transformation ;
Ø Database-embedded : les transformations sont
intégrées dans la BD ;
Ø Code-generators : les transformations sont
conçues et un code est généré. Ce code est
déployablé indépendamment de la base de données
2.6.4 Architecture d'un
outil ETL
Figure 11 Exemple d'architecture d'un outil ETL
moderne
Extraction
Les données appropriées sont obtenues à
partir des sources dans la phase d'extraction. On peut employer l'extraction
statique quand un entrepôt de données a besoin d'être
chargé pour la première fois. Conceptuellement parlant, ceci
ressemble à un chargement instantané des données
opérationnelles. L'extraction par accroissement, employée pour
mettre à jour des entrepôts de données
régulièrement, saisit les changements appliqués aux
données de base depuis la dernière extraction. L'extraction par
accroissement est souvent basée sur la notation maintenue par le
système de gestion de bases de données opérationnel.
Transformation
A chaque table de la base décisionnelle correspond une
table tampon qui contient :
Ø Les colonnes de la table de dimension ou de faits
correspondantes.
Ø Les clés naturelles et les clés de
substitution.
Ø Une colonne Valide de type oui ou non qui dira si le
membre existe déjà ou non.
Chargement
Comme les données sont chargées dans la base
décisionnelle qui est muni d'un schéma relationnel, il faut
charger ses tables dans cet ordre :
Ø D'abord les tables qui ne contiennent aucune
clé étrangère.
Ø Ensuite les tables qui ne contiennent que des
clés étrangères vers des tables déjà
chargées.
Ø Ensuite, pour chaque table, le chargement se
décompose en deux requêtes:
· Une pour les nouveaux membres ou faits.
· Et un pour les membres ou faits modifiés.
CHAP IIITECHNOLOGIE WEB [4]
[7]
Introduction à
l'Internet et le Web
Définition
Internet
Réseau télématique international, issu du
réseau militaire américain Arpanet (conçu en 1969) et
résultant de l'interconnexion d'ordinateurs du monde entier utilisant un
protocole commun d'échanges de données (IP pour Internet
Protocol).
WWW (wide world web)
Le World Wide Web est un grand très grand
systèmed'information réparti sur un ensemble
desitesconnectés par le réseau Internet. Cesystème est
essentiellement constitué dedocuments hypertextes, ce terme pouvant
êtrepris au sens large : textes, images, sons, vidéos, etc. Chaque
site propose un ensembleimportant de documents, transmis sur le réseau
par l'intermédiaire d'unprogramme serveur.
Site web
Un site ou site web (de l'anglais web
site, qui se traduit littéralement en français par site de
la toile) est un ensemble de
pages web
hyperliens entre
elles et accessible à une
adresse web. On dit
aussi site internet par
métonymie,
le
World Wide
Web reposant sur l'
Internet.
3.1.1 Quelques dates
importantes au sujet du Web
Ø En 1991, Tim-Berners Lee, un chercheur du CERN a
créé le système de Hypertexte afin d'aider la
communauté des physiciens d'énergie de partager les
informations
Ø En 1993, National Center of Supercomputing
Applications lance la 1ère version de Mosaic
Ø En 1996, la guerre des navigateurs (Internet Explorer
gagne en 1999). Ainsi le web ne fait que prendre de l'ampleur.
3.2 Lesapplications
Internet classiques
3.2.1 HTTP (L'HyperText
Transfer Protocol)
L'HyperText Transfer Protocol, plus connu sous l'
abréviation HTTP
littéralement « protocole de transfert
hypertexte »
est un
protocole de
communication
client-serveur développé
pour le
World Wide Web.
HTTPS (avec S
pour secured, soit « sécurisé ») est la
variante du HTTP sécurisée par l'usage des
protocoles
SSL ou
TLS.
3.2.2 SMTP (Simple Mail
Transfer Protocol)
SMTP a été l'une des premières
applications Internet. Il définit une messagerieélectronique
relativement simple, qui se sert des adresses Internet, où la
deuxième partie représente le nom du domaine qui gèrele
serveur de messagerie.
3.2.3 FTP (File Transfer
Protocol)
FTP est un protocole de transfert de fichiers, qui permet de
garantir une qualité de service. Le transfert s'effectue entre deux
adresses extrémité du réseau Internet. L'application FTP
est de type client-serveur, avec un utilisateur, ou client, FTP et un
serveurFTP.
3.2.4 Telnet
Telnet est une application de connexion à distance, qui
permet de connecter un terminal à une machine distante. C'est
l'application de terminal virtuel.
3.3 Fonctionnement d'un
site web
L'Internet est un réseau composé d'ordinateurs.
Ceux-ci peuvent être classés en deux catégories.
Ø Les clients : ce sont les
ordinateurs des internautes. Votre ordinateur fait donc partie de la
catégorie des clients.
Ø Les serveurs web: Il s'agit des
serveurs permettant à des clients web d'accéder à
l'application à partir de tout navigateur (exemple internet explorer).
Installé sur leur poste connecté à internet/intranet
distant du serveur. Un serveur web a donc pour rôle d'interpréter
les requêtes http arrivant sur le port associé par défaut
le port 80 et de fournir une réponse par le même protocole.
3.3.1 Cas d'un site
statique
Avec un site statique. Cela se passe en deux temps :
Ø Le client demande au serveur à voir une page
web ;
Ø Le serveur lui répond en lui envoyant la page
réclamée.
251604992
Figure 12Fonctionnement d'un site web statique
Sur un site statique, il ne se passe rien d'autre. Le serveur
stocke des pages web et les envoie aux clients qui les demandent.
3.3.2 Cas d'un site
dynamique
Lorsque le site est dynamique, il y a une étape
intermédiaire : la page est générée par un serveur
web.
Ø Le client demande au serveur à voir une page
web ;
Ø le serveur prépare la page spécialement
pour le client ;
Ø le serveur lui envoie la page qu'il vient de
générer.
Figure 13Fonctionnement d'un site web dynamique
La page web est générée à chaque
fois qu'un client la réclame. C'est précisément ce qui
rend les sites dynamiques vivants : le contenu d'une même page peut
changer d'un instant à l'autre.
3.4 Les langages du Web
3.4.1 HTML
Le langage HTML tire son origine du langage SGML (Standard
GeneralizedMarkupLanguage). Il s'agit d'untype particulier d'annotations
destiné au WWW et qui correspond à une collection de styles
reconnaissables parles navigateurs. Un navigateur (en anglais "browser") est
donc un logiciel qui interprète à l'écran lescommandes
HTML contenues dans un document accessible sur le WWW.
3.4.2 XHTML
Le XHTML est une évolution du HTML, initiales de «
HypertextMarkupLanguage », c'est-à-dire langage de marquage
hypertexte. Cela signifie que la mise en place d'une page web (titres,
paragraphes, images...) utilisera des caractères pour marquer
d'une certaine façon les différentes parties du texte.
Parmi ces caractères de marquage, certains
correspondront à des liens vers d'autres pages web : ce sont des liens
hypertexte. Le « X » de XHTML vient de XML, soit «
eXtensibleMarkupLanguage », langage plus complexe et plus strict que le
HTML. C'est lui qui a inspiré la transition du HTML vers la forme plus
rigoureuse qu'est le XHTML.
3.4.3 CSS
CSS, cela signifie « Cascading Style Sheets », ce
qui se traduit en Français par feuilles de style en cascade. La feuille
de style fournit la mise en forme des éléments de la page, qui
auront été écrits en XHTML. Elle s'applique à une
ou plusieurs pages du site.
Le terme « en cascade » indique que la mise en forme
d'une page peut faire appel à plusieurs feuilles de style. Les
différentes propriétés affectées à un
même élément s'ajoutent alors pour lui donner sa mise en
forme finale.
Lorsque deux propriétés se contredisent, des
règles de priorité s'appliquent et c'est
généralement le dernier style défini qui est pris en
compte.
3.4.4 PHP
PHP (PHP HypertextPreProcessor) est un langage de
programmation. PHP est à l'origine un langage de script conçu
spécifiquement pour agir sur les serveurs web. En ajoutant quelques
lignes de PHP à une page HTML, le serveur exécute les
instructions correspondantes pour écrire du code HTML à la place,
code qui est ensuite envoyé au client de la même manière
qu'un site statique.
3.4.5
JavaScript
Le Javascript est un langage de programmation de scripts
orienté objet. Le Javascript est à ce jour utilisé
majoritairement sur Internet, conjointement avec les pages Web (HTML ou XHTML).
Le Javascript s'inclut directement dans la page Web (ou dans un fichier
externe) et permet de dynamiser une page HTML, en ajoutant des interactions
avec l'utilisateur, des animations, de l'aide à la navigation, comme par
exemple :
Ø Afficher/masquer du texte ;
Ø Faire défiler des images ;
Ø Créer un diaporama avec un aperçu
« en grand » des images ;
Ø Créer des infobulles.
Le Javascript est un langage dit client-side,
c'est-à-dire que les scripts sont exécutés par le
navigateur chez l'internaute (le client). Cela diffère des langages de
scripts dits server-side qui sont exécutés par le serveur Web.
C'est le cas des langages comme le PHP.
NB : Cette liste n'est qu'une portion des langages
utilisés dans le web
CHAP IV : SYSTEMES
D'INFORMATION GEOGRAPHIQUE
[2] [6] [14]
4.1 Définition
Un SIG peut être défini comme:
Ø Un système informatique permettant de
gérer, d'analyser et d'afficher des informations géographiques ;
Ø Un système informatique permettant, à
partir de diverses sources, de rassembler et d'organiser, de gérer,
d'analyser et de combiner, d'élaborer et de présenter des
informations localisées géographiquement, contribuant notamment
à la gestion de l'espace ;
Ø Un outil informatique permettant la production de
cartographie à partir d'une base de données spatialisée ;
4.2 Utilité d'un
SIG
La gestion de l'environnement s'effectue au fil de
décisions qui, dans de nombreux cas, reposent sur des critères
géographiques et portent sur des enjeux territoriaux. Il est donc
logique d'avoir recours à l'information géographique, sous
forme de cartes, d'images de la Terre ou de relevés terrain, afin
d'éclairer la prise de décision.
Les applications SIG sont utilisées en raison de leurs
atouts professionnels et leur capacité à exploiter de nombreuses
informations et ressources SIG. Soucieuses de fournir des informations et des
fonctionnalités géo spatiales transversales, la plus part
d'organisations étendent la portée des SIG bureautiques à
l'aide de solutions SIG serveur qui fournissent des contenus et des fonctions
via des services Web.
Ainsi, le rôle du SIG est de proposer une
représentation plus ou moins réaliste de l'environnement spatial
en se basant sur des primitives géographiques telles que des points, des
arcs, des polygones (vecteurs) ou des maillages (raster). A ces primitives
sont associées des informations qualitatives telles que la nature
(route, voie ferrée, forêt, etc.) ou toute autre information
contextuelle.
Bref, l'information géographique peut être
définie comme l'ensemble des descriptions d'un objet et de sa position
géographique à la surface de la Terre.
4.3 Capacités d'un
SIG
Un SIG doit, quel que soit le domaine d'application,
répondre aux 5 questions suivantes:
Ø Où ?
Ø Quoi ?
Ø Comment ?
Ø Quand ?
Ø Et si ?
Où: permet la mise en évidence
de la répartition spatiale des objets.
· Où cet objet, ce phénomène se
trouve-t-il ?
· Où se situe le domaine d'étude et quelle
en est l'étendue
· Où se situe le domaine d'étude et quelle
en est l'étendue géographique?
· Mieux: où se trouvent tous les objets d'un
même type et/ou d'autres types ?
Quoi: permet la mise en évidence des
objets/phénomènes présents sur un territoire
donné.
· Que trouve-t-on à cet endroit ?
· Quels objets peut-on trouver sur l'espace
étudié?
Comment: met en évidence les relations
existant ou non entre les objets et/ou les phénomènes ?
· comment les objets sont répartis dans l'espace
étudié, et quelles sont leurs relations? C'est relatif à
l'analyse spatiale.
Quand:
· Quels sont l'âge et l'évolution de tel
objet/phénomène?
· Quels sont l'âge et l'évolution de tel
objet/phénomène?
· A quel moment des changements sont.C'est relatif
à l'analyse temporelle.
Et si: Quelles conséquences
affecteraient les objets et/ou phénomènes concernés du
fait de leur localisation ?
· Que se passerait-il s'il se produisait tel
événement?
· Que se passerait-il si tel scénario
d'évolution se produisait ?
4.4 Typologie des
Données SIG
Nous pouvons classifier les données SIG en deux grandes
catégories à savoir les données géographiques et
les données attributaire
4.4.1 Les données
géographiques
Une donnée est dite géographique si on peut la
localiser soit directement par ses coordonnées géographiques ou
indirectement par son adresse postale ou par son identifiant cadastral.
Nous pouvons subdiviser les données
géographiques en trois catégories à savoir les
données géométriques, les données graphiques et les
métadonnées.
Ø les données
géométriques : Elles renvoient à la
forme et à la localisation des objets ou phénomènes.Toute
représentation cartographique passe par la traduction des
éléments réels que l'on observe (la voirie, la route) en
objets géométriques qui sont de trois types :
· le point (x, y) : il peut représenter des
arbres, des bornes, des collecteurs d'ordures, ...
· la ligne((x1, y1), ..., (xn, yn)) : elle peut
représenter une route, de ligne de réseaux de
télécommunication, ....
· le polygone ou surfacique : elle peut
matérialiser une entité abstraite comme la surface d'un pays,
d'une forêt, un lac, ...
NB : x et y représentent les
coordonnées géographiques du point. Il s'agit ici des
coordonnées terrestres qui considèrent la terre comme une
sphère, mais une sphère imparfaite soit un ellipsoïde.
L'ellipsoïde est la surface mathématique qui permet de calculer les
coordonnées géographiques d'un lieu en Longitude et en
latitude.
Ø les données
graphiques : Elles caractérisent la présentation
apparente de l'objet.
Ø
les métadonnées : Ce sont les
informations sur l'origine et le propriétaire d'une donnée
géographique.
4.4.2 Les données
attributaires
Elles représentent les caractéristiques ou
propriétés propres à un objet ou à un
phénomène en dehors de sa forme ou de sa localisation. Il peut
s'agir par exemple des informations portant sur l'adresse postale d'un site
géographique.
4.5 Représentation
des Données SIG
Il existe deux modes de représentation des
données géographiques : le mode vecteur et le mode matriciel
(raster).
4.5.1
Représentation en mode vectoriel
La représentation vectorielle consiste à
représenter une entité géographique par un objet
graphique, aussi appelé cartographique. Un bâtiment peut ainsi
devenir un point, une rivière peut devenir une ligne, un lac un
polygone, etc.
En mode vectoriel, le point avec ses coordonnées est le
porteur de l'information géométrique. Les lignes et les surfaces
se comprennent comme une suite définie de points
caractéristiques.
Figure 14 Représentation en mode vectoriel
4.5.2
Représentation en mode matriciel (raster)
Les données raster ont comme élément
essentiel le pixel (Picture élément). Les pixels sont
répartis dans un raster de façon régulière en
lignes et colonnes comme indique la figue 19 ci-dessous. Les lignes et les
surfaces ne peuvent être représentées que par
l'enchaînement de pixel unique. Un objet ne peut donc être
représenté que de façon approximative; c'est ainsi que la
taille du pixel-raster (résolution spatiale) conditionne l'exactitude de
la représentation.
251612160
Figure 15 Représentation des données
matricielles
NB: La donnée raster ou maillée
donne une information en chaque point du territoire.
Les différentes techniques d'acquisitions des
données raster sont :
Photo aérienne
La photo aérienne est la principale source de
nombreuses données géographiques. Elle s'obtient à partir
d'appareils photo ou cameras aéroportés qui fournissent des
détails importants sur la surface de la terre.
La photo aérienne peut être scannée,
corrigée par des méthodes de photogrammétrie des
déformations d'échelles pour en obtenir une ortho
photographie ; elle peut être aussi numérique
c'est-à-dire directement exploitable par un SIG. Dans tous ce cas, la
précision de la photo aérienne dépend de la dimension du
plus petit détail visible on parle alors de la notion de
résolution.
Image satellitaire
C'est une image issue des prises de vue des capteurs
embarqués dans de satellites d'observation placés sur orbites de
la terre. Lorsque l'image est obtenue par le reflet du rayonnement solaire dans
le domaine du visible par les objets situés au sol, on parle d'image
optique (En référence à la
télédétection optique). Il peut s'avérer que
l'image est obtenue par un objet au sol à une onde envoyée par le
satellite, on parlera plutôt d'image radar en référence
à la télédétection RADAR.
Plan scanné ou carte scannée
Un plan scanné est une image issue de la
numérisation d'un plan ou carte sur support papier déjà
traité et exploité.
4.6 Modelés des
systèmes d'informations géographiques
Fondamentalement on dispose de deux types de modèle
à savoir :
Ø Le modèle métrique ou spaghetti
Ø Le modèle topologique
4.6.1 Le modèle
métrique ou spaghetti
Le format dénommé « spaghetti »
désigne habituellement l'absence de structuration topologique. Le
modèle le plus simple consiste à stocker les
éléments graphiques sans aucune structure : les points, les
arcs, les libelles, sont digitalisés comme dessin. Seule l'indication
d'un niveau, ou d'un attribut graphique (comme une couleur ou un type de
symbole), permet de différencier l'appartenance à une
collection.
Ces modèle ne conservent pas la topologie, mais
permettent en général de le reconstituer en utilisant les
références entre les objets.
4.6.2 Le modèle
topologique
Un des avantages des systèmes d'information
géographique est que les relatons entre les objets peuvent être
calculées et donner naissance à des points d'intersection. C'est
la topologie.
Nous avons deux niveaux topologiques :
La topologie de réseau, décrit la relation entre
des ensembles linéaires (polyligne) par leurs extrémités
qui sont les noeuds.
La topologie de voisinage permet à partir des arcs
constituant le polygone de connaître les voisins de chaque surface.
4.7 l'échelle d'une
carte
Échelle numérique : rapport entre la
représentation figurée d'une longueur et sa longueur
réelle correspondante.
Échelle graphique : ligne graduée indiquant le
rapport des dimensions ou distances marquées sur un plan, une carte avec
les dimensions ou distances réelles.
Pour représenter une distance entre deux villes sur une
feuille de papier, il faut utiliser un moyen mathématique qui s'appelle
l'échelle.
L'échelle permet de réduire les distances
réelles relevées sur le terrain pour les représenter sur
une carte.
Le cartographe adopte pour cela une unité de valeur
numérique.Par exemple, si l'échelle choisie est de 1/25 000, 1 cm
sur la carte est égal à 25 000cm (ou 250 m) sur le terrain ;
dans ce cas, pour dessiner une route de 1 km, il faudra dessiner un trait de 4
cm sur la carte.
4.8 Sorte de carte
L'utilisation des données géographiques et des
cartes ne date pas d'hier. Dès les débuts de la colonie, les
explorateurs effectuaient des mesurages sur le territoire pour faire les
subdivisions en seigneuries, gérer les infrastructures portuaires et
militaires ou localiser les routes maritimes et terrestres.
Il existe plusieurs sortes de carte qui se regroupent en deux
grands ensembles :
Ø Les cartes topographiques sont
utilisées pour représenter des régions terrestres avec
leurs caractéristiques naturelles à savoir les montagnes, les
cours d'eau et celles créées par l'homme, les routes, les villes,
ainsi que leurs frontières ;
Ø Les cartes thématiques
donnent de l'information sur des thèmes particuliers comme la carte
routière, la carte d'utilisation du sol, la carte géologique, la
carte forestière, etc.
4.6 Concepts liés
aux Géodatabase
4.6.1 Définition
d'une Géodatabase
Il s'agit d'un ensemble de jeux de données
géographiques de différents types stockés dans un dossier
système de fichiers commun, une base de données Microsoft Access
ou une base de données relationnelles multiutilisateurs (comme Oracle,
Microsoft SQL Server, PostgreSQL ou IBM DB2).
Les géodatabases fonctionnent avec une gamme
étendue d'architectures et de systèmes de fichiers SGBD et
peuvent varier en taille et en nombre d'utilisateurs.
Elles vont des petites bases de données
mono-utilisateurs aux géodatabases d'entreprise, de département
ou de groupe de travail, plus volumineuses, auxquelles ont accès de
nombreux utilisateurs.
251609088
Figure 16 Représentation des différents
types de données SIG
4.6.2 Types de
géodatabase
Il existe trois types de géodatabase :
La géodatabase personnelle
Une géodatabase personnelle utilise le moteur de bases
de données Microsoft Jet, et peut donc être assimilée
à une base de données de type Access pour les données
attributaires.
Ce format concerne des bases de données
géographiques allant jusqu'à 2 Go d'espace-disque.
Une géodatabase personnelle peut être lue par
plusieurs utilisateurs, mais éditée par un seul d'entre eux. De
plus, elle ne supporte pas le versionnement.
Enfin, elle ne permet de gérer que des relations de
topologie simples et temporaires.
Tous les produits ESRI (ArcView, ArcEditor, ArcInfo) peuvent
la lire et l'éditer sans extension.
La géodatabase multiutilisateurs
La géodatabase multiutilisateurs peut fonctionner avec
plusieurs types de modèles de bases de données, comme IBM DB2,
Informix, Microsoft SQL Server, Oracle...
Ce format est destiné à des bases de
données lourdes (au-delà de 2 Go), qui doivent être lues et
éditées par de multiples utilisateurs. D'où la gestion du
versionnement.
Géodatabases fichier
Elles sont stockées sous forme de dossiers dans un
système de fichiers. Aucune limite ne s'applique à la taille des
géodatabases.
4.7 Avantage de serveur
SIG
Les serveurs SIG offrent les avantages suivants :
Ø Des économies d'échelle importantes et
de meilleures performances via le déploiement et l'utilisation du SIG
dans toute l'organisation.
Ø Des ressources informatiques SIG gérées
et partagées de façon centralisée et accessibles à
de nombreux utilisateurs.
Ø Une gamme d'applications et d'outils clients assez
souples pour gérer n'importe quelle tâche ou mission, par exemple,
l'accès au SIG via un navigateur, des périphériques
mobiles, des applications de mise à jour, Arc GIS Explorer, des
applications bureautiques SIG et des applications cartographiques grand public
fournies par Google et Microsoft.
Ø Intégration à d'autres systèmes
de l'entreprise, tels que la gestion des ressources client ou la gestion
globale de l'entreprise à l'aide d'interfaces logicielles et de
méthodes conformes aux normes. Les serveurs SIG permettent de
spatialiser une architecture orientée sur les services (SOA).
Ø Possibilité de créer des applications
personnalisées à l'aide d'environnements de programmation
standard (par exemple, .NET, Java, SOAP, REST, JavaScript, AdobeFlex, etc.).
Ø Un ensemble commun de services de carte et SIG
partagés qui assurent une gestion cohérente des informations et
une vue opérationnelle commune.
Ø Des services de catalogue SIG, un partage de
données et des services de téléchargement des
données pour gérer l'accès aux informations
partagées.
Ø Prise en charge des normes
d'interopérabilité à la fois dans les domaines SIG (par
exemple, OGC et ISO) et plus largement des technologies de l'information (IT)
(par exemple, W3C).
4.8 Les composantes d'un
SIG
Un SIG est constitué de 5 composantes majeures
Ø Logiciel
Ø Matériels
Ø Procédures
Ø Personnel
Ø Réseaux
4.9 Fonctionnalités
d'un SIG
Figure 17 Organisation et fonctionnement du SIG de la
Cellule d'infrastructures
Un SIG a trois volets ci-après :
Ø le volet GEODATABASE
(geographicdatabase) : le SIG est la base de données spatiale contenant
des jeux de données qui représentent des informations
géographiques selon un modèle de données SIG
générique (entités, rasters, topologies, etc.)
Ø le volet GEOVISUALISATION : le SIG
est un ensemble de cartes intelligentes et de vues qui montrent des
entités et leurs relations à la surface de la terre. Il
élabore différentes vues cartographiques des informations
géographiques utilisables comme des " fenêtres ouvertes sur la
base de données " permettant d'effectuer des requêtes, des
analyses et de modifier les informations.
Ø le volet GEOTRAITEMENT : le SIG
comprend des outils de transformation des informations qui produisent les jeux
de données existants. Les fonctions de géo traitement partent des
informations contenues dans les jeux de données existants, appliquent
des fonctions analytiques et écrivent les résultats dans de
nouveaux jeux de données.
4.10 Domaines
d'applications
Ø Gestion de l'environnement et du territoire;
Ø Cartographie statistique;
Ø Cartographie dynamique
Ø Urbanisation et gestion urbaine, cadastres;
Ø Risques/catastrophes naturels;
Ø Sante;
Ø Télécommunications;
Ø Génie civil;
Ø Gestion côtière;
Ø Océanographie; etc.
4.1 Le Webmapping
(CartographieDynamique)
4.14.1
Généralités
LeWebmapping désigne, au sens
large, tout ce qui relève de la cartographie en ligne sur Internet. Sous
ce terme générique, on englobe différents types
d'applications cartographiques allant du simple visualiseur à l'outil de
cartographie thématique, voire au SIG en ligne. Leur point commun est
d'être accessible à travers un simple navigateur Internet. Le
passage au web dynamique permet de dépasser le
téléchargement de cartes statiques et d'accéder à
des données géographiques contenues sur un serveur cartographique
(bases de données ou fichiers SIG), voire de superposer des couches
d'information aux données en local. Le webmapping est alors synonyme de
cartographie dynamique, l'utilisateur pouvant interagir avec différentes
applications cartographiques via Internet.
On trouve dans cette rubrique des applications cartographiques
concernant des thèmes aussi variés que l'agriculture, l'eau,
l'environnement, les moyens de communication, la politique... Les outils de
cartographie en ligne offrent de plus en plus de possibilités
d'animation et d'interaction pour l'internaute. Les formats sont devenus
interopérables, de sorte que les données peuvent être
partagées, échangées, modifiées par
différents groupes ou organisations.
4.14.2 Fonctionnement du
WebMapping
Comme vous pouvez remarquer sur la figure ci-dessous, un
serveur SIG possède les principales fonctions suivantes : le stockage,
le traitement et la diffusions des cartes et informations géographiques
via le réseau internet.
Figure 18Architecture d'un serveur cartographique sur
internet
Le stockage
Pour bien assurer sa fonction de stockage, le serveur SIG
possède deux couches :
· Une couche dédiée aux données
supportées par un SGBD géographique à l'instar de Mysql
avec MyGIS, PostGresql avec son extension Post Gis, ou Oracle avec Oracle
spatial etc....
· Des images géo référencées
comme des cartes géographiques.
Le traitement
Un SIG web est doté s'un serveur web et d'un serveur de
scripts (PHP, JSP, ASP, ...) qui le rendent capable d'assurer le traitement des
requêtes.
SIG, au-delà du stockage des données,
c'est-à-dire la possibilité d'effectuer des requêtes
à composante spéciale :
· Inclusion, juxtaposition, croisement
· Calculs de distance, zone
· Mise à jour des données graphiques et
attributaires
· Assemblage et habillage graphique des couches
d'information pour obtenir une carte
La diffusion
Le serveur SIG va donc ajouter aux fonctions habituelles d'un
serveur internet des fonctions supplémentaires en relation avec la
gestion et le traitement de données graphique de
référencées.
Le serveur SIG doit être capable de fournir
l'information géographique adapte à l'écran de
l'utilisateur.
Le datamining
Le datamining est l'ensemble de techniques d'extraction
d'information d'ordre prévisionnel à partir de grandes bases de
données.
Pour arriver à exploiter ces quantités
importantes de données, le datamining utilise des méthodes
d'apprentissages automatiques.
Ces méthodes sont de deux types :
· les techniques descriptives
· les techniques prédictives
4.14.3 Architecture d'un
système de Webmapping
Figure 19 Architecture d'un service de Web Mapping
L'architecture d'un système de Webmapping est
généralement de type client/serveur. Ce système repose
principalement sur les trois composantes suivantes :
Ø Client
Ø Serveur cartographique
Ø Serveur de données
Client
Le client est, dans le cadre du Web Mapping, sous la forme
d'une application web. C'est lui qui permet l'interrogation des serveurs
cartographiques. Les clients utilisent un certain nombre d'outils
développés à base de différentes
bibliothèques (Javascript, Java...), Open Source ou non, tournés
vers la cartographie.
Il existe différents clients qui permettent à
l'utilisateur de visualiser des cartes
géo-référencées depuis une page web tels que Google
maps, Bing Map, OpenLayers...
Serveur cartographique
Un serveur cartographique est un serveur spécifique qui
permet la réalisation de cartes
géo-référencées. Il crée des images de
cartes à l'aide de données spécifiques, stockées
sur les serveurs de base de données mis à leur disposition. Ces
images de cartes sont envoyées aux clients intéressés.
Il existe deux types de serveurs cartographiques :
· Les serveurs cartographiques libres où le code
source est à disposition du grand public, ce qui permet
d'héberger et d'administrer son propre serveur cartographique chez soi
comme GeoServerou MapServer.
· Les serveurs cartographiques semi-libres qui ne
permettent que d'être requêtés comme Google Map Server ou
encore Bing Map Server.
Serveur de données
Les serveurs de données utilisés pour faire de
la cartographie en ligne ne sont autres que des Systèmes de Gestion de
Base de Données Relationnel et Objet (SGBDRO) améliorés
qui introduisent des extensions de données spatiales expriment toutes
les informations concernant la localisation et la forme de
particularités géographiques, ainsi que les rapports.
4.14.4
Fonctionnalités
Le Webmapping permet l'affichage de cartes sur internet mais
pas seulement. Il offre un large panel de fonctionnalités liées
à la cartographie en ligne :
Ø Le Webmapping offre la possibilité de voir
n'importe quelle carte du monde entier en deux dimensions et depuis peu en
trois dimensions.
Ø Les cartes peuvent être de différents
types, plan ou satellite, en y intégrant plusieurs vues possibles
superposables comme le relief, les routes ou encore les noms de villes. A ceci
s'ajoutent des options réalisables en temps réel sur la carte
comme le zoom ou le déplacement.
Ø Il est possible de placer des marqueurs sur une
carte, c'est-à-dire qu'il est possible d'indiquer un emplacement
précis sur une carte, à l'aide de ses coordonnées, comme
un lieu ou un bâtiment.
Ø Il est également possible de calculer et
visualiser un itinéraire sur une carte en ligne.
CHAP V RESEAUX ROUTIES EN
RDC
[15] [17]
5.1 Présentation du
secteur
Le secteur de la voirie implique beaucoup d'organes tant
gouvernementaux qu'internationaux à son sein. Sur ce nous allons
présenter privément la situation des infrastructures
routières et le principal organe dans ce domaine qui est la cellule
infrastructures qui est sous tutelle du Ministère des Infrastructures
Travaux publics et Reconstruction.
Si ce travailler a été réalisé ce
grâce au concours de ces différentes organes que nous avons pu
approcher.
5.1.1 Situation des
infrastructures routières en RDC
Le réseau routier de la RDC comprend au total 153.209
km de routes répartis comme suit :
Ø 58.509 km de routes d'intérêt
général, à charge du Ministère des Infrastructures,
Travaux Publics et Reconstruction, placés sous la gestion de l'Office
des Routes « OR en sigle », dont environ 3.000 km sont
revêtus.
Il comprend les ouvrages de franchissement suivants :
· 3.500 ponts de portée de 4 à 750
mètres pour une longueur totale de 68.000 mètres,
· 175 bacs (à moteur, à traille et à
pirogues)
Ø 7.400 km de voiries urbaines sous la gestion de
l'Office des Voiries et Drainage « OVD en sigle » ;
Ø 87.300 km de routes d'intérêt local ou
de desserte agricole à charge du Ministère du
Développement Rural, sous la gestion de la Direction des Voies de
Desserte Agricole « DVDA en sigle ».
Répartition du réseau des Routes
d'Intérêt Général
Le réseau des routes d'intérêt
général se réparti en 3 catégories selon leur
importance :
Ø 21.140 km des routes nationales
(RN),
Ø 20.124 km des routes provinciales
prioritaires (RPP),
Ø 17.245 km des routes provinciales secondaires
(RPS).
Réseau prioritaire
Le Ministère des Infrastructures, Travaux Publics et
Reconstruction a défini un réseau prioritaire de 23.140
km, qui présente les caractéristiques principales
suivantes :
Ø il s'articule sur les 3 principaux corridors de
transport - Ouest/Nord-Est, Nord/Sud, Ouest/Sud-Est - qui relient les
chefs-lieux des Provinces et les principaux centres administratifs ;
Ø il draine à lui seul 91% du trafic routier
;
Ø il fait jonction avec le réseau ferré
et fluvial ;
Ø il dessert toutes les zones à fortes
potentialités économiques et densité de population ;
Ø il comprend les principales voies
d'intégration régionale.
De ce réseau prioritaire, il a été
extrait un réseau ultra-prioritaire de 15.836 km à rouvrir
d'urgence pour contribuer à la réunification et à la
relance économique du pays.
5.1.2 Cellule
infrastructures
5.1.1.1 Historique
La Cellule Infrastructures est un organe technique du
Ministère des Infrastructures Travaux publics et Reconstruction,
dotée d'une autonomie administrative et financière.
Elle a été créée en 2004 par
arrêté ministériel n° CAB/TPI/024/MN/FK03/2004 du
07/10/2004 sur initiative du Gouvernement de la RDC, de laCommission
européenne et de la Banque Mondiale.
5.1.1.2 Objectif
L'objectif de la cellule infrastructures est la coordination
sectorielle et l'appui institutionnel au Ministère des
Infrastructures Travaux publics et Reconstruction, principalement
dans son rôle de maîtrise d'ouvrage.
La Cellule Infrastructures fournit donc
un service conseil au MITPR dans la conception, la mise en
oeuvre et le suivi des investissements dans le secteur des
infrastructures. A ce titre, elle intervient principalement en tant que:
Ø Maître d'ouvrage délégué
pour les projets d'infrastructures financés par les partenaires
traditionnels ;
Ø Représentant du maître
d'ouvrage ;
Ø Levier de pilotage et de réintégration
vers les structures publiques pérennes du MITPR de la maîtrise
d'oeuvre des projets d'infrastructures, précédemment
externalisée ;
Ø Interface et coordination avec les partenaires
bilatéraux et multilatéraux.
5.1.1.3 Structure organique
La Cellule Infrastructures est dirigée par un
Coordonnateur et un Coordonnateur adjoint. Elle comprend en son sein:
Cinq sections
opérationnelles :
Ø Routes ;
Ø Voiries;
Ø Bâtiments Publics ;
Ø Appui Institutionnel;
Ø Administration et Finances.
Cinq services
spécialisés :
Ø Passation de Marchés ;
Ø Gestion Financière ;
Ø Audit Interne ;
Ø Gestion Environnementale et Sociale ;
Ø Système d'Information Géographique.
5.1.1.4 Autres organe intervenant dans ce
domaine
Vu le caractère transversal des infrastructures, la
Cellule Infrastructures agit en partenariat avec plusieurs structures et
entités de la République Démocratique du Congo,
notamment :
Ø L'Office des Routes (OR) ;
Ø L'Office de Voirie et Drainage (OVD) ;
Ø Le Bureau d'Etude et d'Aménagement Urbain
(BEAU) ;
Ø Le Bureau Technique de Contrôle (BTC) ;
Ø Le Groupe d'Etude du Transport (GET) ;
Ø Le Groupe d'Etude en Environnement du Congo
(GEEC) ;
Ø Le Comité Technique de Réformes (CTR)
du Ministère des Finances ;
Ø La Direction des Infrastructures du Ministère
du Plan ;
Ø La Direction des Voies de Desserte Agricole
(DVDA) ;
Ø L'Agence Congolaise de Grands Travaux
(ACGT) ;
Ø L'Unité de Coordination des Projets
(UCOP) ;
Ø Le Bureau de Coordination des Marchés des
Infrastructures (BCMI).
5.2 Système
d'information existant
Niveau
|
Existant
|
Matériels
|
Plusieurs ordinateurs de bureau
|
Une machine serveur
|
Un réseau LAN
|
Logiciels
|
ArcGIS
|
La gamme Microsoft
|
Traitement
|
Il dispose d'un logiciel leur permettant de produire
automatiquement des cartes géographiques. Sur ce point, il est
informatisé.Mais en ce qui concerne notreproblématique, le
traitement n'est pas encore mise en place.
|
Moyen humains
|
Le moyen humain est vraiment important. Les données
viennent de diverse source et ils sont sensés les intègres dans
le Geodatabase.
|
Tableau 2 présentation des composantes du
système d'information.
5.2.1 Critique de
l'existant
A l'issu d'analyses et recherches effectuées dans les
installations de la Cellule d'infrastructures, nous avons constaté des
problèmes majeurs.
Ø La cellule d'infrastructures est incapable de nos
jours de nous dire :
· Une route a été réhabilitée
combien de fois pendant un intervalle des temps.
· Quelles sont les performances des entreprises
intervenant dans la construction du réseau routier congolais ?
· Sur Quellesdonnées empiriquesse base la CI pour
l'attribution de marché des constructions du réseau routier
congolais ?
Ø La population n'est pas informée des blocages,
délabrement ou de la réhabilitation des infrastructures
routières du pays.
5.2.2
Motivation
Au regard des difficultés constatée au sein de
la Cellule d'Infrastructure, nous avons envisagé la mise en place d'un
système décisionnel afin d'améliorer la prise de
décision. Notre pays, étant en pleine reconstruction des
infrastructures, pour un besoin d'efficacité dans la gestion de ce
domaine, mettre en place un Entrepôt des Donnée est vraiment
opportun.
Avec cette infrastructure, la CI sera en mesure de centraliser
toutes les informations concernant le réseau routier enfin d'en
déduire des informations nécessaires pour améliores la
prise de décision.
Un autre atout pour ce projet concerne directement la
population. En effet, par une application de webmapping connectée au
système, elle sera au courant de toute information sur les
infrastructures du pays et des éventuels aménagements.
CHAP VI :CONCEPTION ET
IMPLEMENTATION
[10][18]
6.1 Aperçue des
différents outils utilisées
6.1.1 Les
SGBDutilisées
Pour notre application de webmapping nous avons utilisé
MySQL 5.5.20, le choix s'explique par les avantages que ce SGBD nous offre.
Reconnu comme le
meilleur gestionnaire des données par les ImpactsAwards 2011 de PHP
architect, MySQL reste le SGBD le plus utilisé dans le web.
Parmi les avantages de ce dernier nous pouvons citer :
Ø Coût total d'exploitation faible. Le
déploiement de MySQL pour des applications essentielles permet une
économie de coûts significatifs par rapport à d'autres
SGBD.
Ø Évolutivité et performance.
Satisfaction des contraintes d'évolutivité et de performance des
sites Internet les plus visités et des applications les plus
exigeantes.
Ø Il est open source.
Malheureusement MySQL ne permet pas de faire du Business
Intelligence, sur ce nous avons cherché un notre SGBD pouvant nous
offrir ce service, et notre choix se penche sur SQL Server un produit de
Microsoft. Notre choix a été motivé du faite que SQL
Server est un produit qui a fait déjà ses preuves, départ
sa puissance et sa stabilité dans le décisionnel.
L'offre Microsoft BI est structurée autour des trois
prouesses du décisionnel :
Ø Améliorer l'accès et la qualité
des données : on y retrouve tous les outils destinés à
concevoir un entrepôt de données bien modélisé,
performant et contenant des données fiabilisées.
Ø Gagner en finesse d'analyse et de
compréhension de données : on y retrouve tous les outils qui
permettent aux utilisateurs finaux d'analyser et de naviguer dans leurs
données en toute autonomie, sans avoir à recourir au service
informatique.
Ø Gérer les performances de l'organisation et de
ses politiques : on y retrouve tous les outils destinés
àpartager, à communiquer et à organiser les performances
de l'organisation tels que les outils de tableaux de bord et les outils
d'intranet.
Pour mettre en place un système d'aide à la
décision,Microsoft offre un ensemble d'outils:
Ø SQL Server Integration Services : l'ETL.
Ø SQL Server Master Data Services : le gestionnaire de
données de référence.
Ø SQL Server Analysis Services : la base de
données multidimensionnelle (OLAP) et le méta modèle.
Ø SQL Server Reporting Services : l'outil de reporting
opérationnel et de reporting de masse.
6.1.2 Le serveur
web
Trois arguments nous poussent de choisir le serveur
apache :
Ø C'est le serveur le plus utilisé.
Ø un serveur en OpenSource, gratuit,
évolutif.
Ø le meilleur choix pour l'instant pour
développer en multiplateforme.
Le succès des logiciels libres ne s'explique pas par
leur prix mais par leur qualité, plus d'un million de sites Web
fonctionne avec Apache Selon une enquête "récente" menée
en 2013, le serveur gratuit Apache a dépassé un million de sites
administrés, soit 48% des sites Web devant Microsoft IIS (21,7%) et
Netscape Enterprise (9,6%).
6.1.3 Le serveur Google
Maps
Google Maps est un serveur gratuit de cartographie en
ligne. Le service a été créé par
Google. Lancé en
2004 aux
États-Unis et
au
Canada et en 2005
en
Grande-Bretagne (sous
le nom de Google Local), Google Maps a été lancé jeudi 27
avril 2006, simultanément en
France,
Allemagne,
Espagne et
Italie.
Google Mapsutilise des images satellites et des photographies
aériennes de haute altitude pour une meilleure précision couvrant
la totalité de la surface terrestre. Google Maps par ailleurs propose
une API qui permet aux développeurs web par une bibliothèque de
fonctions JavaScript et au format de fichier KML d'intégrer des cartes
et de pouvoir créer des cartes personnalisées pour leurs
applications. C'est cette opportunité que nous avons saisie pour
intégrer à notre plateforme la cartographie basée sur
Google Maps. La contrainte c'est que notre plateforme doit être
connectée à Internet pour bénéficier de ses
avantages.
6.2 Application
dewebmapping
6.2.1 Conception et
modélisation de la base de donnes
6.1.1.1 Le modèle conceptuel des
données
6.1.1.1.1 Identification des objets
Après des analyses approfondies, nous avons
identifié les entités ci-après:
Ø Axe routier
Ø Entreprise
Ø Inspecteur
Ø Route
Ø Paramètre géographique
Ø Province
6.1.1.1.2 Identification et description des
relations
Les relations trouvent entre les différentes
entités sont les suivantes :
Ø Avoir
Ø Localiser
Ø Réhabiliter
Ø Observer
Ø Peut avoir
N°
|
Relation
|
Objets associes
|
1
|
avoir
|
Routes-Axe Routier
|
2
|
Localiser
|
Province-Axe Routier
|
4
|
Réhabiliter
|
Entreprise-Axe Routier
|
5
|
Observer
|
Inspecteur-Axe Routier
|
6
|
Peut avoir
|
Paramètre géo-Axe Routier
|
Tableau 3 Représentation des relations
6.1.1.1.3 Définition des contraintes des
cardinalités et d'intégrité fonctionnelle
En informatique, les contraintes ce sont les nombres
d'occurrences minimales et maximales d'objet qui participent à une
relation.
N°
|
Objet1
|
Cardinalité1
|
Relation
|
Cardinalité2
|
Objet2
|
1
|
Route
|
1,n
|
avoir
|
1,1
|
Axe Routier
|
2
|
Province
|
1,n
|
Localiser
|
1,n
|
Axe Routier
|
4
|
Entreprise
|
1,n
|
Réhabiliter
|
1,1
|
Axe Routier
|
5
|
Inspecteur
|
1,n
|
Observer
|
1,n
|
Axe Routier
|
6
|
Paramètre géo
|
1,1
|
Peut avoir
|
1,n
|
Axe Routier
|
Tableau 3 Présentation des contraintes de
cardinalités et d'intégrité fonctionnelle
1,n
251641856
Figure 19modèle conceptuel de données
2516500486.1.1.1.1 Présentation du
modèle conceptuel de données
1,n
Province
Idpro
nompro
251616256251631616251621376251622400
Parametregeo
Idpar
Comm_par
Longitude
latitude
251613184
1,n
251649024251619328
Axeroutier
idaxe
Nomaxe
Comm_axe
Taille_axe
Cout
Duree
Date_debut
Date_fin
251614208251635712
Localiser
251628544251636736
Réhabiliter
251629568
1,n
251676672
1,n
251644928
1,1
251642880
1,n
251645952
1,n
251646976
1,1
251643904
1,1
251640832251639808251638784
Peut avoir
251625472251637760251632640251634688251633664251630592
Observer
251627520
Avoir
251626496251623424
Inspecteur
idins
Matricule
Nomobs
Postnom
E-mail
251617280
Routes
idroute
Nomroute
Comm_route
Type_route
Nbredekm
251615232251624448251620352
Entreprise
identre
Nomentre
Numphone
Adresse
Siteweb
E-mail
2516183046.1.1.2 Modèle logique de
données
Province
idpro
nompro
251654144251659264251661312
Inspecteur
#idins
Matricule
Nomobs
Postnom
E-mail
251655168
Routes
#idroute
Nomroute
Comm_route
Type_route
Taille_route
251653120251662336251658240
Entreprise
#identre
Nomentre
Numphone
Adresse
Siteweb
E-mail
251656192
Parametregeo
Idpar
Comm_par
Longitude
Latitude
#idaxe
251651072251667456251665408
Figure 20modèle logique de données
251674624251660288251668480
Axeroutier
idaxe
Nomaxe
Comm_axe
Taille_axe
Coût
Duree
Date_debut
Date_fin
#idroute
#identre
251652096251664384251672576
Observer
idlocalise
#idins
#idaxe
251671552251663360251670528
Localiser
idlocalise
#idpro
#idaxe
251669504251666432251657216251673600
6.1.1.1 6.1.1.3 Le modèle physique de
données
Figure 21 Modèle physique de données
Fig.18 modèle physique de données
6.2.2 Présentation
des quelques interfaces
6.2.2.1 Interface Administrateur
Interface d'enregistrement Axe routier
Figure 22 Interface de mise à jour Axe
Routier
Après s'être loguer, l'administrateur aura une
interface d'accueil pour naviguer dans l'application en vue de mettre à
jour les données.
Comme nous pouvons l'apercevoir sur cette interfaceà
gauche,nous avons notre menu principal qui nous permettra de passer d'une
interface à une autre. La partie droite représente notre
formulaire qui permettra de saisir les données relatives à l'axe
routier.
Interface d'enregistrement de paramètre
géographique
Figure 23 Interface d'enregistrement de données
géographique
Sur cette interface nous aurons la possibilité
d'insérer les cordonnées géographique d'une
itinérairedans notre base de données MySQLqui correspondra
à un axe qui est en cours de réhabilitation.
Comment vous pouvez le remarquer, le nombre de ligne
Paramètre géo correspond au nombre de ligne de notre tableau dans
lequel on effectue la saisie.
6.2.2.2 Interface internaute
251679744
Figure 24 Carte géographique de Kinshasa
La carte sur la figure suivante représente la vie de
Kinshasa, nous pouvons nous apercevoir des traits rouges qui
représentent les itinéraires qui sont en cours de
réhabilitation dans la ville de Kinshasa.
NB : On a eu à utiliser de données test
pour donner l'aperçu.
251680768
Figure 25 Carte géographique de la ville de
Lubumbashi
6.2.3 Quelque code de
l'application
Classe connexion à la base de
données
<?php
ClassgoogleConnexion{
static function Connexion(){
try{
$bkas = new PDO('mysql:host=localhost;dbname=geodata', 'root',
'');
return$bkas;
}
catch (Exception $e)
{
echo 'Impossible de se connecter au serveur';
die('Erreur : ' . $e->getMessage());
}
}// Fin de la fonction
}// Fin de la class
?>
Code JavaScript permettant de créer la carte et
dessiner le parcours
varlatlng = new google.maps.LatLng(-4.323303, 15.308161);
var options = {
center: latlng,
zoom: 20,
mapTypeId: google.maps.MapTypeId.ROADMAP
};
var carte = new
google.maps.Map(document.getElementById("carte"),
options);
Dans Google Maps les coordonnées sont sous formes de
latitude et de longitude. La librairie Google Maps met àdisposition un
constructeur permettant de créer un objet de classe
google.maps.LatLng(lat:number,lng:number) qui prend en paramètre des
nombres représentant, respectivement, la latitude et la longitude.
var traceParcours = new google.maps.Polyline({
path: parcours,//chemin du tracé
strokeColor: "#FF0000",//couleur du tracé
strokeOpacity: 1.0,//opacité du tracé
strokeWeight: 2//grosseur du tracé});
Code html de l'Interface d'accueil
<?php
include("connexion/connexion.php");
$conn =new googleConnexion();
$rep = $conn->Connexion();
/*$rep ;*/
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0
Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html;
charset=iso-8859-1" />
<link rel="stylesheet" media="screen" type="text/css"
title="Design" href="css_jsp/design.css" />
<script language="JavaScript" src="css_jsp/jquery.js"
type="text/javascript"></script>
<script language="JavaScript" src="css_jsp/j_scode.js"
type="text/javascript"></script>
<title>GeoServer</title>
</head>
<body>
<div id="gauche">
<div id="logo"><imgsrc="images/logo.png" width="200"
height="50" /></div>
<p></p>
<center>
<table>
<tr>
<td><a
href="accueil.php?nav=1"><imgsrc="images/b_home.png" width="16"
height="16" /></a></td>
<td><a
href="accueil.php?nav=2"><imgsrc="images/b_sqlhelp.png" width="16"
height="16" /></a></td>
<td><a
href="accueil.php?nav=3"><imgsrc="images/b_docs.png" width="16"
height="16" /></a></td>
<td><a
href="accueil.php?nav=4"><imgsrc="images/s_reload.png" width="16"
height="16" /></a></td>
</tr>
</table>
</center>
<p></p>
<div class="menu">
<table>
<tr>
<td><imgsrc="images/b_selboard.png" width="16"
height="16" /></td><td> <a
href="accueil.php?nav=1">Accueil</a></td>
</tr>
<tr>
<td><imgsrc="images/b_selboard.png" width="16"
height="16" /></td><td> <a
href="accueil.php?nav=5">Axe Routier</a></td>
</tr>
<tr>
<td><imgsrc="images/b_selboard.png" width="16"
height="16" /></td><td> <a
href="accueil.php?nav=6">Entreprise</a></td>
</tr>
<tr>
<td><imgsrc="images/b_selboard.png" width="16"
height="16" /></td><td> <a
href="accueil.php?nav=7">Inspecteur</a></td>
</tr>
<tr>
<td><imgsrc="images/b_selboard.png" width="16"
height="16" /></td><td> <a
href="accueil.php?nav=8">Route</a></td>
</tr>
<tr>
<td><imgsrc="images/b_selboard.png" width="16"
height="16" /></td><td> <a
href="accueil.php?nav=9">Province</a></td>
</tr>
</table>
</div>
</div>
<div id="droit">
<div class="entete">
<table>
<tr>
<td><imgsrc="images/s_host.png" width="16"
height="16" /></td>
<td>localhost</td>
</tr>
</table>
</div>
<div class="corpss">
<div class="menuAj">
<table>
<tr>
<td><a href="#"><imgsrc="images/OK.gif"
width="20" height="20" /></a></td>
<td><a href="#"><imgsrc="images/RECHERCHE.gif"
width="20" height="20" /></a></td>
<td><a href="#"><imgsrc="images/AJOUTE.gif"
width="20" height="20" /></a></td>
<td><a href="#"><imgsrc="images/FERMER.gif"
width="20" height="20" /></a></td>
</tr>
</table>
</div>
<fieldset>
<legend>Axe Routier</legend>
<table>
<tr>
<td>Nom</td><td><input name="nomaxe"
type="text"/></td>
<td>Nom route</td><td>
<?php
include("comboR/nomroute.php");
?>
</td>
</tr>
<tr>
<td>Commentaire;</td><td><input
name="commtaxe" type="text"/></td>
<td>Entreprise</td><td>
<?php
include("comboR/entreprise.php");
?>
</td>
</tr>
<tr>
<td>Date début</td><td><input
name="date_debut" type="date"/></td>
<td>Privince</td><td>
<?php
include("comboR/province.php");
?>
</td>
</tr>
<tr>
<td>Date fin</td><td><input name="nom"
type="date_fin" /></td>
<td> Nombre
de ligneParametre geo</td><td><input name="nbrligne"
type="text"/></td>
</tr>
<tr>
<td>Coût</td><td><input name="cout"
type="text" placeholder="En Dollars"/></td>
<td></td><td></td>
</tr>
<tr>
<td>Taille de l'axe</td><td><input
name="taille" type="text" placeholder="Km"/></td>
<td></td><td></td>
</tr>
</table>
</fieldset>
<div class="tabl">
</div>
</div>
</div>
</body>
</html>
Classe de mise à jour axe routier
<?php
Class miseajouraxe{
public function supprimerAxe($idaxe){
$bkas->exec('DELETE FROM axeroutier WHERE
idaxe=\''.$idaxe.'\'');
echo 'Suppression effectuer';
}
public functionenregistrerAxe($nomaxe, $commtaxe,
$date_debut, $date_fin, $cout, $taille, $duree, $idroute, $identre, $pro){
$bkas->exec('INSERT INTO
axeroutier(idaxe,nomaxe,comm_axe,taille_axe,idroute,identre,date_debut,date_fin,cout,Duree)
VALUES(NULL, \''.$nomaxe.'\', \''.$commtaxe.'\', \''.$taille.'\',
\''.$idroute.'\', \''.$identre.'\', \''.$date_debut.'\', \''.$date_fin.'\',
\''.$cout.'\', \''.$duree.'\')');
echo 'enregistrement effectuer';
}
public functionmodifierAxe($idaxe,$nomaxe, $commtaxe,
$date_debut, $date_fin, $cout, $taille, $duree, $idroute, $identre, $pro){
$bkas->exec('UPDATE axeroutier SET
nomaxe=\''.$nomaxe.'\',comm_axe=\''.$commtaxe.'\',date_debut=\''.$date_debut.'\',date_debut=\''.$date_fin.'\',cout=\''.$cout.'\',duree=\''.$duree.'\',taille=\''.$taille.'\'
WHERE idaxe=\''.$idaxe.'\'');
echo 'Modification effectuer';
}
}
?>
6.3 Implémentation
de l'entrepôt de données
6.3.1 Modélisation
multidimensionnelle
6.3.1.1 Les dimensions
Les données du réseau routier seront analysables
par les utilisateurs suivant cinq dimensions, il s'agit :
Ø Dimension Route
Ø Dimension Province
Ø Dimension Inspecteur
Ø Dimension Entreprise
Ø Dimension Temps
6.3.1.2 Les faits
Selon les problématiques posent nous sommes abouti au
choix des mesures suivantes sur lesquelles seront portés les analyses.
Ø Coût
Ø La taille
Ø La durée
6.3.1.3 Modèle
Dim_Province
Id_DW_province
Id_nat_province
nomprovince
Dim_Inspecteur
Id_DW_Inspecteur
Id_nat_Inspecteur
Nominspecteur
Numphone
Dim_Route
Id_DW_Route
Id_nat_Route
Nomroute
Nomaxeroutier
Comm_route
Comm_axe
Type_route
Entreprise
Id_DW_Entreprise
Id_nat_Entreprise
Nomentreprise
Fait
Id_DW
Id_DW_Province
Id_DW_Temps
Id_DW_Entreprise
Id_DW_Inspecteur
Id_DW_Route
Cout
Duree
Taille
Dim_Temps
Id_DW_temps
Id_nat_temps
Année
Mois
Trimestre
Semestre
Figure 26Modèle en étoile de notre
entrepôt de données
6.3.1 6.3.2 Architecture
type du data warehouse
Tableau croisé dynamique de Excel
Figure 27 Architecture globale du système
décisionnel.
6.3.3
Implémentation de la base de données du data
Warehouse
Outils utilisé : Microsoft SQL Server 2008
Ø SQL Server Management Studio
Dictionnaire des données
Tables
|
Attributs
|
Type de données
|
Rôle
|
Dim_Route
|
Id_DW_Route
Id_nat_Route
Nomroute
Nomaxeroutier
Type_route
Date_debut
Date_fin_fin
|
bigint
float
nvarchar(50)
nvarchar(50)
nvarchar(10)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Dim_Inspecteur
|
Id_DW_Inspecteur
Id_nat_Inspecteur
Nominspecteur
Post_nom
Numphone
Date_debut
Date_fin
|
bigint
float
nvarchar(30)
nvarchar(30)
nvarchar(30)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Dim_Entreprise
|
Id_DW_Entreprise
Id_nat_Entreprise
Nomentreprise
Date_debut
Date_fin
|
bigint
float
nvarchar(30)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Dim_Temps
|
Id_DW_temps
Id_nat_temps
Date
Année
Trimestre
Mois
|
bigint
float
smalldatetime
nvarchar(4)
nvarchar(4)
nvarchar(12)
|
Clé de l'entrepôt
Clé d'entreprise
|
Dim_Province
|
Id_DW_province
Id_nat_province
nomprovince
Date_debut
Date_fin
|
bigint
float
nvarchar(50)
smalldatetime
smalldatetime
|
Clé de l'entrepôt
Clé d'entreprise
Date pour l'historisation
Date pour l'historisation
|
Tableau 4 Tableau de dictionnaire de
données
6.3.4 Chargement de
données dans les dimensions
Outils utilisé :
Ø Microsoft SQL Server 2008
· SQL Server Integration Services
Ø Microsoft Office
· Microsoft Office Excel 2007
Procédure
Toutes les dimensions, excepté la dimension temps, sont
des dimensions à variation lente. Les sources de données sont des
fichiers Excel que nous avons exportés de notre base de données
MySQL. Nous avons utilisé le processus d'intégration des ETL tel
qu'implémenté dans SQL Server Intégration Services.
Exemple d'un processus de chargement pour la dimension
route :
Figure 28 Processus de chargement de
données
Chargement de la dimension Temps
Une particularité pour cette dimension, nous l'avons
généré automatiquement en fixant notre plage
d'étude entre 2007 et 2013. Car nos données test correspondent
à cette plage.
6.3.5 Construction de la
base de préparation
Ø Outils: MySQL, Microsoft Office Excel 2007, SQL
Server Integration Services
- Création de la vue de préparation pour
extraire les données qui correspondant aux clés d'entreprise et
les mesures.
MySQL
- Nettoyage de données
- Requête SQL pour l'ajout des champs
- Vérification de la cohérence
Excel
Chargement des données dans la table T_Préparation
de la base de données du Data warehouse avec le processus de copie de
colonne après mappage.
SQL Server Integration Services
Figure 29: Schémas de construction de la base
de préparation des données.
6.3.6 Chargement de la
table fait
La tâche, à ce niveau est facilitée par la
base de préparation déjà chargée de données.
La source de donnée est le résultat d'une requête SQL. Ce
dernier est alors copié dans la table des faits après mappage des
colonnes.
SELECT DISTINCT
dbo.Dim_Inspecteur.id_DW_inspecteur,
dbo.Dim_Route.id_DW_route, dbo.Dim_Temps.id_DW_temps,
dbo.Dim_Province.id_DW_province,
dbo.Dim_entreprise.id_DW_entreprise, dbo.T_Preparation.cout,
dbo.T_Preparation.duree, dbo.T_Preparation.taille_axe
FROM dbo.Dim_InspecteurINNER JOIN
dbo.T_Preparation ON dbo.Dim_Inspecteur.id_nat_inspecteur =
dbo.T_Preparation.id_nat_inspecteurINNER JOIN
dbo.Dim_Province ON dbo.T_Preparation.id_nat_province =
dbo.Dim_Province.id_nat_provinceINNER JOIN
dbo.Dim_entreprise ON dbo.T_Preparation.id_nat_entreprise =
dbo.Dim_entreprise.id_nat_entrepriseINNER JOIN
dbo.Dim_Temps ON dbo.T_Preparation.id_nat_temps =
dbo.Dim_Temps.id_nat_tempsINNER JOIN
dbo.Dim_Route ON dbo.T_Preparation.id_nat_route =
dbo.Dim_Route.id_nat_route
Ce script SQL nous a permis de charger la table de fait en
faisant le mappage entre les clés d'entrepôts.
6.3.7 Déploiement
du cube et analyse
Nous avons procédé à quelques analyses
test pour évaluer les performances de notre système
décisionnel, après le déploiement du cube avec Microsoft
SQL Server Analysis Services.
Figure 25 : Présentation du cube
Figure 30 Présentation du cube
6.3.7.1 Analyse de performance
Le cube ainsi déployé constitue un
véritable tableau de bord. En effet, il permet de présenter une
vue claire et synthétique de l'ensemble des activités sur les
infrastructures. Comme illustration simple, en un moindre instant, nous
obtenons dans un rapport l'ensemble des entreprises de construction
croisées avec les provinces où elles ont effectué des
travaux, avec la possibilité de creuser d'avantage et obtenir les divers
axes routiers. A cette présentation s'adjoint le nombre de
kilomètres pour les axes, la durée des travaux et le cout
détaillé et global.
Tableau 18: Extrait de la navigation du
cube
Tableau 5 Présentation d'un tableau de bord
Départ notre tableau de bord, nous pouvons constater
qu'au niveau de l'axe Gare Central et Socimaxdeux entreprises ont eu à
intervenir.Nous pouvons alors prendre une décision en fonction de
différentesmesures.
Présentation de résultat sur
l'entreprise SAFRICAS
Ø tableau de synthétique
Tableau 6 Tableau de résultat SAFRICAS
Ce tableau nous représente la synthèse statique
de SAFRICAS par rapport à nos trois mesures.
Ø Histogramme
Figure 31Histogramme de coût de SAFRICAS
Sur cette figure nous pouvons constater que la grande partie
de l'argent attribue à SAFRICAS pour les infrastructures
routières fut utilisé à KINSHASA.
6.3.7.2 Représentation des quelques
statistiques
Tableau 7 Tableau croisé sous Analysis Services
pour la présentation des statistiques.
Figure 32 Histogramme de coût par province
CONCLUSION
Le présent travail a fait l'objet de la mise en place
d'un data Warehouse et d'une application de webmapping pour la gestion du
réseau routier de la République Démocratique du Congo.
Si sa mise en oeuvre s'est appuyée sur de bases
théoriques développées dans les premier, deuxième,
troisième, quatrième et cinquième chapitres. Le dernier
chapitre a été entièrement consacré à
l'implémentation de l'application couplée au Système
Décisionnel.
Au cours de la phase théorique, nous avons
débuté par les notions fondamentales sur les bases de
données pour ensuite aborder le Système Décisionnel. Au
troisième chapitre, nous avons passé en revue les
différents langages de programmation et techniques utilisées
dans le web. Au quatrième chapitre, nous avons abordé les
théories sur les Systèmes d'Information Géographique avec
une attention particulière sur le Webmapping. Au cinquième
chapitre nous avons présenté le secteur des infrastructures
routières de la RDC et analyse leur état de la gestion actuelle.
Nous pouvons nous estimer heureux d'être arrivé
aux termes de ce travail qui a proposé une double mise en place, soit:
Ø Un nouveau système d'aide à la
décision qui permettra à la cellule d'infrastructures d'avoir une
vision concrète sur les performances des différents acteurs qui
interviennent dans les systèmes.
Ø Une application de webmapping en vue d'informer la
population en temps réel sur l'état des routes
aménagées qu'elles soient en cours de (re)construction ou
réhabilitation.
Au-delà de tout, nous ne prétendons pas avoir
épuisé le sujet. C'est pourquoi nous sommes ouvert aux critiques
ou remarques allant dans le sens d'améliorer notre travail.
BIBLIOGRAPHIE
A. Ouvrages
[1] ANDREAS MEIER, Introduction pratique aux bases de
données relationnelles, Springer ,2006
[2] BARRE Michèle et ROGER Christophe, les bases de
données spéciales, IRD Paris,2005
[3] BERTRANDBourquier, Business intelligence avec SQL
Server 2008, Dunod, Paris, 2009
[4] Francis Draillard : Premiers pas en CSS et XHTM 2
ème Edition,ÉDITIONS EYROLLES, bd Saint-Germain 75240 Paris
[5] Golfarelli&Rizzi : Data Warehouse Design:
Modern Principles and Methodologies, Indd, 2009
[6] LAURY Quentin et SAYSANASY Jessy, Webmapping, UFR,2011
[7] Philippe RIGAUX : Pratique de MySQL et PHP Conception
et réalisation, Dunod, Paris, 2009
[8] Ralph Kimball, L. Reeves, M. Rose, et W. Thornthwaite, Le
Data warehouse: Guide de conduit de projet, Eyrolles Paris 2011.
[9] Ralph Kimball, M. Ross, Entrepôt de
données ; Guide pratique de modélisation
dimensionnelle, Wiley, 2e édition
[10] Sébastien FANTINI : Business
Intelligence avec SQL Server 2008 R2,ENI Editions 2010
B. Notes de cours
[11] DI GALLO Frédéric :
Méthodologie des systèmes d'information MERISE, note de cours,
Cours du cycle B du Cnam.doc 2000.
[12] Cyril GRUAU : Conception d'une base de
données, note de cours, 2007.
[13] MBUYI MUKENDI Eugène, Système
d'information et base de données, 3ème Graduat
informatique, Faculté de sciences, UNIKIN, 2007-2008.
[14] NGOMBA Marcelline: Introduction aux Systèmes
d'Information Géographique, Faculté de sciences, UNIKIN,
2006-2007.
C. Article
[15] Cellule d'infrastructures, les infrastructures
routières en RDC, Kinshasa, janvier 2009
D. Mémoire
[16] KASEREKA MUSUMBA : Construction d'un Data Warehouse
pour l'aide à la prise de décision en matière de gestion
de l'exploitation industrielle de Bois en République Démocratique
du Congo, Université de Kinshasa 2011-2012.
E. Webographies
[17] http://www.celluleinfra.org, le
01 janvier 2014
[18] http://
www.classroom.fr, le 02 janvier 2014
[19]
http://cyril-gruau.developpez.com/merise, le 01 novembre 2013
[20]
http://freesoftwarestutorials.blogspot.com/search/label/Webmapping, le 11
novembre 2013
[21]
http://www.dwfacile.com/Choix_outils.htm, le 23 décembre
|