2.2 Système
d'Information
2.2.1
Définition
Un système d'information (noté SI)
représente l'ensemble des éléments participant à
la gestion, au stockage, au traitement, au transport et à la diffusion
de l'information au sein d'une organisation.
2.2.2 Enjeux du
système d'information
Le système d'information coordonne les activités
de l`entreprise. Il est le véhicule de la communication dans
l'organisation. De plus, le SI représente l'ensemble des ressources et
systèmes (personnes, matériels, logiciels) organisés pour
les objectifs suivants :
Ø Saisie des informations
Ø Stockage des informations
Ø Traitement des informations
Ø Restitution des informations
Ø Transmission des informations
2.2.3 Catégorie
Il existe deux grandes catégories de systèmes
d'information, les systèmes transactionnels et les systèmes
décisionnels. Les premiers servent à gérer le quotidien,
l'opérationnel de l'entreprise. Les seconds sont utilisés pour
prendre du recul, et servir de support aux décisions de l'entreprise et
de ses dirigeants.
2.2.4 Les systèmes transactionnels
(opérationnels)
Ce sont les outils que nous utilisons chaque jour. Ils
assurent le bon fonctionnement de l'ensemble d'organisation.
Toutes ses applications répondent à la
même attente : permettre la saisie d'informations, leur traitement, et la
production en sortie de résultats, sous forme de documents papier, de
consultations à l'écran ou d'autres informations.
Les trois principales caractéristiques d'un
système transactionnel sont donc :
Ø la capacité à gérer de grands
volumes de données,
Ø des temps de réponse très
réduits,
Ø mais des requêtes relativement simples du point
de vue informatique.
2.2.5 Les Systèmes
Décisionnels
Le principe même de la prise de décision est de
s'appuyer sur des informations précises pour en déduire des
comportements et passer à l'action.
Toutes ses applications répondent au même
processus : analyser des données préalablement collectées
par les applications opérationnelles de l'entreprise, les mettre en
forme, aider à distinguer les grandes tendances, et publier des
résultats sous forme de graphiques, de tableaux, ou de rapports.
Les trois principales caractéristiques d'un
système décisionnel sont donc :
Ø la capacité à gérer de grands
volumes de données,
Ø appliquent des requêtes beaucoup plus
complexes,
Ø ils disposent de plus de temps pour les
exécuter.
2.3 Concepts de base des
systèmes d'aide à la décision
2.3.1 Entrepôt de
Données (data warehouse)
Un entrepôt de données (ED) ou data warehouse
(DW) se définit selon W. INMON comme étant un ensemble de
données intégrées, orientées sujet, non volatiles,
gérées dans un environnement de stockage particulier,
historisées, résumées, disponibles pour l'interrogation et
l'analyse et organisées pour le support d'un processus d'aide à
la décision.
De part cette définition nous pouvons relève
plusieurs concept qui caractérise un entrepôt de
données : Intégrées- Orientées sujet - Non
volatiles - Historisées - Résumées
Intégrées
Les données de l'entrepôt proviennent de
différentes sources éventuellement
hétérogènes. L'intégration consiste à
résoudre les problèmes
d'hétérogénéité des systèmes de
stockage, des modèles et de la sémantique de données.
Orientées sujet
Après leur intégration dans une sorte de source
globale, les données sont réorganisées autour de
thèmes tels que : les itinéraire, inspecteur,
matériaux...etc.
Chaque décideur d'une organisation doit disposer d'une
vue sur les informations qui lui sont pertinentes, et qui peuvent influer dans
ses décisions pour une meilleure exploitation de ces données.
Non volatiles
Tout se conserve, rien ne se perd : cette
caractéristique est primordiale dans les ED. En effet, et contrairement
aux bases de données classiques, un ED est accessible en ajout ou en
consultation uniquement. Les modifications ne sont autorisées que pour
des cas particuliers (correction d'erreurs...etc.).
Historisées
La conservation de l'évolution des données dans
le temps, constitue une caractéristique majeure des ED. Elle consiste
à s'appuyer sur les résultats passés pour la prise de
décision et faire des prédictions ; autrement dit, la
conservation des données afin de mieux appréhender le
présent et d'anticiper le futur.
Résumées
Les informations issues des sources de données doivent
être agrégées et réorganisées afin de
faciliter le processus de prise de décision.
Disponibles pour
l'interrogation et l'analyse
Les utilisateurs doivent pouvoir consulter les données
en fonction de leurs droits d'accès. L'ED doit comporter un module de
traitement des requêtes, exprimées dans un langage, doté
d'opérateurs puissants, pour l'exploitation de la richesse du
modèle.
2.3.2 La fouille de
données (Data mining)
Au début des années 60, le data mining
s'appelait l'analyse statique. A la fin des années 80, une
sérié de méthodes éclectiques est venue rejoindre
l'analyse statistique classique : la logique floue, le raisonnement
heuristique et les réseaux neuronaux.
Le data mining fait référence à un
ensemble de techniques d'exploration et d'analyse, par des moyens automatiques
ou semi-automatiques, d'une masse importante de données dans le but de
découvrir des tendances cachées ou des règles
significatives (non triviales, implicites et potentiellement utiles) (Inmon,
1996). Les outils de data mining reposent en général, sur des
techniques basées sur les statistiques, la classification ou
l'extraction de règles associatives.
2.3.2.1 Objectifs du data mining
Les objectifs du Data Mining peuvent être
regroupés dans trois axes importants :
Ø Prédiction (What-if) : consiste à
prédire les conséquences d'un événement (ou d'une
décision), se basant sur le passé.
Ø Découverte de règles cachées :
découvrir des règles associatives, entre différents
événements (Exemple : corrélation entre les ventes de deux
produits).
Ø Confirmation d'hypothèses : confirmer des
hypothèses proposées par les analystes et décideurs, et
les doter d'un degré de confiance.
2.3.3 Modèle
Multidimensionnel
Les modèles basés sur le concept
multidimensionnel, sont les plus appropriés, à capturer les
caractéristiques des DW. Ils permettent en effet, de donner une vision
simple, et facilement interprétable par des non informaticiens, et de
visualiser les données selon différentes dimensions.
Le modèle multidimensionnel contient deux types
d'attributs : les dimensions et les mesures. Les mesures sont les valeurs
numériques que l'on compare, les dimensions sont les points de vue
depuis lesquels les mesures peuvent être observées. La
modélisation multidimensionnelle est illustrée par des cubes de
données ou des hyper cubes.
Mesure
251598848
251597824
Figure 4 Exemple d'un cube de données
|