WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Mise en place d'un système décisionnel basé sur le data mart et l'arbre de décision pour le recrutement du personnel à  la dgr koc.

( Télécharger le fichier original )
par JEAN LUC MANKAMBA YANKUMBA
UNIVERSITE NOTRE DAME DU KASAYI  - Licence 2014
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

1

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

0. INTRODUCTION GENERALE

0.1 CONTEXTE

La prise de décision est un problème essentiel qui préoccupe les gestionnaires des entreprises, toutes les couches de la société contemporaine, c'est alors que pour qu'une décision soit rationnelle elle doit passer par la modélisation de différents problèmes qu'ils rencontrent dans la gestion, d'où la nécessité d'un modèle basé sur l'arbre de décision.

L'entrepôt de données est une vision centralisée et universelle de toutes les informations de l'entreprise. C'est une structure qui a pour but, contrairement aux bases de données, de regrouper les données de l'entreprise pour des fins analytiques et pour aider le manager à la prise de décision stratégique.

Une décision stratégique est une action entreprise par les décideurs de l'entreprise qui vise à améliorer, quantitativement ou qualitativement, la performance de l'entreprise.

0.2 PROBLEMATIQUE

La Direction Générale de Recette du Kasaï Occidental (DGR KOC) ne se base pas sur des critères objectifs pour le recrutement de ses agents, mais elle se base sur des bases de clientélisme et sentimentales. C'est pourquoi notre étude se base sur la recherche à la solution de la question suivante :

Est-il possible de concevoir un système décisionnel d'aide au recrutement à la DGRKOC?

0.3 HYPOTHESE

Un système décisionnel basé sur l'aide de décision permettrait d'automatiser le recrutement du personnel à la Direction Générale de Recette du Kasaï Occidental (DGRKOC).

0.4 CHOIX ET INTERET DU SUJET

Notre choix est porté sur la mise en place d'un système décisionnel basé sur le data mart et l'arbre de décision pour le recrutement du personnel de la Direction Générale de Recette du Kassaï Occidental (DGRKOC).

Le choix de ce sujet est motivé par deux raisons essentielles :

? Aider la Direction Générale de Recette du Kassaï Occidental à améliorer son système de recrutement ;

? Lier les théories apprises dans notre formation à la pratique.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

2

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

0.5 SUBDIVISION DU TRAVAIL

Outre l'introduction et la conclusion notre travail se subdivise en quatre chapitres repartis dans deux parties : la partie théorique et la partie pratique.

La première partie compte trois chapitres, alors que la deuxième partie contient un chapitre.

Partie théorique :

Cette partie contient le premier chapitre qui s'intitule : généralités sur les systèmes décisionnels.

Le deuxième chapitre intitulé data warehouse et data mart, qui présente les
différents concepts relatifs aux entrepôts de données, au data mart et leur impotence dans une entreprise.

Le troisième chapitre porte sur le datamining et l'arbre de décision.

Partie pratique :

Cette partie contient le quatrième chapitre qui est la modélisation et l'implémentation.

0.6 METHODOLOGIE ET TECHNIQUES

Nous avons utilisé les méthodes et techniques ci-après :

? La méthode historique ou descriptive, qui est une méthode de description nous a permis de décrire l'entreprise et son fonctionnement.

? La technique d'interview qui nous a été d'une importance capitale elle a

consisté en un questionnement verbal adressé à toute personne de la DGRKOC Kananga, en vue d'éclairer notre recherche.

? La technique d'enquête, qui nous a permis de mener quelques enquêtes dans

l'entreprise pour savoir comment elle fonctionne.

? La technique d'observation, qui nous à aidée à procéder à l'observation et à

palper du doigt l'aspect général de notre cible de recherche.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

3

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

4

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

CHAP I : GENERALITES SUR LES SYSTEME DECISIONNELS [5,7, 8, 10,

11, 12]

I.0 INTRODUCTION

Toute entreprise qui veut atteindre des performances est censée prendre des décisions rationnelles en se basant sur un système décisionnel. La faillite de bon nombre d'entreprises est due au manque d'un personnel qualifié, à une mauvaise gestion et à une prise de décisions non adéquate.

I.1 HISTORIQUE DES SYSTEMES DECISIONNELS

La prise de décision est un problème essentiel qui préoccupe les gestionnaires des entreprises. Cette prise de décision passe par la modélisation de différents problèmes qu'ils rencontrent dans la gestion d'où la nécessité d'un modèle basé sur l'arbre de décision.

De nos jours pour qu'une entreprise puisse bien marcher, elle doit avoir besoin d'outils d'aide à la décision. Ces outils permettront alors aux dirigeants de bien prendre des décisions. Ces décisions concernent tous les services de cette entreprise. Le système décisionnel englobe tous les services de l'entreprise ainsi que leurs informations.

Les systèmes décisionnels travaillent comme des systèmes opérationnels sur de gros volumes de données.

La décision concerne tous les départements de l'entreprise : finances, ressources humaines, ventes, et la direction générale. Les applications utiles dans le processus de prise de décision sont nombreuses, et déjà présentes dans le système d'information des entreprises.

I.2 L'INFORMATIQUE DECISIONNELLE [12,9]

L'informatique décisionnelle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles d'une entreprise, en vue d'offrir une aide à la décision et de permettre aux dirigeants de prendre des stratégies pour l'entreprise et d'avoir une vue d'ensemble de l'activité traitée au sein de l'entreprise.

En général ce type d'applications utilise un entrepôt de données pour stocker des données provenant de plusieurs sources hétérogènes et fait appel à des traitements par lots pour la collecte de ces informations.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

5

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

I.3 DEFINITION D'UN SYSTEME DECISIONNEL (BUSINESS INTELLIGENCE) [8]

Un système est un ensemble de technologies destinées à permettre aux collaborateurs d'avoir accès et de comprendre les données de pilotage rapidement, de telle sorte qu'ils prennent une décision meilleure a temps, résultant d'un processus comportant le choix conscient entre plusieurs solutions en vue d'atteindre un objectif précis.

Un système décisionnel permet de répondre aux questions suivantes :

? Que s'est il passé ? (tableau de bord) ;

? Pourquoi cela s'est il passé ? (analyse) ;

? Que va-t-il se passé ? (prédiction) ;

? Que se passe-t- il en ce moment ? (aide opérationnelle) ;

? Que devrait- il se passer ou que faire ? (prise de décision ou entrepôt actif).

I.3.1 ARCHITECTURE DE SYSTEMES DECISIONNELS [8]

L'architecture générale d'un système décisionnel se décompose en trois processus : extraction et intégration, organisation et interrogation.

Le processus d'extraction et intégration, situé les sources de données et l'entrepôt est responsable de l'identification des données dans les diverses sources internes et externes ;

Dans l'extraction de l'information et de la préparation et de la transformation (nettoyage, filtrage, etc..) des données à l'intérieur de l'entrepôt, nous trouvons le processus d'organisation. Il est responsable de la structuration des données par rapport à leur niveau de granularité (agrégats).

Différents outils permettent de réaliser l'analyse des données, pour les différents utilisateurs de l'entreprise.

Fig. I. 1 Architecture Générale d'un système décisionnel

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

6

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

I.4 LES DIFFERENTS ELEMENTS CONSTITUTIFS DU SYSTEME DECISIONNEL [13]

I.4.1 Les sources de données :

Les sources de données sont souvent diverses et variées et le but est de trouver des outils et en fin de les extraire, de les nettoyer, de les transformer et de les mettre dans l'entrepôt de données. Ces sources de données peuvent être de fichiers de type Excel, des bases de données opérationnelles d'une entreprise ou fichiers plats. I.4.2 L'entrepôt de données :

Il est le coeur du système décisionnel et demande une analyse profonde de la part de maitre d'ouvrage.

La conception d'un datawarehouse diffère de la conception d'une base de donnée relationnelles.

En effet, alors que les bases de données relationnelles tendant le plus souvent à être normalisées, les bases des données multidimensionnelles, elles sont normalisées en respectant le modèle en étoile ou en flocon.

I.4.3 Le service OLAP ou serveur d'analyse

Le serveur OLAP est opposé a OLTP et à pour but d'organisé les données à analysé par domaine ou par thème et d'en ressortir des résultats pertinents pour le décideur. Les résultats sont obtenus par différents algorithmes de datamining (fouille de données) du serveur d'analyse. Ces résultats peuvent amener l'organisation à prendre de très bonnes décisions en vue d'améliorer le rendement de leurs entreprises.

I.5 LES FONCTIONNALITES D'UN SYSTEME DECISIONNEL

Les besoins des utilisateurs peuvent être regroupés en quatre catégories :

Simuler, analyser les données, réduire des états de gestion, suivre et contrôler.

1°) Simuler :

? Gestion de modèles de calcul (calculs automatiques d'ensemble de données

complexe en fonction de paramètre par l'utilisateur et de règles de gestion)

Exemple d'utilisation : élaboration de business plan ;

? Elaboration collaborative ;

EX : l'élaboration budgétaire.

2°) Analyse de données

? Fonctionnalité OLAP (établissement d'analyse dynamique multidimensionnelle avec possibilité de trié, filtrer, zoomer a l'intérieure de données) ;

EX : chiffre d'affaire.

? Fonctionnalités avancées de datamining, ensemble des techniques statistiques sophistiquées permettant de faire apparaitre des corrélations, des tendances et des prévisions.

3°) Produire des Etat de gestion

Fonctionnalités de reporting raquetteurs permettant de produire de façon simple et rapide, des tableaux de données incorporant des calculs plus ou moins sophistiquées ; 4°) Suivre et contrôler

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

7

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC


·
· Elaboration de tableau de bord produit et diffusion automatiquement à

fréquence régulière de tableaux de bord regroupent des données hétérogènes. EX : production de tableaux de bord graphique a destination de responsables opérationnels


·
· Emission d'alerte génération conditionnelle de message sur différents supports (email, sms,...) plus ou moins complexes en fonction de la configuration de données.

Nous avons constaté que l'ensemble de ces fonctionnalités sont rarement mise en place dans une entreprise.

Les mises en oeuvre sont en outre souvent réalisées par domaine fonctionnel(les ventes, achats,...). Par ailleurs, il n'existe pas de produit couvrent l'ensemble de ces fonctionnalités.

Chaque progiciel en fonction de son origine et du positionnement que souhaite lui donner son éditeur est plus au moins avancé sur l'un ou l'autre thème.

Il est donc crucial de déterminer précisément ses besoins présent et future, ainsi que les contraintes liées à son organisation ou a son activité avant de choisir une solution.

I.6 LES APPORTS DES SYSTEMES DECISIONNELS

Dans beaucoup de nos entreprises ; il est difficile d'expliquer aux dirigeants que l'on doit parfois dépenser beaucoup d'argent pour analyser et manipuler des données existant dans le système d'information de l'entreprise.

Les apports de systèmes décisionnel sont aussi défais réels. Ils peuvent être classés en deux catégories.

· L'amélioration de l'efficacité de la communication et de la distribution des informations de pilotage ;

· L'amélioration du pilotage des entreprises résultant de meilleures décisions à prendre plus rapidement ;

Si le premier point est aisément compréhensible, présente peu de risque de mise en oeuvre et pose peu de problème d'évaluation ce n'est clairement pas en revanche une source de gains significative. Il sera difficile le plus souvent de justifier les couts d'un projet sur cette seule promesse.

La seconde catégorie a nettement plus de potentiel de gains. Mais il faut bien reconnaitre que le risque de ne pas atteindre les objectifs initiaux sont réels sans parler d'énormes difficultés d'évaluation des bénéfices escomptés.

Les bénéfices de ce type le plus souvent cités sont les suivants :

> unicité des chiffres, une seule vérité acceptée par tous ;

> meilleure planification ;

> amélioration de la prise de décision ;

> amélioration de l'efficacité des processus ;

> amélioration de la satisfaction des clients et des fournisseurs ;

> amélioration de la satisfaction des employés.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

8

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

I.7 LES ENJEUX DE L'INFORMATIQUE DECISIONNELLE [11]

De nos jours, les données applicatives métier sont stockées dans une ou plusieurs bases de données relationnelles ou non relationnelles. Ces données sont extraites, transformées et chargées par un outil de type ETL.

Un entrepôt de données (datawarehouse) peut prendre la forme d'un dataMart. En règle générale, le datawarehouse globalise toutes les données applicatives de l'entreprise tandis que les dataMarts, généralement alimentés à partir des données du datawarehouse sont des sous ensembles d'information concernant un métier particulier de l'entreprise.

I.8 LES FONCTIONS ESSENTIELLES DE L'INFORMATIQUE DECISIONNELLE

Un système d'information décisionnel assure quatre fonctions fondamentales, à savoir : la collecte, l'intégration, la diffusion et la présentation des données. A ces quatre fonctions s'ajoute une fonction de contrôle du système d'information décisionnelle lui-même, l'administration.

a) Collecte :

La collecte est l'ensemble des taches consistant à détecter, sélectionner, extraire et à filtrer les données brutes issues des environnements pertinents compte tenu du périmètre du système d'information décisionnel (SID).

Les sources de données internes ou externes étant souvent hétérogène tant sur le plan technique que sur le plant sémantique, cette fonction est la plus délicate à mettre en place dans un système décisionnel complexe. Elle s'appuie notamment sur les outils d'ETL.

Cette alimentation utilise les données sources issues des systèmes transactionnels de production, le plus souvent sous forme de compte rendu, d'inventaire ou compte rendu d'opération qui est le constat au fil du temps des opérations (achats, ventes, écriture, comptable), le film de l'activité de l'entreprise ; compte rendu d'inventaire ou compte rendu de stock qui est l'image photo prise a un instant donné (à une fin de période, mois, trimestre) de l'ensemble du stock (les clients, les contrats, les commandes). La fonction de collecte joue également au besoin un rôle de recodage. Une donnée représentée différemment d'une source à une autre impose le choix d'une représentation unique pour les futures analyses.

b) Intégration :

L'intégration consiste à concentrer les données collectées dans un espace unifié, dont le socle informatique essentiel est l'entrepôt.

Élément central du dispositif, il permet aux applications décisionnelles de bénéficier d'une source d'information commune, homogène, normalisée et fiable, susceptible de masquer la diversité de l'origine des données.

Au passage les données sont épurées ou transformées par un filtrage et une validation des données en vue du maintien de la cohérence d'ensemble (les valeurs acceptées par les filtres de la fonction de collecte mais susceptibles d'introduire des incohérences de référentiel par rapport aux autres données doivent être soit rejetées, soit intégrées avec un statut spécial).

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

9

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Une synchronisation (d'intégrer en même temps ou à la même date de valeur des événements reçus ou constatés de manière décalée ou déphasée).

Une certification (pour rapprocher les données de l'entrepôt des autres systèmes légaux de l'entreprise comme la comptabilité ou les déclarations réglementaires).

C'est également dans cette fonction que sont effectués éventuellement les calculs et les agrégations (cumuls) communs à l'ensemble du projet. La fonction d'intégration est généralement assurée par la gestion de métadonnées, pour l'interopérabilité entre toutes les ressources informatiques, des données structurées (bases de données accédées par des progiciels ou applications), ou des données non structurées.

c) La diffusion ou la distribution :

La diffusion met les données à la disposition des utilisateurs, selon des schémas correspondant au profil ou au métier de chacun, sachant que l'accès direct à l'entrepôt ne correspondrait généralement pas aux besoins d'un décideur ou d'un analyste. L'objectif prioritaire est de segmenter les données en contextes informationnels fortement cohérents, simples à utiliser et correspondant à une activité décisionnelle particulière.

Alors qu'un entrepôt de données peut héberger de centaines ou de milliers de variables ou indicateurs, un contexte de diffusion raisonnable n'en présente que quelques dizaines au maximum.

Chaque contexte peut correspondre à un DataMart, bien qu'il n'y ait pas de règles générales concernant le stockage physique.

Très souvent, un contexte de diffusion est multidimensionnel, c'est-à-dire modélisable sous la forme d'un hyper cube, il peut alors être mis à disposition à l'aide d'un outil OLAP.

Les différents contextes d'un même système décisionnel n'ont pas tous besoin du même niveau de détail.

De nombreux agrégats ou cumuls, n'intéressant que certaines applications et n'ayant donc pas lieu d'être gères en tant qu'agrégats communs par la fonction d'intégration, relèvent donc de la diffusion.

Ces agrégats peuvent être, au choix, stockés de manière persistante ou calculés dynamiquement à la demande.

On peut distinguer trois questions à élucider pour concevoir un système de reporting : À qui s'adresse le rapport spécialisé ? (choix des indicateurs a présenter, choix de la mise en page)

Par quel trajet ? (circuit de diffusion type workflow pour les personnes, circuits de transmission télécoms pour les moyens)

Selon quel agenda ? (diffusion routinière ou sur événement prédéfini)

d) Présentation : Cette quatrième fonction, la plus visible pour l'utilisateur, régit les conditions d'accès de l'utilisateur aux informations. Elle assure le fonctionnement du poste de travail, le contrôle d'accès, la prise en charge des requêtes, la visualisation des résultats sous une forme ou une autre.

Elle utilise toutes les techniques de communication possibles comme les outils bureautiques, raquetteurs et générateurs d'états spécialises, infrastructure web, télécommunications mobiles, etc.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

10

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

e) Administration :

C'est la fonction transversale qui supervise la bonne exécution de toutes les autres; elle pilote le processus de mise à jour des données, la documentation sur les données et sur les métadonnées, la sécurité, les sauvegardes, la gestion des incidents.

CONCLUSION PARTIELLE

Dans ce chapitre, nous avons traité les systèmes décisionnels.

Nous avons défini l'informatique décisionnelle, l'architecture de systèmes décisionnels et ses différents enjeux avec leurs fonctions.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

11

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

CHAP II: DATA WAREHOUSE ET DATA MART [7, 8, 1,]

II.1 INTRODUCTION

Les entrepôts des données intègrent des informations en provenance de différentes sources, souvent reparties et hétérogènes ayant pour objectif de fournir une vue globale de l'information aux analystes et aux décideurs.

La construction et la mise en oeuvre d'un entrepôt de données représentent une tache complexe qui se compose de plusieurs étapes.

La première est l'analyse des sources de données et l'identification des besoins des utilisateurs, la deuxième correspond à l'organisation des données à l'intérieur de l'entrepôt. En fin, la troisième sert à établir divers outils d'interrogation, d'analyse, et de fouille de données.

Chaque étape présente des problèmes spécifiques. Ainsi, par exemple, lors de la première étape, la difficulté principale consiste en l'intégration des données, de manière a ce qu'elles soient de qualité pour leur stockage. Pour l'organisation, il existe plusieurs problèmes comme la sélection des vues à matérialiser, le rafraichissement de l'entrepôt, la gestion de l'ensemble de données courantes et historisées.

En ce qui concerne le processus d'interrogation, nous avons besoin des outils performants et conviviaux pour l'accès et l'analyse de l'information.

II.2 DEFINITION D'UN DATA WAREHOUSE (DW) [8]

Un entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d'un processus d'aide à la décision. Nous détaillons ces caractéristiques

Orientées sujet : les données des entrepôts sont organises par sujet plutôt que par application, par exemple, une chaine de magasins d'alimentation organise les données de son entrepôt par rapport aux ventes qui ont été réalisées par produit et par magasin, au cours d'un certain temps.

Intégrées : les données provenant de différentes sources doivent être intégrées, avant leur stockage dans l'entrepôt de données. L'intégration, c'est à dire la mise en correspondance des formats, permet d'avoir une cohérence de l'information.

Non volatiles : à la différence des données opérationnelles, celles de l'entrepôt sont permanentes et ne peuvent pas être modifiées .le rafraichissement de l'entrepôt consiste à ajouter de nouvelles données, sans modifier ou perdre celles qui existent. historisées :la prise en compte de l'évolution des données est essentielle pour la prise de décision qui, par exemple, utilise des techniques de prédication en s'appuyant sur les évolutions passées pour prévoir les évolutions futures.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

12

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.2.1 OBJECTIF DU DATA WAREHOUSE [8]

L'atout principal d'une entreprise réside dans les informations qu'elle possède. Les informations se présentent généralement sous deux formes : les systèmes opérationnels qui enregistrent les données et le Data Warehouse. En bref, les systèmes opérationnels représentent l'emplacement de saisie des données, et l'entrepôt de données l'emplacement de restitution.

Ainsi voici les objectifs fondamentaux du data warehouse :

Rendre accessibles les informations de l'entreprise : le contenu de l'entrepôt doit être compréhensible et l'utilisateur doit pouvoir y naviguer facilement et avec rapidité. Ces exigences n'ont ni frontières, ni limites. Des données compréhensibles sont pertinentes et clairement définies. Par données navigables, on n'entend que l'utilisateur identifie immédiatement à l'écran le but de ses recherches et accède au résultat en un clic.

Rendre cohérente les informations d'une l'entreprise : les informations provenant d'une branche de l'entreprise peuvent être mise en corrélation avec celles d'une autre branche. Si deux unités de mesure portent le même nom, elles doivent alors signifier la même chose. A l'inverse, deux unités ne signifiant pas la même chose doivent être définie différemment. Une information cohérente suppose une information de grande qualité. Cela veut dire que l'information est prise en compte et qu'elle est complète.

Constituer une source d'information souple et adaptable : l'entrepôt de données est conçu dans la perspective de notifications perpétuelle, l'arrivé de question nouvelles ne doit bouleverser ni les données existantes ni les technologies. La conception de Data Mart distincts composant un entrepôt de données doit être répartie et incrémentielle.

Représenter un bastion sécurisé qui protège la capitale information : l'entrepôt de données ne contrôle pas seulement l'accès aux données, mais il offre à ses gestionnaires une bonne visibilité des utilisations.

Constituer la base décisionnelle de l'entreprise : l'entrepôt de données recèle en son sein les informations propres à faciliter la prise de décisions.

II.2.2 LES COMPOSANTS DE BASE DU DATA WAREHOUSE

? Le système source : système opération d'enregistrement, dont la fonction consiste à capturer les transactions liées à l'activité.

? Zone de préparation des données : ensemble des processus qui nettoient, transforment, combinent, archivent, suppriment les doublons, c'est-à-dire prépare les données sources en vue de leur intégration puis de leur exploitation au sein du Data Warehouse. La zone de préparation

des données ne doit offrir ni service des requêtes, ni service de présentation.

? Serveur de présentation : machine cible sur laquelle l'entrepôt de données est stocké et organisé pour répondre en accès direct aux requêtes émises par des utilisateurs, les générateurs d'état et les autres applications.

? Data Mart : sous-ensemble logique d'un Data Warehouse, il est destiné à quelques utilisateurs d'un département.

? Entrepôt de données : source de données interrogeable de l'entreprise. C'est tout simplement l'union des Data Marts qui le composent. L'entrepôt de

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

13

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

données est alimenté par la zone de préparation des données. L'administrateur de l'entrepôt de données est également responsable de la zone de préparation des données.

> OLAP (On Line Analytic Processing ) : Activité globale de requêtage et de présentation de données textuelles et numériques contenues dans l'entrepôt de données ; style d'interrogation et de présentation spécifiquement dimensionnel.

> ROLAP (Relational OLAP) : ensemble d'interface utilisateur et
d'applications donnant une vision dimensionnelle des bases de données relationnelles.

> MOLAP (Multidimensional OLAP) : ensemble d'interface utilisateur et d'applications dont l'aspect dimensionnel est prépondérant.

> Application utilisateur : ensemble d'outils qui interrogent, analysent et présente des informations répondant à un besoin spécifique. L'ensemble des outils minimal se compose d'outil d'accès aux données, d'un tableur, d'un logiciel graphique et d'un service d'interface utilisateur, qui suscite les requêtes et simplifie la présentation de l'écran aux yeux de l'utilisateur.

> Outil d'accès aux données : client de l'entrepôt de données.

> Outil de requête : types spécifique d'outil d'accès aux données qui invite l'utilisateur à formuler ses propres requêtes en manipulant directement les tables et leurs jointures.

> Application de modélisation : type de client de base de données sophistiqués doté de fonctionnalités analytiques qui transforment ou mettent en forme les résultats obtenus ; on peut avoir :

o les modèles prévisionnels, qui tentent d'établir des prévisions d'avenir ;

o les modèles de calcul comportemental, qui catégorisent et classent les comportements d'achat ou d'endettement des clients ;

o la plupart des outils de Data mining.

> Métadonnées : toutes informations de l'environnement du Data Warehouse qui ne constituent pas les données proprement dites.

II.3 CARACTERISTIQUES D'UN DATA WAREHOUSE [8]

Un Data Warehouse est une base de données conçue pour l'interrogation et l'analyse plutôt que le traitement de transactions. Il contient généralement des données historiques dérivées de données transactionnelles, mais il peut comprendre des données d'autres origines.

Les Data Warehouse séparent la charge d'analyse de la charge transactionnelle. Ils permettent aux entreprises de consolider des données de différentes origines.

Au sein d'une même entité fonctionnelle, le Data Warehouse joue le rôle d'outil analytique.

En complément d'une base de données, un Data Warehouse inclut une solution d'extraction, de transformation et de chargement (ETL), des fonctionnalités de traitement analytique en ligne (OLAP) et de Data mining, des outils d'analyse client et d'autres applications qui gèrent le processus de collecte et de mise à la disposition de données.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

14

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.4 ENTREPOTS ET BASES DE DONNEES [7]

Dans l'environnement des entrepôts de données, les opérations, l'organisation des données, les critères de performance, la gestion des métadonnées, la gestion des transactions et le processus de requêtes sont très différents des systèmes de bases de données opérationnels.

Par conséquent, les SGBD relationnels orientés vers l'environnement opérationnel, ne peuvent pas être directement transplantés dans un système d'entrepôt de données.

Les SGBD ont été crées pour les applications de gestion de systèmes transactionnels. Par contre, les entrepôts de données ont été conçus pour l'aide a la prise de décision. Ils intègrent les informations qui ont pour objectif de fournir une vue globale de l'information aux analystes et aux décideurs.

Le tableau suivant résume les différences entre les systèmes de gestion de bases de données et les entrepôts de données.

 

SGBD

entrepôts de données

Objectifs

gestion et production

consultation et analyse

Utilisateurs

Gestionnaires de production

décideurs, analystes

Taille de la base

plusieurs giga-octets

plusieurs téraoctets

Organisation des

données

par traitement

par métier

type de données

Donnée de gestion (courantes)

données d'analyse

(résumées, historisées )

Requêtes

simples,

prédéterminées, données
détaillées

complexes, spécifiques, agrégations et group by

Transactions

Courte et nombreuse, temps réel

longues ,peu nombreuses

Tableau II.1.Différence entre SGBD et entrepôts de données

II.4.1 ROLE D'UN ENTREPOT DE DONNE

Le rôle primordiale d'un data warehouse apparait ainsi évident dans une stratégie décisionnelle. L'alimentation du data warehouse en est la phase la plus critique.

En effet, importer des données inutiles en portera de nombreux problèmes, cela consommera des ressources système et du temps. De plus, cela rendra le service d'analyse plus lent. Autre point à prendre en compte est la périodicité d'extraction des données ; effectivement, le plus souvent, les opérations de collecte de données sont couteuses en ressource pour la base accédée.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

15

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.4.2 SYSTEMES TRANSACTIONNELS ET SYSTEMES DECISIONNELS

Les Système de Gestion de Base de Donnée (SGBD) ont été créés pour gérer de grands volumes d'information contenus dans les différents systèmes opérationnels qui appartiennent a l'entreprise.

Ces données sont manipulées en utilisant des processus transactionnels en ligne, .parallèlement à l'exploitation de l'information contenue dans ces systèmes opérationnels, les dirigeants des entreprises ont besoin d'avoir une vision globale concernant toute cette information pour faire des calculs prévisionnels, des statistiques ou pour établir des stratégies de développement et d'analyses des tendances.

 

système transactionnel

système décisionnel

Données

Exhaustives courantes dynamiques

Résumées historiques statiques

 

orientées applications

orientées sujets

 
 

(d'analyse)

Utilisateurs

Nombreux

peu nombreux

 

varies (employés, directeurs)

uniquement les décideurs

 

concurrentes

non concurrents

 

mises à jour et interrogations

interrogations

 

requêtes prédéfinies

requêtes imprévisibles et complexes

 

réponses immédiates

réponses moins rapides

 

accès a peu d'information

accès a de nombreuses informations

Tableau II. 2. compare les caractéristiques des systèmes

II.4.3 DIFFERENCE ENTRE LE SYSTEME OLTP ET LE DATA WAREHOUSE [8]

Les Data Warehouse et les Systèmes OLTP (On Line Transaction Processing) répondent à besoins très différents. Les Data Warehouse conçu pour prendre en charge des interrogations ad hoc. La taille du Data Warehouse n'est pas connue à l'avance. Par conséquent, celui-ci doit être optimisé pour offrir de bonnes performances dans le cadre d'opérations d'interrogation très diverses. Les systèmes OLTP prennent généralement en charge des opérations prédéfinies. Les applications peuvent être réglées ou conçues spécifiquement pour ces opérations.

Un Data Warehouse est mise à jour régulièrement par les processus ETL (Extraction, Transformation and Loading), un système de chargement de données en masse soigneusement défini et contrôlé. Il n'est pas mise à jour directement par les utilisateurs. Dans les systèmes OLTP, les utilisateurs exécutent régulièrement des instructions qui modifient les données de la base. La base de données OLTP est à jour en permanence et elle reflète l'état actuel de chaque transaction.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

16

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Les Data Warehouse utilisent souvent des schémas dénormalisés ou partiellement dénormalisés (tels que le schéma en étoile) pour optimiser les performances des interrogations. A l'inverse, les systèmes OLTP ont souvent recours à des schémas totalement normalisés pour optimiser les performances des opérations de mise à jour, d'insertion et de suppression, et pour garantir la cohérence des données. Il s'agit là des différences générales, elles ne doivent pas être considérées comme des distinctions strictes et absolues.

De manière générale, une interrogation portant sur un Data Warehouse balaye des milliers voire des millions de lignes. En revanche, une opération OLTP standard accède à quelque enregistrement seulement.

Le Data Warehouse contient généralement des données correspondant à plusieurs mois ou années. Cela permet d'effectuer des analyses historiques. Les systèmes OLTP contiennent généralement des données quelque semaine ou mois. Ils conservent uniquement des données historiques nécessaires à la transaction en cours.

II.4.4 La problématique de l'entreprise [8]

L'entreprise construit un système décisionnel pour améliorer sa performance, elle doit décider et anticiper en fonction de l'information disponible et capitaliser sur ses expériences.

Entreprise : est une organisation dotée d'une mission et d'un objectif métier. Elle doit sa raison d'être et /ou sa pérennité au travers de différent objectifs (sécurité, développement, rentabilité ...). Par voie de conséquence, cette organisation humaine est dotée d'un centre décision.

Rôle de décideur : il peut être le responsable de l'entreprise, le responsable d'une fonction ou d'un secteur. Il est donc celui qui engage la pérennité ou la raison d'être de l'entreprise. Pour ces raisons, il doit s'entourer de différents moyens lui permettant une prise de décision la plus pertinente. Parmi ces moyens, les Data Warehouse ont une place primordiale.

II.4.5 LA MODELISATION DIMENSIONNELLE ET LA MODELISATION ENTITE/RELATION [5, 8]

a) Modélisation Entité/Relation : est une discipline qui permet d'éclairer les relation microscopique entre les données. Dans sa forme la plus artistique, elle permet de supprimer toute redondance de données. Ceci apporte de nombreux avantages au niveau du traitement des transactions, qui deviennent alors très simples et déterministes.

b) Modélisation dimensionnelle : est une méthode de conception logique qui vise à présenter les données sous une forme standardisée intuitive et qui permet des accès hautement performants. Elle adhère totalement à la dimensionnalité ainsi qu'à une discipline qui exploite le modèle relationnel en le limitant sérieusement. Chaque modèle dimensionnel se compose d'une table contenant une clé multiple, table des faits, et d'un ensemble de tables plus petite nommées, tables dimensionnelles.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

17

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Chacune de ces dernières possède une clé primaire unique, qui correspond exactement à l'un des composants de la clé multiple de la table des faits. Dans la mesure où elle possède une clé primaire multiple reliée à au moins deux clés externes, la table des faits exprime toujours une relation n, n (plusieurs-à-plusieurs).

II.4. 6 RELATION ENTRE LA MODELISATION DIMENSIONNELLE ET LA MODELISATION ENTITE/RELATION

Pour mieux appréhender la relation qui existe entre la modélisation dimensionnelle et la modélisation entité/relation, il faut comprendre qu'un seul schéma entité/relation se décompose en plusieurs schémas de table des faits.

La modélisation dimensionnelle ne se met pas à son avantage en représentant sur un même schéma plusieurs processus qui ne coexistent jamais au sein d'une série de données et à un moment donné. Ce qui le rend indûment complexe. Ainsi, la conversion d'un schéma entité/relation en une série de schémas décisionnels consiste à scinder le premier en autant de sous-schémas qu'il y a de processus métier puis de les modéliser l'un après l'autre. La deuxième étape consiste à sélectionner les relations n, n (plusieurs-à-plusieurs) contenant des faits numériques et additifs (autres que les clés) et d'en faire autant de table des faits.

La troisième étape consiste à dénormalisés toutes les autres tables en table non séquentielle dotées de clés uniques qui les relient directement aux tables des faits. Elles deviennent ainsi des tables dimensionnelles. S'il arrive qu'une table dimensionnelle soit reliée à plusieurs tables des faits, nous représentons cette table dimensionnelle dans les deux schémas et dirons des tables dimensionnelles qu'elles sont conformes d'un modèle à l'autre.

II.4.6.1 AVANTAGES DE LA MODELISATION DIMENSIONNELLE [8]

Le modèle dimensionnel possède un grand nombre d'avantages dont le modèle entité/relation est dépourvu.

Premièrement, le modèle dimensionnel est une structure prévisible et standardisée. Les générateurs d'états, outils de requête et interfaces utilisateurs peuvent reposer fortement sur le modèle dimensionnel pour faire en sorte que les interfaces utilisateurs soient plus compréhensibles et que le traitement soit optimisé.

La deuxième force du modèle dimensionnel est que la structure prévisible du schéma en étoile réside aux changements de comportement inattendus de l'utilisateur. Toutes les dimensions sont équivalentes.

La troisième avantage du modèle dimensionnel réside dans le fait qu'il est extensible à loisir pour accueillir des données et des besoins d'analyse non prévus au départ. Ainsi, il est possible d'accomplir :

Ajouter des faits nouveaux non prévus initialement ;

Ajouter des dimensions totalement nouvelles ;

Ajouter des attributs dimensionnels nouveaux non prévus initialement ;

Décomposer les enregistrements d'une dimension existante en un niveau de détail plus fin à partir d'une date déterminée ;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

18

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.5 SCHEMAS D'UN DATA WAREHOUSE [8]

Un schéma est un ensemble d'objets de la base de données tels que les tables, des vues, des vues matérialisées, des index et des synonymes. La conception du schéma d'un Data Warehouse est guidée par le modèle des données source et par les besoins utilisateurs.

L'idée fondamentale de la modélisation dimensionnelle est que presque tous les types de données peuvent être représentés dans un cube de données, dont les cellules contiennent des valeurs mesurées et les angles les dimensions naturelles de données. Nos conceptions peuvent comporter plus de trois dimensions. Techniquement, il faudrait parler d'hypercube, bien que le terme cube de données ait été adopté par le métier.

a) les objets d'un schéma de Data Warehouse

Les deux types d'objet les plus courants dans les schémas de Data Warehouse multidimensionnels sont les tables de faits et les tables de dimension.

? Tables de faits : une table de faits comprend généralement des colonnes de deux types : celles qui contiennent des faits numériques (souvent appelés indicateurs) et celles qui servent de clé étrangère vers les tables de dimension. Une table de faits peut contenir des faits détaillés ou agrégées. Les tables contenant des faits agrégés sont souvent appelées tables agrégées. une table de faits contient généralement de faits de même niveau d'agrégation. La plupart des faits sont additifs, mais ils peuvent être semi-additifs ou non additifs. Les faits additifs peuvent être agrégés par simple addition arithmétique. C'est par exemple le cas des ventes. Les faits non additifs ne peuvent pas être additionnés du tout. C'est le cas des moyennes. Les faits semi-additifs peuvent être agrégés selon certaines dimensions mais pas selon d'autres. C'est le cas, pas exemple des niveaux de stock. Une table de faits doit être définie pour chaque schéma. Du point de vue de la modélisation, la clé primaire de la table de faits est généralement une clé composée qui est formée de toutes les clés étrangères associées.

? Tables de dimensions et hiérarchies : une dimension est une structure comprenant une ou plusieurs hiérarchies qui classe les données en catégories. Les dimensions sont des étiquettes descriptives fournissant des informations complémentaires sur les faits, qui sont stockées dans les tables de dimension. Il s'agit normalement de valeurs textuelles descriptives. Plusieurs dimensions distinctes combinées avec les faits permettant de répondre aux questions relatives à l'activité de l'entreprise. Les données de dimension son généralement collectées au plus bas niveau de détail, puis agrégées aux niveaux supérieurs en totaux plus intéressants pour l'analyse, ces agrégations ou cumuls naturels au sein d'une table de dimension sont appelés des hiérarchies. Les hiérarchies sont des structures logiques qui utilisent les niveaux ordonnées pour organiser les données. Pour une dimension temps, par exemple, une hiérarchie peut agréger les données selon le niveau mensuel, le niveau trimestriel, le niveau annuel.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

19

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Au sein d'une hiérarchie, chaque niveau est connecté logiquement aux niveaux supérieurs et inferieurs. Les valeurs des niveaux inferieurs sont agrégées en valeurs de niveau supérieur.

a) Le Schéma en Etoile

Le schéma en étoile peut être le type le plus simple de schéma de Data Warehouse, il est dit en étoile parce que son diagramme entité/relation ressemble à une étoile, avec des branches partant d'une table centrale. Un schéma en étoile est caractérisé par une ou plusieurs tables de faits, très volumineuses, qui contiennent les informations essentielles du Data Warehouse et par un certain nombre de tables de dimension, beaucoup plus petites, qui contiennent chacune des informations sur les entrées associées à un attribut particulier de la table de faits. Une interrogation en étoile est une jointure entre une table de faits et un certain nombre de table de dimensions. Chaque table de dimension est jointe à la table de faits à l'aide d'une jointure de clé primaire à clé étrangère, mais les tables de dimension ne sont pas jointes entre elles.

Les schémas en étoile présentent les avantages suivants : ils fournissent une correspondance directe et intuitive entre les entités fonctionnelles analysées par les utilisateurs et la conception du schéma. Ils sont pris en charge par un grand nombre d'outils décisionnels. La manière la plus naturelle de modéliser un Data Warehouse est la représenter par un schéma en étoile dans lequel une jointure unique établit la relation entre la table de faits et chaque table de dimension. Un schéma en étoile optimise les performances en contribuant à simplifier les interrogations et à raccourcir les temps de réponse.

Les schémas en étoile présentent néanmoins quelques limites. La table centrale peut devenir très volumineuse, sa taille maximale étant déterminée par le produit des nombres de lignes des tables de dimension. En outre, les tables de dimension ne sont plus normalisées. Elles sont donc plus volumineuses et plus difficiles à tenir à jour car elles contiennent beaucoup de données dupliquées.

EX :

 
 
 
 
 
 
 
 
 

Dimensions 2 Id_dim2

 

Dimensions 1

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Id_dim1

 
 
 
 
 
 
 
 
 
 
 
 

Table des Faits

 
 
 
 
 
 
 
 

Id_f (Pk) Id_dim1 (Fk) Id_dim2 (Fk)

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Dimensions 3

Dimensions 4 Id_dim4

 
 
 
 
 

Id_dim3

 
 
 
 
 
 
 
 
 
 
 
 
 
 

Fig.II .1 : schéma d'un modèle en étoile

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

20

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

b) Le Schéma en Flocon

Les schémas en flocons normalisent les dimensions pour éliminer les redondances. Autrement dit, les données de dimension sont stockées dans plusieurs tables et non dans une seule table de grande taille. Cette structure de schéma consomme moins d'espace disque, mais comme elle utilise davantage de tables de dimension, elle nécessite un plus grand nombre de jointures de clé secondaire. Les interrogations sont par conséquent plus complexes et moins performantes.

Dans un schéma en flocon, cette même table de faits, référence les tables de dimensions de premier niveau, au même titre que le schéma en étoile.

La différence réside dans le fait que les dimensions sont décrites par une succession de tables (à l'aide de clés étrangères) représentant la granularité de l'information. Ce schéma évite les redondances d'information mais nécessite des jointures lors des agrégats de ces dimensions.

Dimensions 1

Id_dim1

Dimensions 4

Id_dim4

Dimensions 5

Dimensions 2

Id_dim5

Table des Faits

Id_dim2
Id_dim 5

Dimensions 3

Id_dim3
Id_dim 6

Id_f (Pk) Id_dim1 (Fk) Id_dim2 (Fk)

Dimensions 6

Id_dim 6

Le principal avantage du schéma en flocons est une amélioration des performances des interrogations due à des besoins réduits en espace de stockage sur disque et la petite taille des tables de dimension à joindre. Le principal inconvénient de ce schéma est le travail de maintenance supplémentaire imposé par le nombre accru de tables de dimension. EX :

Fig II.2 : schéma d'un modèle en flocon

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

21

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

d) schéma multi dimensionnel (CUBE)

Dans le modèle multidimensionnel, le concept central est le cube, lequel est constitue des éléments appelés cellules qui peuvent contenir une ou plusieurs mesures. La localisation de la cellule est faite a travers les axes, qui correspondent chacun a une dimension.

La dimension est composée de membres qui représentent les différentes valeurs.

Fig. II. 3:Exemple de schéma multidimensionnel

La figure II. 3, présente un schéma multidimensionnel pour les ventes qui ont été réalisées dans les magasins pour les différents produits au cours d'un temps donné (jour).

II.6 LE DATA MART [1, 8,]

II.6.1 INTRODUCTION

Un DataMart est un sous-ensemble d'un entrepôt de données; il est généralement exploité dans les entreprises pour restituer des informations ciblées sur un métier spécifique, constituant pour ce dernier un ensemble d'indicateurs à vocation de pilotage de l'activité et d'aide à la décision. Un DataMart, selon les définitions, est issu ou fait partie d'un Data Warehouse, et en reprend par conséquent la plupart des caractéristiques.

II.6.2 LES DEFINITIONS [8]

Le DataMart est un ensemble de données ciblées, organisées, regroupées et agrégées pour répondre à un besoin spécifique à un métier ou un domaine donné. Il est donc destiné à être interrogé sur un panel de données restreint à son domaine fonctionnel, selon des paramètres qui auront été définis à l'avance lors de sa conception.

De façon plus technique, le DataMart peut être considère de deux manières différentes, attribuées aux deux principaux théoriciens de l'informatique décisionnelle, bill inmon et Ralph Kimball :

Définition d'inmon : le DataMart est issu d'un flux de données provenant du Data Warehouse. Contrairement a ce dernier qui présente le détail des données pour toute

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

22

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

l'entreprise, il a vocation à présenter la donnée de manière spécialisée, agrégée et regroupée fonctionnellement.

Définition de Kimball : le DataMart est un sous-ensemble du Data Warehouse, constitue de tables au niveau détail et à des niveaux plus agrèges, permettant de restituer tout le spectre d'une activité métier. L'ensemble des DataMarts de l'entreprise constitue le Data Warehouse.

II.6.3 LA PLACE DU DATAMART DANS L'ENTREPRISE

Le DataMart se trouve en toute fin de la chaine de traitement de l'information. En règle générale, il se situe en aval d'un DataWarehouse plus global à partir duquel il est alimenté, dont il constitue en quelque sorte un extrait.

Un DataMart forme la principale interaction entre les utilisateurs et les systèmes informatiques qui gèrent la production de l'entreprise (souvent des ERP).

Dans un DataMart, l'information est préparée pour être exploitée brute par les personnes du métier auquel il se rapporte. Pour ce faire, il est appelé a être utilise via des logiciels d'interrogation de bases de données (notamment des outils de reporting) afin de renseigner ses utilisateurs sur l'état de l'entreprise à un moment donné (stock) ou sur son activité (flux).

La préparation de la donnée pour une utilisation directe, inhérente au DataMart, peut revêtir plusieurs formes. Il faut noter que toutes représentent une simplification par rapport au niveau de données inferieur ; on peut citer pour exemple :

L'agrégation de données : le DataMart ne contient pas le détail de toutes les opérations qui ont eu lieu, mais seulement des totaux, repartis par groupements.

Le retrait de données inutiles : le DataMart ne contient que les données qui sont strictement utiles aux utilisateurs.

L'historisation des données : le DataMart contient seulement la période de temps qui intéresse les utilisateurs.

II.6.4 DATAWAREHOUSE ET DATAMART [1]

La première étape d'un projet busines intelligent est de créer un entrepôt central pour avoir une vision globale des données de chaque service. Cet entrepôt porte le nom de DataWarehouse.

On peut également parler de DataMart, si seulement une catégorie de services ou métiers est concernée.

Par définition, un DataMart peut être contenu dans un DataWarehouse, ou il peut être seulement issu de celui-ci.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

23

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.6.4 ARCHITECTURE D'UN DATAMART

Système transactionnel

Fig. II.4: Architecture d'un Data Mart

II.6.5 Data Warehouse versus Data Mart

Data Warehouse

Data Mart

Utilisation globale de l'entreprise

Utilisé par un département ou une unité fonctionnelle

Difficile et plus long à implémenter

Plus facile et rapide à implémenter

Volume de données plus important

Volume de données plus petit et

spécialisé

Développé sur la base de données

actuelle

Développé sur les bases des besoins

utilisateurs

Les Data Marts représentent de toute évidence une réponse rapide aux besoins des différents départements de l'entreprise. Leur coût moindre et leur facilité d'emploi permettent une implémentation rapide et un retour à l'investissement presque immédiat. Il faut toute fois être prudent lorsque des Datamarts sont ainsi crées pour plusieurs divisions. Ces dernières utilisent souvent des représentations différentes de certains concepts de gestion. Par exemple, les départements finances et marketing peuvent tous deux effectué un suivi des ventes réalisées par l'entreprise, mais défini différemment ce concept. Plus tard, si un employé du marketing a besoin de recueillir certaines informations à partir du Data Marts des finances, l'entreprise sera confrontée à un problème. Par conséquent, une vision unifiée est nécessaire même pour concevoir des Datamarts par département.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

24

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.7 LES SERVEURS OLAP (ON-LINE ANALYTICAL PROCESSING)

Les données opérationnelles constituent la source principale d'un système d'information décisionnel. Les systèmes décisionnels complets reposent sur la technologie OLAP, conçue pour répondre aux besoins d'analyse des applications de gestion.

Nous exposons dans la suite les divers types de stockage des informations dans les systèmes décisionnels.

II.7.1 LES SERVEUR ROLAP (RELATIONAL OLAP)

Fig. II. 5: Architecture ROLAP

Dans les systèmes relationnels OLAP, l'entrepôt de données utilise une base de données relationnelle. Le stockage et la gestion de données sont relationnels. Le moteur ROLAP traduit dynamiquement le modèle logique de données multidimensionnel m en modèle de stockage relationnel r, la plupart des outils requièrent que la donnée soit structurée en utilisant un schéma en étoile ou un schéma en flocon de neige.

La technologie ROLAP a deux avantages principaux :

1) elle permet la définition de données complexes et multidimensionnelles en utilisant un modèle relativement simple.

2) elle réduit le nombre de jointures à réaliser dans l'exécution d'une requête.

Le désavantage est que le langage de requêtes tel qu'il existe, n'est pas assez puisant ou n'est pas assez flexible pour supporter de vraies capacités d'OLAP.

II.7.2 LES SERVEUR MOLAP (MULTIDIMENSIONAL OLAP)

Les systèmes multidimensionnels OLAP utilisent une base de données multidimensionnelle pour stocker les données de l'entrepôt et les applications analytiques sont construites directement sur elle. Dans cette architecture, le système de base de données multidimensionnel sert tant au

Niveau de stockage qu'au niveau de gestion des données. Les données des sources sont conformes au modèle multidimensionnel, et dans toutes les dimensions, les différentes agrégations sont pour le calculées pour des raisons de performance.

Fig.II.6:Architecture MOLAP

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

25

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Les systèmes MOLAP doivent gérer le problème de données clairsemées, quand seulement un nombre réduit de cellules d'un cube contiennent une valeur de mesure associée.

Les avantages des systèmes MOLAP sont bases sur les désavantages des systèmes ROLAP et elles représentent la raison de leur création. D'un cote, les requêtes MOLAP sont très puissantes et flexibles en termes du processus OLAP, tandis que, d'un autre cote, le modèle physique correspond plus étroitement au modèle multidimensionnel. Néanmoins, il existe des désavantages au modèle physique MOLAP. Le plus important, a notre avis, c'est qu'il n'existe pas de standard du modèle physique.

II.7.3 LES SERVEUR HOLAP (HYBRID OLAP)

Un système HOLAP est un système qui supporte et intègre un stockage des données multidimensionnel et relationnel d'une manière équivalente pour profiter des caractéristiques de correspondance et des techniques d'optimisation donc c'est l'ensemble des deux serveurs MOLAP et ROLAP.

Dans la figure 7, nous montrons une architecture en utilisant les types de serveurs ROLAP et MOLAP pour le stockage de données.

Fig. II.7:Architecture HOLAP

Nous traitons une liste des caractéristiques principales qu'un système HOLAP doit fournir :

La transparence du système : Pour la localisation et l'accès aux données, sans connaître si elles sont stockées dans un SGBD relationnel ou dimensionnel. Pour la transparence de la fragmentation.

Un modèle de données général et un schéma multidimensionnel global :

Pour aboutir à la transparence du premier point, tant le modèle de données général que le langage de requête uniforme doivent être fournis. Etant donné qu'il n'existe pas un modèle standard, cette condition est difficile à réaliser.

Une allocation optimale dans le système de stockage : Le système HOLAP Doit bénéficier des stratégies d'allocation qui existent dans les systèmes distribués tels que : le profil de requêtes, le temps d'accès, l'équilibrage de chargement.

Une réallocation automatique : Toutes les caractéristiques traitées ci-dessus

Changent dans le temps. Ces changements peuvent provoquer la réorganisation de la distribution des données dans le système de stockage multidimensionnel et relationnel, pour assurer des performances optimales.

Actuellement, la plupart des systèmes commerciaux utilisent une approche hybride. Cette approche permet de manipuler des informations de l'entrepôt de données avec un

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

26

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

moteur ROLAP, tandis que pour la gestion des DataMarts, ils utilisent l'approche multidimensionnelle.

CONCLUSION PARTIELLE

Dans ce chapitre, nous avons traité l'entrepôt de données et le data mart. Nous avons donnés l'architecture d'un entrepôt de données et celle du data mart. Nous avons expliqué les différents composants qu'il intègre, les types de données et les différents outils pour arriver à la visualisation de l'information.

Nous avons décrit les différents modèles multidimensionnels pour la construction d'un entrepôt de données, ainsi que les différentes opérations pour la manipulation des données multidimensionnelles et le parallélisme entre le deux, nous avons présenté l'apport de DataMart dans les entreprises.

Nous avons décrit le serveur ROLAP qui utilise une base de données relationnelle, tant au niveau du stockage qu'au niveau de la gestion de données.

Le serveur MOLAP a été la deuxième architecture que nous avons traitée.

Ces types de systèmes utilisent une base de données multidimensionnelle pour le stockage des données. La troisième architecture que nous avons décrite est le serveur HOLAP et quelque caractéristique de ce types serveur.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

27

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

CHAP III DATA MINING ET ARBRE DE DECISION [2, 3, 4, 8, 13]

III.0 INTRODUCTION

Le terme datamining est souvent employé pour désigner l'ensemble des outils permettant à l'utilisateur d'accéder aux données de l'entreprise, de les analyser. Nous retiendrons ici le terme de data mining aux outils ayant pour objet de générer des informations riches à partir des données de l'entreprise, notamment des données historiques, de découvrir des modèles implicites dans les données.

Ces outils peuvent permettre par exemple à un magasin de dégager des profils de client et des achats types et de prévoir ainsi les ventes futures. Ils permettent d'augmenter la valeur des données contenues dans le DataWarehouse.

Les outils d'aides à la décision, qu'ils soient relationnels ou OLAP, laissent l'initiative à l'utilisateur, de choisir les éléments qu'il veut observer ou analyser .Au contraire ,dans le cas du datamining ,le système a l'initiative et découvre lui-même les associations entre données ,sans que l'utilisateur ait à lui dire de rechercher plutôt dans telle ou telle direction ou à poser des hypothèses .

Il est alors possible de prédire l'aveni, par le comportement d'un client, et de détecte, dans le passé, les données inusuelles, exceptionnelles.

Ces outils ne sont plus destinés aux seuls experts statisticiens mais doivent pouvoir être employés par des utilisateurs connaissant leur métier et voulant l'analyser, l'explorer.

Seul un utilisateur connaissant le métier peut déterminer si les modèles, les règles, les tendances trouvées par l'outil sont pertinentes, intéressantes et utiles à l'entreprise. Nous pourrions définir le data mining comme une démarche ayant pour objet de découvrir des relations et des faits, à la fois nouveaux et significatifs, sur de grands ensembles de données.

Le terme data mining signifie littéralement forage de données dont le but est de pouvoir extraire un élément : la connaissance.

Ces concepts s'appuient sur le constat qu'il existe au sein de chaque entreprise des informations cachées dans le gisement de données. Nous appellerons datamining l'ensemble des techniques qui permettent de transformer les données en connaissances. L'exploration se fait sur l'initiative du système, par un utilisateur métier, et son but est de remplir l'une des tâches suivantes : Classification, estimation, prédiction, regroupement par similitudes, segmentation (cautérisation), description et, dans une moindre mesure, l'optimisation.

III.1 OBJECTIFS DU DATA MINING [8]

Les objectifs du Data Mining peuvent être regroupés dans trois axes importants:

1. Prédiction (What-if) : consiste à prédire les conséquences d'un événement (ou d'une décision), se basant sur le passé.

2. Découverte de règles cachées : découvrir des règles associatives, entre différents événements (Exemple : corrélation entre les ventes de deux produits).

3. Confirmation d'hypothèses : confirmer des hypothèses proposées par les analystes et décideurs, et les doter d'un degré de confiance.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

28

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

En considérant le serveur de base données ou le serveur d'entrepôt de données, le Data mining est considéré comme un client riche de ces deux serveurs. Notons que le client serveur est un mode de dialogue entre deux processus, l'un appelé client qui sollicite des services auprès de l'autre appelé serveur, par envoie des requêtes (send request en anglais). Après avoir lancé une requête par rapport au fait à analyser, le client data ming applique des méthodes ou procédures sur les données obtenues, afin d'obtenir les informations nécessaires pour la prise de décision. Ces procédures ou méthodes, sont classées en deux catégories : Apprentissage non supervisé et l'apprentissage supervisé en dehors de ces deux s'ajoute l'autre qui est l'apprentissage automatique.

a) Apprentissage non supervisé :

Elle consiste à mettre en évidence les informations cachées par le grand volume de données, en vue de détecter dans ces données des tendances cachées. Les techniques utilisées sont : La segmentation (Clustering en anglais), L'analyse à composante principale, l'analyse factorielle de correspondance.

b) Apprentissage supervisé :

L'apprentissage supervisé consiste à extrapoler des nouvelles connaissances à partir de l'échantillon représentatif issu de l'apprentissage non supervisé. Les techniques utilisées sont : Les réseaux de neurones, le SVM, l'arbre de décision, les réseaux de bayes, etc.

c) Apprentissage automatique :

L'apprentissage automatique (machine learning en anglais), un des champs d'étude de l'intelligence artificielle, est la discipline scientifique concernée par le développement, l'analyse et l'implémentation de méthodes automatisables qui permettent à une machine (au sens large) d'évoluer grâce à un processus d'apprentissage, et ainsi de remplir des tâches qui sont difficiles ou impossible d'être réalisées par des moyens algorithmiques plus classiques.

Des systèmes complexes peuvent être analysés, y compris pour des données associées à des valeurs symboliques (ex: sur un attribut numérique, non pas simplement une valeur numérique, juste un nombre, mais une valeur probabilisée, c'est-à-dire un nombre assorti d'une probabilité ou associé à un intervalle de confiance) ou un ensemble de modalités possibles sur un attribut numérique ou catégoriel.

L'analyse peut même concerner des données présentées sous forme de graphes ou d'arbres, ou encore de courbes (par exemple, la courbe d'évolution temporelle d'une mesure ; on parle alors de données continues, par opposition aux données discrètes associées à des attributs-valeurs classiques).

Le premier stade de l'analyse est celui de la classification, qui vise à « étiqueter » chaque donnée en l'associant à une classe.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

29

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

III.1 .2 PROCESSUS DU DATAMINING

Le datamining est un processus méthodique : une suite ordonnée d'opérations aboutissant à un résultat.

Le data ming est décrit comme un processus itératif complet constitué de quartes divisées en six phases qui sont représenté dans le tableau suivant :

PROCESSUS DU DATA MINING

Acteur

Etapes

Phases

Maitre d'oeuvre

Objectifs

1. Compréhension du métier :

2. Compréhension des données

 
 

Traitements

4 .Modélisation

5.Evaluation de la modélisation

Maître d'ouvrage

Déploiement

6. Déploiement des résultats de l'étude

Tableau .III .1: le processus du datamining.

a) Compréhension du Métier :

Cette phase consisté à :

Enoncer clairement les objectifs globaux du projet et les contraintes de l'entreprise.

Traduire ses objectifs et ses contraintes en un problème de data mining

Préparer une stratégie initiale pour atteindre ces objectifs.

b) Compréhension des données

Cette phase consiste à :

Recueillir les données, utiliser l'analyse exploratoire pour se familiariser avec les données, commencé à les comprendre et imaginer ce qu'on pourrait en tirer comme connaissance. Evaluer la qualité des données, Eventuellement, sélectionner des sous ensembles intéressants.

c) Préparation des données

Cette phase aide à préparer, à partir des données brutes, l'ensemble final des données qui va être utilisé pour toutes les phases suivantes :

Sélectionner les cas et les variables à analyser, réaliser si nécessaire les

transformations de certaines données, réaliser si nécessaire la suppression de certaines données.

d) Modélisation

La phase de la modélisation consiste à :

Sélectionner les techniques de modélisation appropriées (pouvant être utilisées pour le même problème) calibrer les paramètres des techniques de modélisation choisies pour optimiser les résultats ;

Eventuellement revoir la préparation des données pour l'adapter aux techniques utilisées.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

30

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

e) Evaluation de la modélisation

? Pour chaque technique de modélisation utilisée, évaluer la qualité (la pertinence) des résultats obtenus ;

? Déterminer si les résultats obtenus atteignent les objectifs globaux identifiés pendant la phase de compréhension du métier ;

? Décider si on passe à la phase suivante (le déploiement) ou si on souhaite reprendre l'étude en complétant le jeu de données.

f) Déploiement des résultats obtenus

Cette phase est externe à l'analyse du datamining .Elle concerne le maître d'ouvrage. Prendre les décisions en conséquence des résultats de l'étude de data mining

Préparer la collecte des informations futures pour permettre de vérifier la pertinence des décisions effectivement mis en oeuvre.

III.1 .3 LES TACHES DU DATA MING

Contrairement aux idées reçues, le Data Mining n'est pas le remède miracle capable de résoudre toutes les difficultés ou besoins de l'entreprise cependant, une multitude de problèmes d'ordre intellectuel, médical, économique peuvent être regroupés, dans leurs formalisations, dans l'une des tâches suivantes :

1. Classification

2. Estimation

3. Prédiction

4. Discrimination

5. Segmentation

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

31

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

III.I.3.1 LES TACHES ET TECHNIQUE DU DATAMINING

TACHES

TECHNIQUE

Classification

L'arbre de décision

Le raisonnement par cas

L'analyse de lien

Estimation

Le réseau de neurones

Prédiction

L'analyse du panier de la ménagère

Le raisonnement base sur le mémoire

L'arbre de décision

Les réseaux de neurones

Extraction de connaissance

L'arbre de décision

Tableau III 2:le taches et technique du datamining.

En outre, hormis ces quelques techniques et tâches du datamining, nous signalons qu'il existe d'autres que nous n'avons pas énumérez dans notre travail.

III .2 ARBRE DE DECISION [4, 9]

III .2.1 INTRODUCTION A L'ARBRE DE DECISION

Un arbre de décision est une structure qui permet de déduire un résultat à partir de décisions successives. Pour parcourir un arbre de décision et trouver une solution, il faut partir de la racine. Chaque noeud est une décision atomique.

Proche en proche, on descend dans l'arbre jusqu'à tomber sur une feuille. La feuille représente la réponse qu'apporte l'arbre au cas où l'on vient de tester.

Début à la racine de l'arbre

Descendre dans l'arbre en passant par les noeuds de test, la feuille atteinte à la fin permet de classer l'instance testée. Très souvent on considère qu'un noeud pose une question sur une variable, la valeur de cette variable permet de savoir sur quels fils descendre. Pour les variables énumérées, il est parfois possible d'avoir un fils par valeurs, on peut aussi décider que plusieurs variables différentes mènent au même sous arbre.

Pour les variables continues, il n'est pas imaginable de créer un noeud qui aurait potentiellement un nombre de fils infini, on doit discrétiser le domaine continu (arrondis, approximation), donc décider de segmenter le domaine en sous ensembles. Plus l'arbre est simple, et plus il semble techniquement rapide à utiliser.

En fait, il est plus intéressant d'obtenir un arbre qui est adapté aux probabilités des variables à tester. La plupart du temps un arbre équilibré sera un bon résultat.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

32

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Si un sous arbre ne peut mener qu'à une solution unique, alors tout ce sous-arbre peut être réduit à sa simple conclusion, cela simplifie le traitement et ne change rien au résultat final.

III .2.2 DEFINITION

Un arbre de décision est un outil d'aide à la décision et à l'exploration de données. Il permet de modéliser simplement, graphiquement et rapidement un phénomène mesuré plus ou moins complexe. Sa lisibilité, sa rapidité d'exécution et le peu d'hypothèses nécessaires a priori expliquent sa popularité actuelle.

III .2.3 CARACTERISTIQUES ET AVANTAGES :

Le caractéristique principale est la lisibilité du modèle de prédiction que l'arbre de décision fourni, et de faire comprendre ses résultats afin d'emporter l'adhésion des décideurs.

Cet arbre de décision à également la capacité de sélectionner automatiquement les variables discriminantes dans un fichier de données contenant un très grand nombre de variables potentiellement intéressantes. En ce sens, constitue aussi une technique exploratoire privilégiée pour appréhender de gros fichiers de données.

III .2.4 ALGORITHME ID3 [4, 13]

L'algorithme ID3 à été développé à l'origine par ROSS QUINLAN. C'est un algorithme de classification supervisé. C'est-a-dire il se base sur des exemples déjà classés dans un ensemble de classes pour déterminer un modèle de classification. Le modèle que produit ID3 est un arbre de décision. Cet arbre servira à classer de nouveaux échantillons. Il permet aussi de générer des arbres de décisions à partir de données. Imaginons que nous ayons à notre disposition un ensemble d'enregistrements ayant la même structure, à savoir un certain nombre de paires attribut ou valeur. L'un de ses attributs représente la catégorie de l'enregistrement. Le problème consiste à construire un arbre de décision qui sur la base de réponses à des questions posées sur des attributs non cible peut prédire correctement la valeur de l'attribut cible. Souvent l'attribut cible pend seulement les valeurs vrai, faux ou échec, succès.

III .2.5 PRINCIPES

Les principales idées sur lesquels repose ID3 sont les suivantes :

Dans l'arbre de décision chaque noeud correspond à un attribut non cible et chaque arc a une valeur possible de cet attribut. Une feuille de l'arbre donne la valeur escomptée de l'attribut cible pour l'enregistrement testé décrit par le chemin de la racine de l'arbre de décision jusqu'à la feuille. (Définition d'un arbre de décision). Dans l'arbre de décision, à chaque noeud doit être associé l'attribut non cible qui apporte le plus d'information par rapport aux autres attributs non encore utilisés dans le chemin depuis la racine.(Critère d'un bon arbre de décision). L'entropie est utilisée pour mesurer la quantité d'information apportée par un noeud. (Cette notion a été introduite par Claude Shannon lors de ses recherches concernant la théorie de l'information qui sert de base à énormément de méthodes du datamining).

Algorithme

Entrées : ensemble d'attributs A; échantillon E; classe c

Début

Initialiser à l'arbre vide;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

33

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Si tous les exemples de E ont la même classe c

Alors étiqueter la racine par c;

Sinon si l'ensemble des attributs A est vide

Alors étiqueter la racine par la classe majoritaire dans E;

Si non soit a le meilleur attribut choisi dans A;

Étiqueter la racine par a;

Pour toute valeur v de a

Construire une branche étiquetée par v;

Soit Eav l'ensemble des exemples tels que e(a) = v;

ajouter l'arbre construit par ID3 (A-{a}, Eav, c);

Fin pour Fin sinon

Fin sinon

Retourner racine;

Fin

III .2.2 EXEMPLE PRATIQUE

Pour introduire et exécuter "à la main" l'algorithme ID3 nous allons tout d'abord considérer l'exemple ci-dessous: Une entreprise possède les informations suivantes sur ses clients et souhaite pouvoir prédire à l'avenir si un client donné effectue des consultations de compte sur Internet.

EXEMPLE PRATIQUE D'UN ALGORITHME ID3

client

Moyenne des montants

Age

Lieu de Résidence

Etudes supérieures

Consultation par internet

1

Moyen

Moyen

Village

Oui

oui

2

Elevé

Moyen

Bourg

Non

non

3

Faible

Age

Bourg

Non

non

4

Faible

Moyen

Bourg

Oui

oui

5

Moyen

Jeune

Ville

Oui

Oui

6

Elevé

Agé

Ville

Oui

non

7

Moyen

Agé

Ville

Oui

non

8

Faible

Moyen

Village

Non

non

Tableau III 3:exemples pratiques

Ici, on voit bien que la procédure de classification à trouver, qui à partir de la description d'un client, nous indique si le client effectue la consultation de ses comptes par Internet, c'est-à-dire la classe associée au client.

- le premier client est décrit par (M : moyen, Age : moyen, Résidence : village, Etudes : oui) et a pour classe Oui.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

34

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

- le deuxième client est décrit par (M : élevé, Age : moyen, Résidence : bourg, Etudes : non) et a pour classe Non.

Pour cela, nous allons construire un arbre de décision qui classifie les clients. Les arbres sont construits de façon descendante. Lorsqu'un test est choisi, on divise l'ensemble d'apprentissage pour chacune des branches et on

Réapplique récursivement l'algorithme.

H(C[Lieu) = -P (bourg). (P (C[bourg) log (P (C[bourg)) + P (C [bourg)

Choix du meilleur attribut : Pour cet algorithme deux mesures existent pour choisir le meilleur attribut : la mesure d'entropie et la mesure de fréquence:

L'entropie : Le gain (avec pour fonction i l'entropie) est également appelé l'entropie de Shannon et peut se réécrire de la manière suivante :

Pour déterminer le premier attribut test (racine de l'arbre), on recherche l'attribut d'entropie la plus faible. On doit donc calculer H(C[Solde), H(C[Age), H(C[Lieu), H(C[Etudes), où la classe C correspond aux personnes qui consultent leurs comptes sur Internet.

H(C[Solde) = -P (faible).(P (C[faible) log(P (C[faible)) + P (C [faible) log(P (C[faible)))-P (moyen).(P (C[moyen) log(P (C[moyen)) + P (C[moyen) log(P (C[moyen)))-P (eleve).(P (C[eleve) log(P (C[eleve)) + P (C[eleve) log(P(C[eleve)))H(C[Solde)

H(C[Solde) = -3/8(1/3.log(1/3) + 2/3.log(2/3)-3/8(2/3.log(2/3) + 1/3.log(1/3)

-2/8(0.log (0) + 1.log(1)

H (C[Solde) = 0.20725

H(C[Age) = -P (jeune).(P (C[jeune) log(P (C[jeune)) + P (C [jeune) log(P (C[jeune)))-P (moyen).(P (C[moyen) log(P (C[moyen)) + P (C [moyen) log(P (C[moyen)))-P (age).(P (C[age) log(P (C[age)) + P (C[age) log(P (C[age)))

H(C[Age) = 0.15051

Log (P (C[bourg)))-P (village).(P (C[village) log(P (C[village)) + P (C [village) log(P (C[village)))-P (ville).(P (C[ville) log(P (C[ville)) + P (C[ville)

Log (P (C[ville)))

H(C[Lieu) = 0.2825

H(C[Etudes) = -P (oui).(P (C[oui) log(P (C[oui)) + P (C [oui) log(P (C[oui)))

-P (non).(P (C[non) log(P (C[non)) + P (C[non) log(P (C[non))) H(C[Etudes) = 0.18275 Le premier attribut est donc l'âge (attribut dont l'entropie est minimale). On obtient l'arbre suivant :

FIG III 1:Arbre de décision construit à partir de l'attribut àge

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

35

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Pour la branche correspondant à un âge moyen, on ne peut pas conclure, on doit donc

recalculer l'entropie sur la partition correspondante.

H(C|Solde) = -P (faible).(P (C|faible) log(P (C|faible)) + P (C |faible) log(P

(C|faible)))-P (moyen).(P (C|moyen) log(P (C|moyen)) + P (C|moyen)

Log (P (C|moyen)))-P (eleve). (P (C|eleve) log(P (C|eleve)) + P (C|eleve) log(P

(C|eleve)))

H(C|Solde) = -2/4(1/2.log(1/2) + 1/2.log(1/2)-1/4(1.log(1) + 0.log(0)

-1/4(0.log (0) + 1.log (1)

H (C|Solde) = 0.15051

H(C|Lieu) = -P (bourg).(P (C|bourg) log(P (C|bourg)) + P (C |bourg) log(P

(C|bourg)))-P (village).(P (C|village) log(P (C|village)) + P (C |village) log(P

(C|village)))-P (ville).(P (C|ville) log(P (C|ville)) + P (C|ville) log(P (C|ville)))

H (C|Lieu) = 0.30103

H (C|Etudes) = -P (oui).(P (C|oui) log(P (C|oui)) + P (C |oui) log(P (C|oui)))

-P (non). (P (C|non) log(P (C|non)) + P (C|non) log(P (C|non))) H(C|Etudes) = 0

L'attribut qui a l'entropie la plus faible est « Etudes ».

L'arbre devient alors :

FIG III 2:Arbre de décision finale

L'ensemble des exemples est classé et on constate que sur cet ensemble d'apprentissage, seuls deux attributs sur les quatre sont discriminants.

III.3 CONCEPTS THEORIQUES SUR LE GRAPHE [6, 8, 9] Graphe :

Définition : Un graphe G est un couple G=(X, U) ,X est un ensemble non vide et au plus dénombrable .

Nota :X est un ensemble fini ,les éléments de x?X sont appelés les sommets ou noeuds ,u = une famille d'éléments du produit cartésiens XxX .

Les éléments de U=(x,y) ,x,y?X, sont appelés :

Soit des arcs lorsqu'on tient compte de l'orientation, soit les arêtes lorsqu'on ne tient pas compte de l'orientation.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

36

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Graphe connexe :

Définition :

Un graphe est connexe si l'on peut atteindre n'importe quel sommet à partir d'un sommet quelconque en parcourant les différentes arêtes.

Exemple : soit G=(X, U) qui est un graphe connexe

U6 U5

U7

U8

EX :

U4

U3

U1 U2

Arbres et arborescence

1. Arbres :

Définition : Un arbre est un graphe connexe sans cycle. C'est-à-dire dont on peut atteindre n'importe quel sommet à partir d'un sommet quel- conque en parcourant différents arêtes et ses arêtes ne coïncide pas.

EX :

2) Arborescence :

Définition : une structure qui permet de déduire un résultat à partir de décision successive.

Soit G=(X, U) on dit que le sommet rX est une racine de G si V xX,(avec xr)? un chemin de r à x .c'est -à -dire un arbre ayant une racine.

Exemple :

b

c

d

a

f

e

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

37

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

CONCLUSION PARTIELLE

Dans ce chapitre nous avons présenté le datamining avec ses différentes méthodes, tâches, techniques et nous avons fait un briefing sur la notion relative à la théorie de graphe. Nous avons aussi construit un arbre de décision ou nous nous somme basé sur l'attribut âge et l'étude.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

38

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

39

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

CHAP IV : MODELISATION ET APPLICATION [2,8]

IV.0 INTRODUCTION

Ce chapitre est consacré à la réalisation de notre système décisionnel pour le recrutement du personnel ainsi qu'à la réalisation de l'application opérationnelle qui permettra au chef du personnel de la Direction Générale de recette du Kasaï Occidental (DGR KOC) de prendre des décisions concernant le recrutement des agents ou du personnel.

Cette application est réalisée pour le service de ressource humaine de la Direction général de recette du Kasaï occidentale qui constitue le champ d'application de notre travail.

Ainsi, nous parlerons de l'aperçu historique, la situation géographique, suivie de la structure organisationnelle pour terminer par une conception de notre système décisionnel.

Par ailleurs, nous tenons à signaler que notre étude porte sur la réalisation d'un système décisionnel qui permettra de faire des analyses sur les recrutements à la direction Générale de recette du Kassaï Occidental.

IV.1 ANALYSE DE L'EXISTAN

APERÇU HISTORIQUE

La Direction Générale de Recette du Kasaï Occidental (DGRKOC) est un service de l'Etat, décentralisé ayant pour mission principale la mobilisation des recettes provincial.

Tous Sous la couverture de la loi du pays constitution du 18 février 2016 qui donne la libre administration ou un Etat fédéral dont les dirigeants ou les décideurs sont plus proches du gouvernement, l'édit n°2 de la nomenclature accorde la chance à l'institution publique provinciale de l'Etat de créer une institution financière en vue de la décentralisation et l'autofinancement de la province ; c'est ainsi que le gouverneur Trésor KAPUKU NGOY eu l'idée de créer le 28 février 2008, une régie financière appelée Brigade de mobilisation des recettes ( BMR) sous l'autorisation de l'assemblée provinciale ; Cette régie financière présentait la structure suivante :

? Directeur Provincial ;

? Directeur Provincial Adjoint ;

? 6 divisions ;

? 18 bureaux ;

? Et 12 centres de perception (centre de la catégorie A et B)

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

40

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Tous les centres de la catégorie A étaient chapotés par les chefs de division et ceux de la catégorie B, par les chefs de bureaux.

Lorsque le gouverneur Alex KANDE arriva, après avoir fait différents constats, il trouva que cette structure était politisée, le recrutement était politique sans tenir compte des capacités et compétences des certaines personnes ; cette structure n'était pas aussi conforme à la loi et c'est ainsi qu'il créa toujours sous l'autorisation de l'assemblée provinciale, une régie financière appelée Direction Générale des recettes du Kasaï occidental (DGRKOC) par l'édit n°17 avec la structure ci - après :

> Directeur Général

> Directeur Général Adjoint ;

> 4 directeurs ;

> 16 chefs de division ;

> 52 chefs de bureaux ;

> Et 208 agents d'exécution et aussi des centres de perception au nombre de 12.

Malgré cette structure qui devait corriger la précédente, nous remarquons que jusqu'à ce jour, cette dernière n'a pas encore connue une modification.

La DGRKOC comme étant un service d'octroi décentralisé qui a pour mission principale la mobilisation des recettes provinciale comme toute centre de régie financière, la DGRKOC s'inscrit aussi dans la chaine de réception des recettes ou chaine de recette.

SITUATION GEOGRAPHIQUE

La Direction Générale de Recette du Kasaï Occidentale se situe sur la ville de Kananga, commune du même nom, au quartier malandji sur l'avenu Kikoler au N° 6 elle est bornée :

> AU Nord par la maison communale de Kananga ; > Au Sud par les complexes scolaires amis de David > A l'Est par la fondation femme plus et

> A l'Ouest par l'immo Kasaï.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

41

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

IV.1.1 STRUCTURE DE L'ENTREPRISE

La Direction Général de recette du Kasaï occidental égorge des services ou division ci-après :

I. DIVISION BD'ASSIETTE

La division d'assiette est une division qui entre dans la ligne de mobilisation des recettes elle s'occupe de :

· Recensement et identification des contribuables ainsi que l'élaboration et le suivi des répertoires des contribuables ;

· Recherche et recoupement des données fiscales et parafiscales ;

· Distribution des déclarations, le dépouillement de déclaration rentrées et taxation des redevables ;

· Documentation, gestion des dossiers des contribuables et relance des contribuables insolvables ou défaillants ;

· Initiation des missions d'enquêtes fiscales et parafiscales ;

· Enrôlement des impôts à charge des contribuables et élaboration, coordination des procédures d'assiette sur l'ensemble de la province.

II. DIVISION ADMINISTRATIVE Cette division s'occupe de :

· S'assurer le secrétariat unique et coordonner les activités du bureau du Directeur Provincial et celles du Directeur Provincial Adjoint ;

· Préparer les dossiers soumis aux Directeur provincial adjoint ou évoquer par eux ;

· Assurer la communication et la vulgarisation de la législation ainsi que de la réglementation fiscale et parafiscale ;

· Etudier et mettre en oeuvre l'information de la Brigade de mobilisation des recettes provinciales du Kasaï Occidental ;

· Faire le suivi des services attachés à la Direction.

BUREAU ADMINISTRATION ET SECRETARIAT

Ce bureau s'occupe de :

· Traite les dossiers lui confier par le Directeur Provincial ou le Directeur Provincial Adjoint ;

· Emettre la demande de la Direction Provinciale, les avis et considération sur les dossiers traités par les services et devant être soumis à l'appréciation du Directeur provincial ou à celle du Directeur provincial adjoint ;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

42

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

· Préparer et élaborer les comptes rendus des réunions présidées par le Directeur provincial ou le Directeur provincial Adjoint ;

· Rédiger les projets des allocations et discoure du Directeur provincial ou directeur provincial adjoint ;

· Assister le directeur provincial ou le directeur provincial adjoint dans le suivi du traitement ou de l'instruction des dossiers revêtant un caractère urgent confiés aux différents services de la DGRKOC ;

· Préparer et rédiger les projets des rapports des missions effectuées par le Directeur provincial ou le directeur provincial adjoint ;

· Faire le suivi des relations avec les autres administrations ;

· Préparer des lettre-réponses des contribuables sur les questions de fond ou de forme soulevée en matière fiscale et parafiscale ;

2. Bureau étude et Informatique

· Préparer le traitement informatique des données fiscales et parafiscales ;

· Saisir des textes confiés à la Division administrative ;

· Elaboration d'une stratégie du système d'information fiscale et parafiscale ;

· Evaluation des offres et choix des matériels informatique et des logiciels d'exploitation et d'application ;

· Analyse, développement, implantation et maintenance des applications informatiques ;

· Elaboration des cahiers des charges des projets informatiques ;

· Evaluation des besoins et organisation et des utilisateurs ;

· Prospection et proposition des stages de perfectionnement spécialisés ;

· Formulation des avis technique sur l'utilisation et les affectations des matériels et des consommables informatiques ;

· Préparer des projets d'instruction de service. III. DIVISION DE RESSOURCES HUMAINES

Cette division est compose des bureaux si après :

· La gestion du personnel de la DGRKOC ;

· La gestion financière et des infrastructures de la DGRKOC ;

· L'organisation du recrutement des agents nécessaires au fonctionnement et des services selon les modalités en vigueur en la matière ;

· Formation en cour de carrière des agents ;

· Gestion de matérielle et mobilière de la DGRKOC.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

43

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV. DIVISION DE CONTROLE FISCAL ET ORDONNACEMENT DES RECETTES FISCALES PARAFISCALES

Cette division est chargée de :

· La tenu et la mise à jour d'une banque de données de recoupement lui transmis par la division d'assiette, la gestion des déclarations et relevés rentrés reçus de la division d'assiette ;

· La programmation des missions de contrôle et d'ordonnancement des taxes fiscales, administratives, rémunératoires et autres droits ainsi que le suivi des recettes exceptionnelles, de participation et des recettes des services émergeant aux budgets annexes, relevant d la compétence de la province ;

· L'établissement après le control, des avis d'imposition ou de redressement selon les cas pour les impôts ainsi que l'ordonnancement des taxes parafiscales ;

V. DIVISION DE RECOUVREMENT

La division de recouvrement a pour attributions :

· La définition de la stratégie et des objectifs tant quantitatifs que qualitatifs en matière de recouvrement ;

· La perception des sommes dues au trésor provincial au titre des impôts, taxe, redevance et autres droits relevant de la compétence de la province à base des avis de taxation d'office, d'imposition d'office, de relance, des extraits de rôle lui transmis par la division d'assiette ainsi que les avis d'imposition d'office, de redressement des recettes fiscales et textes parafiscales ordonnancées lui transmis par la division de contrôle fiscale et d'ordonnancement des recettes fiscales et parafiscales ;

· L'évaluation des performances de réalisation des recettes, l'amélioration du rendement des services et la consolidation des résultats en matière de recouvrement ;

· Transmission au service de contentieux et poursuite de la liste des contribuables insolvables suivie des sanctions ;

· L'amorce des opérations des poursuites créances de la province dues mais non recouvrées et délivrer les acquis libératoires ;

· L'apurement des comptes courants des redevables des impôts, taxes, redevances et autres droits recouvrés relevant de la compétence de la province.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

44

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

? Etablissement de note de perception de sommes dues à la province, établissement et expédition des avis de mise en recouvrement des impôts taxes, redevances et autres droits dus à la province établis par voie de rôle ;

? Recouvrement par voie des déclarations auto liquidatives et recouvrement des pénalités revenant à la DGR KOC.

VI. CENTRE DES RECETTES FISCALES ET PARAFISCALES

Les centre des recettes fiscales et parafiscales sont chargés de mener, dans leurs ressort respectifs, les opération d'assiette, de contrôle et de recouvrement des impôts provinciaux et locaux ainsi que celles d'ordonnancement des taxes redevances et autres.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

45

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.1.2 ORGANIGRAMME DE LA DIRECTION GENERAL RECETTE DU KASSAI OCCIDENTAL

DIRECTEUR GENERAL

DIRECTEUR GENERAL ADJOINT

DIRECTEUR TECHNIQUE

3 Bureaux

14

4AUDITEUR

1

2

3

4 5

6

7

8

9 10

 
 
 

DIV

DIV

DIV

DIV

 

RHF SG

ADM

ASSIETT

C.FSC.O

 

AUDIT

 

DIV
REC

11 12 13

 

CENTRE

CENTRE

CENTRE

CENTRE

TPA

KAMONIA

ILEBO

LUEBO

 

 
 
 

DIV
CONTEN

 

CENTRE
KGA1

 

3Bureaux

3 Bureaux

3 Bureaux

3 bureaux

2Antennes

5Antennes

7 Antennes

CENTRE

 

CENTRE

 

CENTRE

 

CENTRE

 

CENTRE

 

CENTRE

 

CENTRE

LUEBO

 

DEMBA

 

DIBAYA

 

MWEKA

 

KAZUMBA

 

DIMBELENGE

 

DEKESE

 
 
 
 
 
 
 
 
 
 
 
 
 

2Antennes

 

Fig IV.1 Organigramme de l'entreprise

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

46

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.1.3 FONCTIONNEMENT DE LA DIVISION DES RESSOURCES

HUMAINES

Cette division s'occupe de la gestion du personnel, la gestion financière et des infrastructures, de l'organisation du recrutement des agents nécessaire au

fonctionnement des services selon les modalités en vigueur en la matière, formation en

cours de carrière des agents et la gestion matérielle et mobilière de la Direction Générale de Recette du Kasaï Occidental.

IV.1.4 ORGANIGRAMME DU SERVICE CONCERNE

DIVISION DECRESOURCES HUMAINES

BUREAU GESTION
BUGJETAIRE ET
MATERIEL

BUREAU DU
PERSONNEL PAIE
ET FORMATION

BUREAU AFFAIRE
SOCIAL ET
RELATION PUBLIC

Fig. IV.2 organigramme du service concerné.

IV.1.5 DESCRIPTION DES POSTES

La division des ressources humaine regroupe à son sein le bureau ci-dessous :

1. Bureau Gestion du personnel, paie et formation Ce bureau s'occupe de :

· suivre le respect de l'organigramme par les services et pouvoir aux postes vacants ;

· examen des cas de recours d'avancement en grade ;

· étude et traitement des aspects juridique et du contentieux à la carrière des agents ;

· rédaction des attestations de services, feuilles de route, communiqués de service et autres documents administratifs ;

· traitement des demandes de congé et gestion du mouvement général congé du personnel ;

· tenue et exploitation des relevés de cotation des agents et classement des dossiers administratifs des agents ;

· préparation des dossiers de retraités et suivi des dossiers des décédés ;

· organisation et gestion de la paie des traitements et primes, tenue des statistiques de la paie ;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

47

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

· Tenue des statistiques de la paie, collecte des besoins en formation ;

· Organisation matérielle et pédagogique des sessions de formation. 2. Bureau affaires sociales et relation publiques

Ce bureau s'occupe de :

· Entreprendre toutes les démarches pour l'obtention des cartes d'ayant droit en faveur des cadres et agents ;

· Initier des conventions médicales avec les formations médicale de la place ;

· Réceptionner, enregistrer et contrôler les ordonnances médicales et les facture introduite par les agents ;

· Initier les appels de fonds pour payer les déclarations des créances en faveur des agents malades et autres ayant-droits ;

· Payer les factures ou les produits pharmaceutiques en faveur des agents malade et leur ayant-droit ;

· S'assurer de la prise en charge par la fonction publique des retraités et payer les rentes aux bénéficiaires en attendant prise en charge effective ;

· Distribuer des vivres à l'occasion des fêtes de fin d'année et nouvel an ;

· Entreprendre les démarches ayant trait l'assurance du personnel auprès de la SONAS et autres agences d'assurances agrées ;

3) Bureau Gestion budgétaire et matérielle

C'est bureau s'occupe de :

· Gestion des crédits alloués à la DGRKOC ;

· Acquisition et gestion des biens, meubles et immeubles nécessaires au bon fonctionnement de la DGRKOC ;

· Suivi des opérations de mise à la disposition de la DGRKOC des fonds (rétrocession, pénalités revenant à la DGRKOC, prime de mobilisation, prime de plus-value, rémunération, remboursements spéciaux et autres, etc.) ;

· Suivi des opérations bancaires ;

· Exécution du plan de trésorerie par la préparation des chèques ou bons de caisse ;

· Suivi des opérations comptables et tenue des livres auxiliaires en faisant le rapprochement entre les paiements et les lignes de crédit ;

· Préparation des états de paie et collecte des informations sur les actions de recouvrement des pénalités revenant à la DGRKOC ;

· Centralisation des informations sur la prime du contentieux et suivi des paiements pris en charge par la DGRKOC (loyer, soins de santé, etc.) ;

· Tenue des fiches et comptes des fournisseurs des biens et services ;

· Elaboration du plan de paiement ;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

48

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

PROBLEME RENCONTRER

Lors des nos recherche à la Direction Générale de Recette du Kasaï Occidental, dans la division des ressources humaine précisément dans le Bureau du personnel nous avons constaté que le chef du personnel ne pas surtout disponible dans son bureau, et aussi pour saisir ou bien vérifier quelques informations sur un personnel il faut toujours recourir dans le bureau ou il y a des matérielles informatique installer et aussi il y a insuffisance de personnel qualifier dans certain services.

PROBLEMATIQUE ET MOTIVATION

La problématique de ce travail est de mettre en place un data mart en vue de faire des analyses tout en évitant le recrutement par connaissance ou par lien familiale.

Le sujet de ce data mart est le Recrutement, pour permettre aux décideurs d'avoir une vue d'ensemble sur ce qui concerne le Recrutement du personnel à la Direction Général de Recette du Kasaï Occidental dont voici les motivations :

? D'aider le chef du personnel à arriver à faire un bon recrutement ;

? Recruter des agents qui peuvent servir notre province sur ce qui concerne les recettes ;

? D'aider le décideur à prendre une bonne décision pour ce qui concerne le recrutement du personnel ;

? D'aidé le décideur à avoir des critères basé sur le recrutement du personnel à la Direction Général de Recette du Kassaï occidental ;

? Avoir tout les informations concernant les nouveaux personnels engagés, sur son dossier, la date d'engagement et autre.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

49

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.2 MODELISATION

IV.2.1 OUTIL UTILISE

Nous présentons succinctement les outils ainsi que les nouvelles méthodes de développement de processus décisionnels qui en découlent.

1. Microsoft Visual Studio team système

SQL serveur 2008 (business intelligence)

Ici nous allons énumérer les modules et composantes de SQL serveur 2008.

Composant

Module SQL Serveur 2008

Destination dans l'entreprise

Workflow+Flux de

données (ETL)

Intégration de services

(SSIS)

Administrateur de base des

données

Entrepôt de données relationnel

et multidimensionnel

Base de données

relationnelle SQL serveur
2005

Administrateur et développeurs

Base de donnés

multidimensionnelle analytique

Analysis service

Développeur et utilisateur

ayant des connaissances métier

exploration des données

Data mining intégré à

Analysis services designer

Staticien ou développeur

utilisateur

Création de rapport et

de modèle
sémantique et métier

Reporting services designer

Développeurs

Requêtes et analyses spécifiques

Report builder 1.0 Excel,

proclarity

Analystes métier

Développement d'application BI

SQL serveurBusiness

Intelligence Devellopment

Studio(BIDS)=Visual Studio

Développeur

Outil de gestion de base de données

SQL Server management

studio

Administraeur et developeur

Service de

notification

SQL Server notification

service

Alertes envoyées aux managers sur des événements métier

 

Tableau IV .1: répartition de module de SQL serveur 2008 par composante.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

50

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.3 LE SYSTEME TRANSACTIONNEL SQL SERVEUR

IV.3.1 DEFNITION

T-SQL est un langage dédié à l'accès aux données, il est une extension de SQL et if/then/switch...) OU est un véritable serveur de base de données SQL multi-utilisetur, SQL est le plus populaire langage de base de données dans le monde.

AVANTAGE

Voici quelques avantage quel nous offres :

? Performât SQL server se classe parmi les SGBDR les plus rapides ;

? Evolution et fiable : vous pouvez repartir la charge sur Plusieurs serveurs,

bénéficier des avantages des systèmes multiprocesseurs et profiter des
performances d'applications de Windows 2000 Datacenter server qui supporte 32 processeurs et 64 go de ram.

? Rapidité de mise en oeuvre avec SQL server, le développement, le d'ploiement et l'administration d'application destinés au web sont accélérés grâce aux nombreux fonctionnements dédiées, ainsi qu'au support du web. Bref est un langage qui rend facile le stockage, la mise à jour et l'accès à l'information client sur site web.

IV.2.2 MODELISATION MULTIDIMENSIONNELLE DE DATAMART

Pour construire un entrepôt global d'une entreprise il ya des méthodes : Top down : c'est la méthode la plus lourde, la plus contraignante et la plus complète en même temps elle consiste en la conception de tout l'entrepôt, puis la réalisation de ce dernier.

Bottom-up : c'est l'approche inverse, elle consiste à créer les étoiles, puis les regrouper par des niveaux intermédiaires jusqu'à l'obtention d'un véritable entrepôt pyramidal avec une vision d'entreprise.

Middle-Out : c'est l'approche hybride, et conseillée par les professionnels du business intelligence. Cette méthodes consiste en la conception totale de l'entrepôt des données c-à-dire concevoir toutes dimensions, tous les faits, toutes les relations, puis créer des divisions plus petites et plus gérables et les mettre en oeuvre.

Pour notre étude nous avons construit un DataMart représentant une étoile pour l'hôpital qui est un DataMart sur les accouchements au service de la maternité.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

51

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.2.3 MODELISATION DE L'APPLICATION

Pour notre modélisation nous allons utiliser le langage UML.

Au début des années 90, il existait une Cinquantaine de méthodes objet liées par un certain consensus autour d'idées communes:

Classes, sous -systèmes. Mais chacune possédait sa propre notation, ses points forts, ses manques et son orientation privilégiée vers le domaine d'application. L'idée d'une certaine unification des méthodes objet est née de ce constant. La communauté informatique, autour de l'OMG (Objet Management Group) qui standardise les technologies de l'objet, s'est attachée à la définition d'un langage commun unique, utilisable par toutes les méthodes objets, dans toutes les phases du cycle de vie et compatible avec les techniques de réalisation du moment.

Définition : UML (Unified Modeling Language) en français Langage de Modélisation Unifié qui est une notation basée principalement sur les méthodes OOD (de Booch), OMT (de Rumbaugh) et OOSE (de Jacobson)

L'UML a été proposé afin de standardiser les produits du développement (Modèle, notation, diagrammes) sans standardiser le processus de développement.il est en effet très difficile de standardiser les processus de développement qui dépend des personnes, des applications, des cultures, etc.

UML se propose de créer un langage de modélisation utilisable à la fois par les humains (forme graphique) et les machines (syntaxe précise)

UML est une notation, non pas une méthode, c'est un langage de modélisation objet et convient pour toute les méthodes objets dans le domaine public. Elle a pour but de documenter les méthodes objet.

Nous avons modélisé la base de données opérationnelle avec la méthode

UML qui est la source de données alimentant notre entrepôt des données.

NARATION :

La Direction Général de Recette du Kasaï Occidental (DGR KOC) est une structure ou un service d'Etatique, décentralisé, qui a pour mission principale la mobilisation de recette provinciale.

Pour ce faire, la DGR KOC doit avoir un personnel reconnu au sein de sa structure. Le recrutement d'un agent à la DGR KOC est conditionnel, dans le cas ou elle n'éprouve un besoin en personnel et soumet au ministère de finance, après étude de besoin présenté par la régit, le ministère de finance procédera au lancement officiel de l'offre pourvu que l'offre atteigne toutes les couches de la société, tout en fixant la date limite du dépôt, c'est le chef du personnel qui reçoit les dossiers.

Les candidats intéressés procéderont à la constitution des dossiers et au dépôt dans la date fixée, ils les constitueront avec les éléments ci-après :

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

52

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

> Une lettre de motivation ;

> Une lettre de demande d'engagement ;

> Un diplôme de graduat, licence au doctorat ;

> L'attestation de nationalité ;

> L'attestation de bonne vie et moeurs et ;

> L'attestation médicale.

Le dossier contenant ces éléments est jugé complet au cas ou il ne manque pas un élément, au cas ou la candidature est intéressante et qu'il manque un élément, le service procédera à l'appel de candidat pour compléter son dossier.

Le candidat se présente avec son dossiers à la réception ou il le dépose à la fin de la période prévue pour le dépôt des dossiers, la réception codifiera le dossier et remettra la liste au candidat ou il inscrirera son nom et celui-ci acheminera ces dernier au chargé de ressources humaines qui procédera à la lecture et sélection des dossiers complets pour le test, puis l'élimination des autres candidats pour l'interview afin d'arriver à l'engagement effectif.

Les noms des candidats présélectionnés seront affichés pour passé au concours, une fois le concours effectués le service compétent procédera à la correction afin de retenir les candidats effectifs avant de transférer leurs dossiers au ministère de finance pour la validation afin d'attribuer des numéros matricule à ces derniers pour enfin être définitivement considéré comme agents effectifs.

1. DIAGRAMME DE CLASSE DE L'APPLICATION EN UML

Fig. IV.3 Diagramme de classe en UMl

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

53

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

2. DIAGRAMME DE SEQUENCE EN UML

Est une suite d'échange de message entre des objets qui compose le système pour réaliser les cas d'utilisation

CANDIDAT

 
 
 
 
 

SYSTEME

 
 
 
 

1 : depot de dossier+letrre motivatio()

2 : selection dossier()

3 : enregistrement du dossier()

4 : faire passé le test()

5 : passé le test()

6 : passé à la correction du test()

7 : envoi resultat test()

8 : confurmation et engagement()

Fig.IV.5 diagramme de séquence

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

54

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

1. DIAGRAMME DE CAS D'UTILISATION EN UML

Les diagrammes de classes expriment la structure statique du système, ils décrivent l'ensemble des classes et leurs associations.

Une classe décrit un ensemble d'objet (instance de classe) ; une association exprime une connexion sémantique bidirectionnelle entre classe, elle décrit un ensemble de lien (instances de l'association).

Les cardinalités(ou multiplicité) indiquent le nombre d'instance d'une classe pour chaque instance de l'autres classe.

candidat

System

lancer offfre

test d'admissions

<<extend>>

critères

dossier+lettre de demande d'engement

Decideur

<<extend>>

decision de recrutement

<<include>>

enregistrement profil candidat

<<include>>

lecture de dossier

<<include>>

authentification

selection de dossier

<<include>>

<<extend>>

chef du personnel

manupuler les outils decisionnel

transfer dedossier et resultat test

Fig. IV. 4 Diagramme de cas d'utilisation.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

55

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.2.4 .CONCEPTION D'UN DATA MART

Etape 1 : Définir le processus à analyser

La procédure ou fonction fait référence au sujet de notre mini entrepôt des données

Nous déterminons le processus métier de la DGR KOC par notre étude :

« Le Recrutement »Dont voici la modélisation de la base de données de l'entrepôt de données.

Etape 2 : Déterminer le niveau de granularité des données, choisir le grain qui signifie décider exactement de ce que représente un enregistrement d'une table de faits.par exemple l'entité candidat représente les faits relatifs à chaque recrutement et devient la table de faits du schéma en étoile des recrutements.

Par conséquent, le grain de la table de faits recrutement est un recrutement réalisé à la DGR KOC.

A prés avoir choisi le grain de la table de faits nous allons commencer à identifier les dimensions de la tables de faits.

A titre d'illustration, les entités candidat, critère et offre serviront de références aux données concernant le recrutement et deviendront les tables de dimensions du schéma en étoile de recrutement.

Nous ajoutons aussi le Temps comme dimension principale, car il est toujours présent dans le schéma en étoile.

Etape 3 : choisir les dimensions

Les dimensions déterminent le contexte dans lequel nous pourrons poser des questions à propos des faits établis dans la table de faits .Un ensemble de dimensions bien constitué rend le mini entrepôt de données compréhensible et en simplifie l'utilisation. Nous identifions les dimensions avec suffisance de détails, pour décrire des choses telles que les clients et les propriétés avec granularité correcte.

Par exemple, toute personne de la dimension candidat est décrite par les attributs suivants : nom, post nom, sexe, fonction, niveau d'étude, expérience.

La dimension offre est décrite par les attributs suivants : numéro offre, intituler offre, date de lancement, date de clôture, lier d'affectation code service

La dimension temps est décrite par les attributs suivants : id temps, année, semestre, trimestre, mois et jours.

Etape 4 : identifier les métriques (faits)

Pou notre cas le fait est recrutement. Les métriques sont les données numériques NUM

OFFRE, NBRE CRITERE TOTAL, NBRE CRITERE PAR CANDIDAT.

Notons que les autres étapes qui suivent exclusivement pour la construction d'un entrepôt des données. Mais pour notre travail nous construisons un DataMart donc un sous ensemble d'un entrepôt des données ainsi nous estimons que nous pouvons nous arrêter ace points.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

56

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

SHEMAT EN ETOILE

Fig. IV.5 schéma en étoile du recrutement sous SQL

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

57

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.2.5 BUSINESS INTELLIGENCE

La fenêtre de test de connexion avant de déployer le cube. Cette fenêtre nous donne la confirmation et l'assurance que le cube est connecté aux différentes sources hétérogènes extérieures et même l'état prochain de notre exécution sur le cube.

Fig. IV.6.Schéma Du BI

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

58

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

 

IV.2.6 Création du cube

Il faut sélectionner la vue de source de données et les tables, puis définir les propriétés du cube et attribuer lui un nom.

Voici la procédure normale :

· Clic sur droit sur Cubes

· Clic sur nouveau cube

· Clic sur suivant

· Clic sur suivant

· Cocher la case de table de fait

· Clic sur suivant, suivant, suivant, suivant, Termier

Fig. IV.7 Création de cube sous SQL

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

59

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

IV.3 IMPLEMENTATION

IV.3.1 INTERFACE

Formulaire du démarrage de l'application

Fig. IV.8. Formulaire d'accueil

Formulaire d'identification

Ce formulaire nous permet de s'y identifiée et accéder dans notre logiciel

Fig. IV.9 formulaire d'authentification.

60

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Voici le code source pour ce formulaire

using System;

using System.Collections.Generic;

using System.ComponentModel;

using System.Data;

using System.Drawing;

using System.Linq;

using System.Text;

using System.Windows.Forms;

namespace Application_huguette

{

public partial class Authentification : Form {

public Authentification() {

InitializeComponent();

}

private void Authentification_Load(object sender, EventArgs e) {

// TODO : cette ligne de code charge les données dans la table 'hugaplayDataSet3.UTILISATEUR'. Vous pouvez la déplacer ou la supprimer selon vos besoins.

this.uTILISATEURTableAdapter1.Fill(this.hugaplayDataSet3.UTILISATEUR); }

private void button1_Click(object sender, EventArgs e)

{

Form form = null;

Form Form1 = new Principal();

form = Form1;

form.Show();

this.Hide();

}

private void button3_Click(object sender, EventArgs e)

{

Application.Exit();

}

private void button2_Click(object sender, EventArgs e)

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

61

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

{

comboBox1.Text = ""; textBox1 .Text = ""; comboBox1.Focus();

}

private void groupBox1_Enter(object sender, EventArgs e) {

}

}

}

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

Formulaire principal permettent de choisir l'opération à effectuer

Fig. IV.10 formulaire principal

62

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Voici le code source pour ce formulaire

namespace Application_huguette

{

public partial class Principal : Form

{

public Principal()

{

InitializeComponent();

}

private void créationDoffreToolStripMenuItem_Click(object sender, EventArgs

e)

{

Form form = null;

Form Form1 = new Gestion_application ();

form = Form1;

form.Show();

this.Hide();

}

private void créationDunServiceToolStripMenuItem_Click(object sender,

EventArgs e)

{

Form form = null;

Form Form1 = new Gestion_application();

form = Form1;

form.Show();

this.Hide();

}

private void postulationToolStripMenuItem_Click(object sender, EventArgs e)

{

Form form = null;

Form Form1 = new POSTULATION ();

form = Form1;

form.Show();

this.Hide();

}

private void lISTEDOFFRESToolStripMenuItem_Click(object sender,

EventArgs e)

{

Form form = null;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

63

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Form Form1 = new LISTE_OFFRES ();

form = Form1;

form.Show();

this.Hide();

}

private void fERMERToolStripMenuItem_Click(object sender, EventArgs e) {

Application.Exit();

}

}

}

Formulaire d'enregistrement du candidat et information sur l'offre

Ce formulaire nous permet d'enregistrer le candidat postulant et de voir aussi les informations concernant l'offre.

Fig. IV.11 formulaire de saisie.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

64

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Voici le code source pour ce formulaire et connexion directe à la base de données :

namespace Application_huguette

{

public partial class Gestion_application : Form

{

public Gestion_application()

{

InitializeComponent();

}

Service ser = new Service();

Offre of = new Offre();

Critere cr = new Critere();

string chaine = null;

SqlConnection connex = null ;

SqlCommand requete = null;

public void connexion()

{

try

{

Chaine="Data Source=HUGUETTE-PC;Initial Catalog=hugaplay;Integrated

Security=True";

connex = new SqlConnection(chaine);

requete = new SqlCommand();

requete.Connection = connex;

}

catch (Exception)

{

MessageBox.Show("Echec de connexion à la base de données!");

}

}

public void initialiser()

{

txt_codeservice.Text = "";

txt_nomservice.Text = "";

txt_codeservice.Focus();

}

public void initialiser2() {

txt_numoffre.Text = ""; txt_intitule.Text = "";

txt_lieuaffectation.Text = "";

txt_nomserv.Text = "";

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

65

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

cmb_codeservice.Text = ""; txt_numoffre.Focus();

}

private void groupBox3_Enter(object sender, EventArgs e) {

}

private void groupBox4_Enter(object sender, EventArgs e) {

}

private void button8_Click(object sender, EventArgs e) {

listBox1.Items.Add(txt_critere.Text);

cr.Numerocritere = maxcritere.ToString();

cr.Nomcritere = txt_critere.Text;

cr.Numoffre = txt_numoffre.Text;

connexion();

requete.CommandText = "insert into CRITERES values('" + cr.Numerocritere

+ "', '" + cr.Nomcritere + "', '" + cr.Numoffre + "') ";

connex.Open();

requete.ExecuteNonQuery();

connex.Close();

MessageBox.Show("Enregistrement effectué avec succès!");

maxcritere += 1;

}

private void button7_Click(object sender, EventArgs e) {

initialiser();

}

private void button6_Click(object sender, EventArgs e) {

initialiser();

}

private void button1_Click(object sender, EventArgs e)

{

ser.Codeservice = txt_codeservice.Text; ser.Nomservice = txt_nomservice.Text;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

66

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

"',

connexion();

requete.CommandText = "insert into SERVICE values('" + ser.Codeservice +

'" + ser.Nomservice + "') ";

connex.Open();

requete.ExecuteNonQuery();

connex.Close();

MessageBox.Show("Enregistrement effectué avec succès!");

initialiser();

}

private void button4_Click(object sender, EventArgs e) {

DialogResult res = MessageBox.Show("Vous supprimerez toutes les informations concernant ce service dans la base de données, vous le voulez?", "QUESTION", MessageBoxButtons.YesNo, MessageBoxIcon.Question) ;

if (res == DialogResult.Yes)

{

connexion();

requete.CommandText = "delete from OFFRE where [Code

service]='"+txt_codeservice.Text +"' ";

connex.Open();

requete.ExecuteNonQuery();

connex.Close();

connexion();

requete.CommandText = "delete from SERVICE where [Code service]='" +

txt_codeservice.Text + "' ";

connex.Open();

requete.ExecuteNonQuery();

connex.Close();

MessageBox.Show("Suppression effectuée avec succès!");

}

else

{

initialiser();

}

}

int maxcritere = 0;

private void Gestion_application_Load(object sender, EventArgs e)

{

// TODO : cette ligne de code charge les données dans la table 'hugaplayDataSet.SERVICE'. Vous pouvez la déplacer ou la supprimer selon vos besoins.

this.sERVICETableAdapter.Fill(this.hugaplayDataSet.SERVICE);

connexion();

SqlDataReader lecture;

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

67

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

requete.CommandText = "select * from CRITERES";

connex.Open();

lecture = requete.ExecuteReader();

while (lecture.Read())

{

maxcritere = int.Parse(lecture[0].ToString());

}

maxcritere += 1;

connex.Close();

}

private void button12_Click(object sender, EventArgs e)

{

Form form = null;

Form Form1 = new Principal();

form = Form1;

form.Show();

this.Hide();

}

private void button11_Click(object sender, EventArgs e)

{

initialiser2();

}

private void button3_Click(object sender, EventArgs e)

{

Form form = null;

Form Form1 = new Principal();

form = Form1;

form.Show();

this.Hide();

}

private void button10_Click(object sender, EventArgs e) {

of.Numoffre = txt_numoffre.Text;

of.Intituleoffre = txt_intitule.Text;

of.Datelancement = DateTime.Parse(dtp_datelancement.Text);

of.Datecloture = DateTime.Parse(dtp_datecloture.Text);

of.Lieuaffectation = txt_lieuaffectation.Text;

of.Codeservice = cmb_codeservice.Text;

connexion();

68

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

requete.CommandText = "insert into OFFRE values('" + of.Numoffre + "', '" +

of.Intituleoffre + "','" + of.Datelancement + "', '" + of.Datecloture + "', '" +

of.Lieuaffectation + "', '" + of.Codeservice+ "') ";

connex.Open();

requete.ExecuteNonQuery();

connex.Close();

MessageBox.Show("Enregistrement effectué avec succès!");

}

private void button9_Click(object sender, EventArgs e)

{

initialiser2();

}

private void txt_numoffre_TextChanged(object sender, EventArgs e) {

}

private void groupBox1_Enter(object sender, EventArgs e) {

}

private void button5_Click(object sender, EventArgs e)

{

connexion();

SqlDataReader lecture;

requete.Connection = connex;

requete.CommandText = "select * from SERVICE where [Code service]='" +

txt_codeservice.Text + "'";

connex.Open();

lecture = requete.ExecuteReader();

while (lecture.Read())

{

txt_codeservice.Text = lecture[0].ToString(); txt_nomservice.Text = lecture[1].ToString();

}

connex.Close();

}

private void button2_Click(object sender, EventArgs e)

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

69

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

{

ser.Codeservice = txt_codeservice.Text; ser.Nomservice = txt_nomservice.Text;

connexion();

requete.CommandText = "update SERVICE set [Code service]='" +

ser.Codeservice + "', [Nom service]='" + ser.Nomservice + "' ";

connex.Open();

requete.ExecuteNonQuery();

connex.Close();

MessageBox.Show("Enregistrement effectué avec succès!");

initialiser();

}

}

}

Conclusion partielle

Dans ce chapitre nous avons commencé par présenter la Direction Générale de Recette du Kassaï Occidental à Kananga qui est notre champs d'application, en suite nous avons cité les outils utilises pour la réalisation de ce travail et enfin nous avons présenté les interfaces graphiques de notre DataMart.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

70

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

CONCLUSION GENERALE

Nous voici arrivés au terme de notre réflexion scientifique, fruit de nos recherches rendue visible par ce travail de fin de notre deuxième cycle, qui sanctionne la fin de nos études universitaire à l'Université Notre-Dame du Kasayi (U.KA), dans la faculté des sciences informatiques ; travail qui a porté sur la mise en place d'un système décisionnel basé sur le Datamart et l'arbre de décision pour le Recrutement du personnel à la Direction Général de Recette du Kassaï Occidental.

Dans notre travail, nous avons parlé d'abord du système décisionnel qui présente l'ensemble des processus qui permet de collecter, d'intégrer, de modéliser et de présenter les données.

Nous avons également parlé des entrepôts des données qui constituent le coeur du système décisionnel jouant un rôle référentiel pour l'entreprise puisqu'il permet de fédérer des données souvent éparpillées dans le différentes base de données et Nous avons réalisé le datamart avec SQL serveur 2008.

De ce qui précède, nous sommes persuadé que l'ensemble des préoccupations répond à la problématique de notre travail.

Le but de ce modeste travail est de mettre en place un système décisionnel afin d'aider le gestionnaire des ressources humaines en particulier chef du personnel de la direction général de recette du Kassaï occidental d'avoir une vue d'ensemble sur les informations concernant le recrutement de son personnel.

Notre contribution dans notre étude de cas était de réaliser un Datamart pour la gestion de recrutement du personnel pour que le chargé du personnel établisse au moment opportun son Tableau statistique de tous les agents recruté, voir leur date d'engagement, etc.

Enfin, nous disons à nos chers lecteurs que ce travail étant une oeuvre scientifique et humaine peut avoir des imperfections, ainsi, vos remarques, critiques et suggestions seront les bienvenues pour sa perfection car il reste ouvert.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

71

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

BIBLIOGRAPHIE

OUVRAGES

1. ADIBA .M, Entrepôts de données et fouille de données, Paris 2002.

2. BERTRAND BURQUIER, Business intelligence avec 2008, Mise en oeuvre d'un projet décisionnel, Dunod, 2009.

3. DANIEL T. LAROSE, Des données à la connaissance une introduction au Datamining, Vuibert, 2005.

4. VINCENT GUIJARRO, Les Arbres de Décisions L'algorithme ID3, lile ,2006.

5. KIMBALL .R and m. ross, Entrepôts de données, guide pratique de Modélisation dimensionnelle,

vuibert, paris, 2003.

6. RAKOTOMALALA. : Graphes d'induction apprentissage et data mining, hermès, 2000.THESE

7. SERNA ENCINAS MARIA, Entrepôts de données pour l'aide à la prise de décision médicale, conception et expérimentation, UNIVERSITE JOSEPH FOURRIER, France 2005

NOTES DE COURS

8. KAFUNDA KATALAYI JP, Entrepôts des données, L2 informatique option Gestion, cours inédit, U.K.A 2015-2016.

9. MANYA NDJADI, Recherche opérationnelle, G3 informatique option Gestion, cours inédit, U.K.A 2013-2014.

Mémoire et tfc

10. KANGIAMA LWANGI Richard : Extraction des connaissances a partir d'un entrepôt des données à l'aide de l'arbre de décision application aux données médicales, UNIKIN 2010-2011.

WEBOGRAPHIE

11. www.creatis.insa-lyon.fr, le 16 janvier 2016.

12. www.wilkipedia.org , le 18 jeanvier2016.

13. www.devellopez.com , le 28 janvier 2016.

14. www.wikipedia.org/algo ID3, le 16 Mai 2016.

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

72

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

TABLE DE MATIERES

EPIGRAPHE

I

DEDICACE

.II

AVANT-PROPOS

III

LISTE DES FIGURES

IV

LISTE DES TABLEAUX

..V

LISTE DES SIGLES ET ABREVIATIONS

VI

 

0. INTRODUCTION GENERALE

1

0.1 CONTEXTE

1

0.2 PROBLEMATIQUE

1

0.3 HYPOTHESE

1

0.4 CHOIX ET INTERET DU SUJET

1

0.5 SUBDIVISION DU TRAVAIL

2

0.6 METHODOLOGIE ET TECHNIQUES

2

CHAP I : GENERALITES SUR LES SYSTEME DECISIONNELS [5,7, 8, 10, 11, 12]

4

I.0 INTRODUCTION

4

I.1 HISTORIQUE DES SYSTEMES DECISIONNELS

4

I.2 L'INFORMATIQUE DECISIONNELLE [12,9]

4

I.3 DEFINITION D'UN SYSTEME DECISIONNEL (BUSINESS INTELLIGENCE) [8] ....

5

I.3.1 ARCHITECTURE DE SYSTEMES DECISIONNELS [8]

5

I.4 LES DIFFERENTS ELEMENTS CONSTITUTIFS DU SYSTEME DECISIONNEL [13]

6

I.5 LES FONCTIONNALITES D'UN SYSTEME DECISIONNEL

6

I.6 LES APPORTS DES SYSTEMES DECISIONNELS

7

I.7 LES ENJEUX DE L'INFORMATIQUE DECISIONNELLE [11]

8

I.8 LES FONCTIONS ESSENTIELLES DE L'INFORMATIQUE DECISIONNELLE

8

CONCLUSION PARTIELLE

10

CHAP II: DATA WAREHOUSE ET DATA MART [7, 8, 1,]

11

II.1 INTRODUCTION

11

II.2 DEFINITION D'UN DATA WAREHOUSE (DW) [8]

11

II.2.1 OBJECTIF DU DATA WAREHOUSE [8]

12

II.2.2 LES COMPOSANTS DE BASE DU DATA WAREHOUSE

12

II.3 CARACTERISTIQUES D'UN DATA WAREHOUSE [8]

13

II.4 ENTREPOTS ET BASES DE DONNEES [7]

14

II.4.1 ROLE D'UN ENTREPOT DE DONNE

14

II.4.2 SYSTEMES TRANSACTIONNELS ET SYSTEMES DECISIONNELS :

15

II.4.3 DIFFERENCE ENTRE LE SYSTEME OLTP ET LE DATA WAREHOUSE [8]

15

II.4.4 LA PROBLEMATIQUE DE L'ENTREPRISE [8]

16

II.4.5 LA MODELISATION DIMENSIONNELLE ET LA MODELISATION

ENTITE/RELATION [5, 8] 16

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

73

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

II.4. 6 RELATION ENTRE LA MODELISATION DIMENSIONNELLE ET LA

MODELISATION ENTITE/RELATION 17

II.5 SCHEMAS D'UN DATA WAREHOUSE [8] 18

II.6 LE DATA MART [1, 8,] 21

II.6.1 INTRODUCTION 21

II.6.2 LES DEFINITIONS [8] 21

II.6.3 LA PLACE DU DATAMART DANS L'ENTREPRISE 22

II.6.4 DATAWAREHOUSE ET DATAMART [1] 22

II.6.4 ARCHITECTURE D'UN DATAMART 23

II.6.5 DATA WAREHOUSE VERSUS DATA MART 23

II.7 LES SERVEURS OLAP (ON-LINE ANALYTICAL PROCESSING) 24

II.7.1 LES SERVEUR ROLAP (RELATIONAL OLAP) 24

II.7.2 LES SERVEUR MOLAP (MULTIDIMENSIONAL OLAP) 24

II.7.3 LES SERVEUR HOLAP (HYBRID OLAP) 25

CONCLUSION PARTIELLE 26

CHAP III DATA MINING ET ARBRE DE DECISION [2, 3, 4, 8, 13] 27

III.0 INTRODUCTION 27

III.1 OBJECTIFS DU DATA MINING [8] 27

III.1 .2 PROCESSUS DU DATAMINING 29

III.1 .3 LES TACHES DU DATA MING 30

III .2 ARBRE DE DECISION [4, 9] 31

III .2.1 INTRODUCTION A L'ARBRE DE DECISION 31

III .2.2 DEFINITION 32

III .2.3 CARACTERISTIQUES ET AVANTAGES : 32

III .2.4 ALGORITHME ID3 [4, 13] 32

III .2.5 PRINCIPES 32

III .2.2 EXEMPLE PRATIQUE 33

III.3 CONCEPTS THEORIQUES SUR LE GRAPHE [6, 8, 9] 35

CONCLUSION PARTIELLE 37

CHAP IV : MODELISATION ET APPLICATION [2,8] 39

IV.0 INTRODUCTION 39

IV.1 ANALYSE DE L'EXISTAN 39

IV.1.2 ORGANIGRAMME DE LA DIRECTION GENERAL RECETTE DU KASSAI

OCCIDENTAL 45

IV.1.3 FONCTIONNEMENT DE LA DIVISION DES RESSOURCES HUMAINES 46

IV.1.4 ORGANIGRAMME DU SERVICE CONCERNE 46

IV.1.5 DESCRIPTION DES POSTES 46

PROBLEME RENCONTRER 48

PROBLEMATIQUE ET MOTIVATION 48

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016

74

MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC

IV.2 MODELISATION 49

IV.2.1 OUTIL UTILISE 49

IV.3 LE SYSTEME TRANSACTIONNEL SQL SERVEUR 50

IV.3.1 DEFNITION 50

IV.2.2 MODELISATION MULTIDIMENSIONNELLE DE DATAMART 50

IV.2.3 MODELISATION DE L'APPLICATION 51

IV.2.4 .CONCEPTION D'UN DATA MART 55

IV.2.5 BUINESS INTELLIGENCE 57

IV.2.6 CREATION DU CUBE 58

IV.3 IMPLEMENTATION 59

IV.3.1 INTERFACE 59

CONCLUSION PARTIELLE 69

CONCLUSION GENERALE 70

BIBLIOGRAPHIE 71

TABLE DE MATIERES 72

Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Ceux qui rêvent de jour ont conscience de bien des choses qui échappent à ceux qui rêvent de nuit"   Edgar Allan Poe