WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Analyse multidimensionnelle de la pauvreté par approche de l'analyse de données. Application à  la ville de Kinshasa

( Télécharger le fichier original )
par Samuel Kalombo
Université de Kinshasa RDC -  2012
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

9. Classification Automatique

L'objectif de la classification est le suivant : on dispose de données non étiquetées. On souhaite les regrouper par données ressemblantes. Cette manière de définir intuitivement l'objectif de la classification cache la difficulté de formaliser la notion de ressemblance entre deux données. Au-delà des algorithmes existant, une bonne partie de l'art à acquérir consiste ici à imaginer cette formalisation. Ainsi, soit un ensemble X de N données décrites chacune par leurs P attributs. La classification consiste à créer une partition ou une décomposition de cet ensemble en groupes telle que :

Critère 1 : les données appartenant au même groupe se ressemblent ;

Critère 2 : les données appartenant à deux groupes différents soient peu ressemblantes.

Hartiga (Référence ???) est un des premiers à discuter différents choix possibles du nombre de classes. Au fil des années, plusieurs statistiques ont été proposées afin de décider le nombre de classes à choisir et peuvent être utilisées comme règle d'arrêt dans le cadre des méthodes hiérarchiques. Elles utilisent généralement les sommes des carrés inter - groupes, ainsi que les sommes des carrés intra - groupes, notées respectivement par B et W pour une partition P en k classes {c1....Ck}:

, j = 1, ..., k, est le centre de gravité de la classe Cj et g le centre de gravité de l'ensemble des objets. nj représente le poids de la classe Cj

, j = 1, ..., k, est le centre de gravité de la classe Cj

On peut également exprimer ces mesures à l'aide des notions d'inertie d'un groupe.

Soit P, une partition en k classe {C1... Ck} alors on obtient :

, j = 1, ..., k, est le centre de gravité de l'ensemble des points de Cj avec g =   avec

#Cj représentant le nombre de points dans Cj. D'après le théorème de Koeng - Huygens, l'inertie totale T ne dépend pas de la partition choisie et est exprimée par T = W + B et vaut T= (xi, g). L'inertie intra- classe W est un critère classique d'évaluation d'une partition, mesurant l'homogénéité des classes de la partition. Par conséquent, il suffit de trouver une partition qui minimise W(Pk). De manière équivalente, on cherchera à maximise B(Pk) l'inertie interclasse qui mesure la séparation des classes. Dans ce cas, une partition vérifie les principes de cohésion interne et d'isolation externe

10. Construction de l'ICP

Usuellement, l'analyse de la pauvreté multidimensionnelle est fondée sur une méthodologie de construction d'un Indice Composite de Pauvreté (ICP). Dans le chapitre précédent nous avons présenté les trois approches de construction d'un tel indicateur. Dans le cadre de notre étude nous avons portés notre choix sur l'approche d'inertie les méthodes factorielles.

La construction de notre indicateur se fera en trois étapes. Nous réaliserons une première ACM dite exploratoire sur les variables qui seront choisies. Cette ACM aura pour but de faciliter la sélection des variables qui sont en mesure de faire une discrimination des individus selon le caractère étudié. Le critère utilisé pour sectionner les variables est la consistance ordinale sur le premier axe (COPA). Et enfin nous réaliserons l'ACP sur les dix premiers facteurs de la dernière ACM.

La COPA consiste dans ce contexte, pour tout indicateur partiel (ou variable), à vérifier si sa structure ordinale en terme de bien être est respectée par la structure ordinale des coordonnées de ses modalités sur le premier axe factoriel (ici l'ICP). Autrement dit, une variable vérifie la COPA si l'ordre de sa structure ordinale respecte l'ordre des scores factoriels de ses modalités, selon l'ICP (Touhami et Fouzia) (Novembre 7-9 2009).

Certaines variables peuvent retrouver la COPA suite à un regroupement de leurs modalités (avec le risque de perdre une partie de l'information). Dans notre analyse nous n'avons pas appliqué la COPA parce qu'il sembre forfaitaire, nous avons effectuer une Analyse en Composantes Principales sur les axes de l'ACM et Le premier facteur de l'ACP sera considéré comme indicateur de pauvreté.

Justification du choix de l'ACM pour la construction de l'ICP

La logique de l'ACM est la suivante : une modalité a un poids d'autant plus grand qu'elle est plus rare. Ainsi, dit, l'ACM attribue des poids plus importants à des modalités rares. Cette logique permet une meilleure identification des populations pauvres.

10.1 La détermination du seuil de pauvreté multidimensionnelle

Avec l'indicateur composite de pauvreté Ci calculé il est possible de calculer les indices de pauvreté multidimensionnelle une fois qu'il a été déterminé un seuil de pauvreté multidimensionnelle. Le seuil permet de constituer de classe homogène (selon le niveau de bien être) de la population analysé.

Pour construire un seuil de multidimensionnelle, nous allons appliquer la classification automatique sur les axes de notre ACP obtenus en vue de scinder la population en deux classes homogènes des pauvres et non pauvres pour en déduire le seuil multidimensionnel.

Le seuil peut être déduit en utilisant la formule suivante

Seuil ICP= (max Cip+min Cri)/2

Ou :

Max Cip est la valeur maximale de l'ICP dans la classe pauvre

Min Cip est la valeur minimale de l'ICP dans la classe non pauvre

Pour chaque ménage de la population Kinoise une valeur de l'ICP a été déduite. Cette valeur peut être négative c'est-à-dire le cas des ménages les plus pauvres selon cette approche). Sur ce nous construisons un nouvel ICP2 en faisant une simple translation de l'ICP de base en ajoutant la valeur la plus faible négative prise en valeur absolue.

PRESENTATION DES DONNEES ET CALCULS DES INDICES MULTIDIMENSIONNELS

Présentation des dimensions et des variables utilisées

Pour ce travail, nous avons extrait le sous fichier de l'enquête 123 relatif à la ville de Kinshasa. En fait, deux sous fichiers sont consultés : le premier contient les informations liées aux dépenses sur les personnes, Le second est relatif aux ménages et contient les différents aspects en liaison directe avec les conditions générales d'habitat des ménages en particulier. Pour répondre aux objectifs de ce travail, et comme nous ne considérons que le niveau ménage, nous avons exploité les données issues du deuxième sous fichier.

Les principales dimensions que nous retenons pour approcher le bien-être des ménages au niveau de notre approche sont : certaines caractéristiques de l'habitat, quelques éléments de base du logement, certains éléments de confort à la disposition du ménage. Chacune des dimensions retenues regroupe en fait un ensemble d'indicateurs. La justification du choix des différentes dimensions est donnée à l'occasion de leur description. Les chiffres et résultats présentés ci-dessous découlent de notre exploitation directe du sous fichier de 123 au niveau de Kinshasa.


· L'habitat

L'explosion démographique au niveau de la ville de Kinshasa en général, a rendu le coût du logement le plus élevés en République Démocratique du Congo. Ce phénomène a rendu l'accès à un habitat salubre et de qualité moyenne difficile pour les ménages les plus démunis. L'habitat est ainsi un vu comme facteur net de discrimination et doit de ce fait, être considéré parmi les dimensions de pauvreté ou de bien-être. Plusieurs indicateurs sont en général définis pour intégrer la dimension habitat dans une approche non monétaire de la pauvreté :

Ø Type Habitat,

Ø Matériaux des Murs ;

Ø Nature de sol ;

Ø Nature de toiture ;

Ø Statut d'occupation 

D'après les données d'enquête 123 de 2005, la structure de l'habitat dans la ville de Kinshasa se présente comme suit :

1. Type d'habitat : Caractérise par une prédominance des maisons de concession habitées près de 78,38% des ménages de la ville de Kinshasa. 5 % habitent des maisons en pièces sans dépendances, 4,69% habitent des villas et 4% habitent des appartements, 6% des Kinois habitent dans des maisons en bandes et 2% habitent dans les studios. Ces derniers seraient des ménages à considérer comme les plus pauvres selon ce critère.

2. Matériaux des Murs : Caractérisé par une dominance des maisons construites avec du bloc ciment, 2,17% sont en béton armés, 6,46% de maisons kinoises sont en briques cuites, 5,4% en briques adobes, 1% en mur pisé, 2% en bois ou planches et 0,1% sont faites à l'aide des végétaux ou nattes. Le 1% sont construites selon l'enquête par les matériaux non prévues ;

3. Nature de sol : Caractérisée par une forte apparition de plus de 76,7% du sol en planche/ciment, le sol en carrelage occupe 1,24% dans la ville de Kinshasa, 10,54% sont en terre battue et 0,13% sont en bois ;

4. Nature de toiture : elle est caractérisée par 78,11% des toitures avec du tôles galvanisées, 8,7% avec des eternits, 1,91% en tuiles, 7,79% sont faites avec des tôles de récupération, 0,45% en Ardoise, 2,46% à l'aide des dalles en béton et 0,26% avec la chaume ;

5. Statut d'occupation : cet indicateur est dominé par plus de 47,75% des résidents propriétaires, 35 ;8% sont des locataires, 3,03% sont logés par l'employeur, 2,5% logés gratuitement par un tiers, 0,3% sont logés dans les concessions familiales et près de 10,44% sont dans les locations ventes ;

Assainissement

Un certain niveau ou une certaine qualité de vie et l'assurance d'une sécurité sanitaire sont généralement conditionnés par un cadre de vie assaini et amélioré. Ce cadre étant l'assainissement qui est étroitement lié à l'habitat. C'est en quelque sorte la partie infrastructure de ce dernier. Les indicateurs retenus à ce niveau dans le cadre de ce travail sont :

a. Approvisionnement en eau

b. Aisance ;

c. Evacuation ordures

En rapport avec les données de 123, nous constatons des statistiques suivantes :

1. Approvisionnement en eau : cette variable est caractérisée par une prédominance d'environ 41,33% des foyers qui ont des robinets extérieurs, 11,99% des ménages ont des robinets intérieurs, 2,13% des ménages font recours au forage pour s'approvisionner en eau, 31,37% utilisent les robinets d'un autre ménage, 3,03% des ménages kinois ont des puits protégés et 1,4% ont des puits non protégés,3,09% utilisent des sources aménagées, 4,28% utilisent des sources non aménagées, 0,18% des kinois selon l'échantillon utilisent les cours d'eau et seulement 0,09% font usage de borne fontaines.

2. Aisance : cet indicateur qui est lié à l'habitat et qui le montre le minimum de condition sanitaire nous révèle qu'il ya plus de 42,13% des ménages kinois utilisent un trou dans la parcelle comme toilette, 10,24% des ménages ont des toilettes intérieures privées chasse eau, 13,90% en ont en externe privée chasse eau, 17,35% des foyers utilisent des toilettes communes des ménages, 10,59% ont des latrines aménagées privées et 4,87% ont des latrines aménagées publiques et nous avons plus de 0,79% des ménages kinois qui manquent des toilettes.

3. Evacuation ordures : L'utilisation inconsidérée des ressources et l'élimination des déchets dans l'environnement contribuent à la dégradation du milieu. Cette dégradation a des implications sur la santé humaine, l'économie, la production alimentaire, le tourisme, la flore et la faune. Nous ne verrons notre qualité de vie s'améliorer que si nous donnons à l'environnement, que tous nous partageons, les soins qui lui sont dû, c'est-à-dire en exploitant les ressources de façon judicieuse et en prévenant le gaspillage inutile. Nous remarquons concernant l'évacuation des déchets qu'au moins 20,63% des ménages font des dépotoirs sauvages de leurs déchets, 22,71% utilisent l'enfouissement, 16,73% ont des services publics ou privés, 13,18% des ménages font l'incinération de leurs déchets, 8,32% des ménages utilisent des voies publiques pour évacuer leurs déchets, 6,44% font usage des cours d'eau et 9,14% les utilisent comme fumier.

Energie

Que ce soit sur le plan environnemental ou sur le plan économique, les économies d'énergie électrique sont une priorité pour l'homme moderne, car il en sera à terme, le premier bénéficiaire. Elle consiste à fournir le même résultat dans les domaines du chauffage, de l'éclairage, de l'électro ménager.


Dans nos logements, nous consommons une part importante de l'énergie électrique produite, pour nous chauffer, nous laver, nous nourrir, nous distraire, nous éclairer, etc. Mais cette énergie coûte cher et actuellement l'essentiel de sa production n'est pas sans effet sur notre environnement. Les économies d'énergie électrique dans l'habitat, permettent d'économiser les énergies non renouvelables. Economiser l'électricité, n'est pas un choix, mais bien une urgente nécessité. Les indicateurs retenus dans cette dimension pour évaluer le degré de pauvreté sont les suivants :

a. Eclairage

b. Energie cuisine

Par rapport aux données de cette enquête, nous observons des statistiques suivantes :

1. Eclairage : pour cet indicateur les ménages kinois qui utilisent l'électricité comme source d'éclairage représente 65,03%, 32,16% utilisent du pétrole plus la lampe tempête, 1 ,3% utilisent la lampe Coleman, 0,36% font recours aux groupes électrogènes.

2. Energie cuisine : plus de 44,64% des ménages interrogés utilisent de l'électricité pour leur cuisine, 1,82% font recours au gaz, 39,55% utilisent du pétrole et environ 0,89% font usage de feu de bois

Education

L'influence que peut exercer l'éducation des hommes sur leur productivité et sur la croissance économique avait été soulignée par les économistes classiques, et notamment par Adam Smith. Aujourd'hui, le rôle de l'éducation est glorifié par les institutions internationales. C'est d'ailleurs, le deuxième point des objectifs du millénaire pour le développement (OMD). L'éducation constitue donc l'une des dimensions les plus importantes de l'analyse de la pauvreté. Elle peut cependant être appréhendée par plusieurs indicateurs, chacun caractérisant un aspect particulier de la mobilisation de cet actif. Dans le cadre de cette étude sur la pauvreté, le variable retenue pour caractériser l'éducation est le diplôme le plus élevé du chef de ménage interrogé ; 21,21% ont des certificats de l'école primaire, 7,34% ont des brevets du secondaire, 3,78% des chefs de ménages sont des d4, 11,38% sont des diplômés d'Etat, 3,61% ont un diplôme de graduat, 1,65% des ménages interrogés sont des licenciés et seulement 0,086% ont une thèse

Calculs des Indices Multidimensionnels

Notions

Pour conduire une ACM, on suppose que l'on dispose de N individus (ménages de la ville de Kinshasa dans notre cas) décrits par p variables qualitatives notées X1, X2, ......, Xp. Si les variables ne sont pas qualitatives à la base (continues ou discrètes avec plusieurs modalités) elles sont alors « recodifiées » de façon appropriée en des variables catégorielles (classes) avant l'analyse. On désignera alors par X le tableau des données obtenues à partir des observations de ces p variables sur l'ensemble des N individus. C'est donc une matrice de N lignes et P colonnes. Le tableau (ou la matrice) X est donc la base de données de l'ACM à conduire.

Soit Q l'ensemble des P variables considérées (Card Q = P). Pour chacune des P variables de l'ensemble Q (p = 1, ..., P) on considère l'ensemble Jp de toutes les modalités possibles associées à la variable (qualitative) p. On note ensuite par J l'ensemble union des modalités de toutes les variables. À partir du tableau des données de base X, on définit un nouveau tableau avec des caractéristiques particulières. Ainsi, pour tout individu

i?N (i = 1, ..., N) et pour toute variable p?P (p = 1, ..., P) on pose : Kj = 1 si i a la modalité j de la variable p, et Kj = 0 sinon. Le tableau qui découle de ce processus, de terme général Kij (i ?N, j ?Jp) est appelé Tableau Disjonctif Complet (TDC) associé au tableau X. sur ce tableau que nous que nous réaliserons notre analyse.

Calculs

On sait que la contribution de la modalité j est autant plus grande que sa fréquence d'apparition est faible. Sur le plan pratique, ceci implique que les modalités à faible effectifs risquent d'avoir trop d'importance dans la définition des axes factoriels. Ainsi nous avons effectué une première ACM en analysant les résultats, les modalités à faible fréquence ont été éliminées. En plus les variables retenues ont un pouvoir discriminant important, car le pouvoir discriminant montrer la dispersion des modalités dans une dimension ou dans un axe

L'Analyse Multiples des Correspondances effectuée donne les axes factoriels et les projections de chaque variable sur les axes factoriels. Les résultats de cette analyse nous informent sur les valeurs propres, le taux d'inertie, les corrélations entre les variables initiales et les axes, la représentation des modalités sur les axes. Etc.....

Les valeurs propres permettent de rendre compte de l'importance relative de chaque dimension dans la part d'information statistique pris en compte par la solution.

Le taux d'inertie est le rapport entre la valeur propre avec la somme totale des valeurs propres, cette quantité constitue une mesure de la part de variabilité globale prise en compte par cet axe ou la part d'information contenue dans cet axe. Le tableau suivant donne les 5 premiers axes factoriels, les valeurs propres correspondances ainsi que le taux d'inertie lié à une valeur propre.

Axes

Le coef. alpha de Cronbach

Valeur Propre

Taux d'inertie

1

,840

0,33

,362

2

,706

0,217

,236

3

,477

0,14

,148

4

,439

0,13

,140

5

,373

0,11

,127

Analyse et Interprétation des résultats

Le coefficient d'Alpha de Cronbach

Le coefficient alpha de Cronbach, parfois appelé simplement coefficient, est une statistique utilisée notamment en psychométrie pour mesurer la cohérence interne (ou la fiabilité) des questions posées lors d'un test (les réponses aux questions portant sur le même sujet devant être corrélées). Sa valeur s'établit entre 0 et 1, étant considérée comme "acceptable" à partir de 0,7. Il permet donc l'estimation de la fidélité du score à un test. Présenté par Lee Cronbach en 1951

Dans le cadre de notre travail, le coefficient alpha de Cronbach sera utilisé comme indicateur de nos échelles de mesure. Il s'agit en effet d'une méthode éprouvée et utilisée dans la plupart des travaux de recherche actuels (Evrard et al., 1997) malgré ses limites (Peterson, 1994 ; Thiétart, 1999) et l'existence d'indices concurrents ( ex : rhô de Joreskog ; Joreskog, 1971 ; Osburn, 2000). Ce coefficient est une estimation de la variance du score total de l'échelle due à tous les facteurs communs propres aux items de l'échelle testée. Il permet de vérifier si les énoncés d'une échelle de mesure ou d'un indicateur partagent des notions communes, c'est à dire si chaque item présente une cohérence avec l'ensemble des autres énoncés de l'échelle. En pratique, l'alpha de Cronbach est un nombre inférieur à 1 qui doit être le plus élevé possible. Ainsi, plus alpha se rapproche de 1, plus les items ou les indicateurs sont corrélés entre eux et plus l'échelle a une cohérence interne. Si le score d'alpha est satisfaisant, alors les items ou les indicateurs sont cohérents entre eux et peuvent être additionnés pour former un score global puisqu'ils sont admis à mesurer un même phénomène. . Donc selon le tableau ci-dessus, seuls les deux premiers axes nous donnent un coefficient supérieur à 0,7, c'est-à-dire une cohérence interne des modalités d'un indicateur qui peuvent être agrégés pour en former un seul.

Les deux axes nous donnent une quantité d'information d'environ 60%, et le premier axe contient 36,2% d'informatique cet axe sera considéré comme notre Indicateur Composite de la pauvreté(ICP)

Mesure de Discrimination

 

Dimension

Variables

1

2

Type habitat

,484

,241

Matériaux des murs

,288

,299

Nature de sol

,407

,391

Nature de toiture

,414

,248

Statut d'occupation

,282

,224

Energie cuisine

,480

,258

Eclairage

,363

,140

Approvisionnement en eau

,621

,463

Aisance

,656

,430

Evacuation ordures

,252

,120

Situation matrimoniale

,007

,002

Diplôme le plus élève obtenu

,086

,017

 
 
 

Le tableau suivant donne les mesures de discriminations des indicateurs sur les axes, nous remarquons que la variable Aisance discrimine le mieux les ménages sur le premier axe , suivi de l'approvisionnement en Eau et le type d'habitat, cela confirme même les statistiques que nous avons fait au début, l a situation matrimoniale et le niveau du diplôme n'ont pas un grand pouvoir discriminatif. D'une façon générale, les indicateurs considérés ont un pouvoir discriminatif important sur le premier axe que dans les autres axes.

Ainsi, les deux dimensions retenues permettent de prendre en compte 60% du taux d'inertie totale à travers une représentation graphique plane interprétable en termes de distances entre observations, ce taux est utilisé pour exprimer ou apprécier la qualité de la représentation des modalités ou des individus sur le plan 1X2.

Projections des modalités sur le plan 1x2

Nous remarquons une situation de pauvreté dans le troisième et deuxième quadrant, une situation de pauvreté moyenne dans le premier quadrant et de non pauvreté dans le quatrième. Cela montre que la première dimension explique en quelque sorte le bien-être. plus une modalité a une valeur très élevée plus elle exprime une situation de non pauvreté. Les modalités se retrouvant concentrées au centre posent un problème de codification effectué et le poids par rapports aux effectifs n'est pas équitable à chaque modalité

Recherche du seuil de la pauvreté multidimensionnelle

Pour avoir le seuil multidimensionnel, nous appliquons la technique de classification automatique des centres mobiles sur notre ICP et également la régression linéaire simple en vue de segmenter ou de scinder notre échantillon des ménages en deux groupes homogènes, voici le résultat de l'algorithme exécuté sous SPSS

 
 

Effectif

Groupe

1

2306

2

10405

Total individus

12711

Données Manquantes

,000

Calcul du seuil multidimensionnel

Le seuil sera déduit à l'aide de la formule décrite ci-dessus, après calcul notre seuil trouvé a une valeur de

3,51%. Une fois ce seuil est trouvé, nous pouvons maintenant calculer les indices de pauvreté en se servant de la formule de FGT

Où, N est le nombre de ménages dans l'espace géographique considéré, z le seuil de pauvreté multidimensionnelle associé sur l'axe ICP2 et á ?0 est un coefficient d'aversion à la pauvreté multidimensionnelle pouvant prendre l'une des valeurs 0, 1 ou 2 et q le nombre de ménages ayant un ICP2 inférieur à z si á=0 on aura FGT0 ou P0 (la part de la population dont la consommation est en dessous de la ligne de pauvreté), á=1 on aura FGT1 (indice de profondeur de la pauvreté) et á=2 P2 (mesure la sévérité de la pauvreté).

P0=82%

D'autres indices tels que la sévérité et la profondeur peuvent être calculé, et une décomposition spatiale par commune de la pauvreté

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Le don sans la technique n'est qu'une maladie"