WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Analyse multidimensionnelle de la pauvreté par approche de l'analyse de données. Application à  la ville de Kinshasa

( Télécharger le fichier original )
par Samuel Kalombo
Université de Kinshasa RDC -  2012
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

ANALYSE MULTIDIMENSIONNELLE DE LA PAUVRETE PAR APPROCHE DE L'ANALYSE DE DONNEES

« CAS DE LA VILLE DE KINSHASA »

PAR

KALOMBO MAYOMBO Samuel

kalombosamuel@gmail.com

1. Introduction

La pauvreté est un phénomène qui a existé depuis toujours. Vraisemblablement, et pour des raisons démographiques, le nombre de pauvres était relativement plus faible mais le taux de pauvreté était lui plus élevé. A travers le monde, les préoccupations des responsables étaient différentes de ce qu'elles sont actuellement vis-à-vis de ce phénomène. Elles se focalisaient beaucoup plus sur les autres aspects du développement et sur la croissance des agrégats macro-économiques et beaucoup moins sur la lutte contre la pauvreté. Par la suite, et depuis la fin des années quatre vingt du siècle précédent, le problème de la pauvreté a commencé à susciter un intérêt de plus en plus grand auprès des chercheurs et des décideurs. Cette récente prise en considération de ce phénomène s'explique par sa persistance (voire son accentuation) un peu partout à travers le monde. Par ailleurs, la mise en place de politiques sociales pour contrer certains effets négatifs des politiques de stabilisation macro-économique contenues dans les programmes d'ajustement structurel, que certains pays comme la République démocratique du Congo ont connus, ont commencé à mobiliser les politiciens et les économistes du monde entier. Ces politiques sociales laissent par nature de la place à la lutte contre la pauvreté. Dans ce sens, et lors de l'Assemblée Générale de l'Organisation des Nations Unies (ONU), organisée le 8 septembre 2000, 189 pays ont adopté à l'unanimité, la réduction de moitié de l'extrême pauvreté et de la faim entre 1990 et 2015. Cet objectif est aujourd'hui érigé comme l'axe majeur des Objectifs du Millénaire pour le Développement (O.M.D.). Réduire de moitié l'extrême pauvreté, dans n'importe quel pays, nécessite la mise en place de stratégies de lutte efficaces et bien ciblées. Ces politiques sont, cependant, conditionnées par une bonne identification des populations pauvres et leur caractérisation. En effet, une mauvaise identification de ce sous groupe de la population limite l'efficacité de toute politique d'allégement de la pauvreté sous toutes ses formes.

Théoriquement, l'identification des pauvres et la mesure de la pauvreté semblent être une procédure séquentielle simple : la sélection des indicateurs de mesure du bien-être, la définition d'un ou plusieurs seuils de pauvreté et l'établissement des indices de mesure du degré de la pauvreté. Toutefois, dans la pratique, l'opération se révèle très complexe et fait l'objet d'un large débat entre au moins deux principaux courants de pensée. Le premier est dit utilitariste et définit comme pauvre tout individu qui a un revenu (ou une dépense) insuffisant ne lui permettant pas de subvenir à ses besoins. Cette approche, bien qu'elle mette en valeur une dimension importante du bien être, ne donne qu'une vision très incomplète des différents manques dont souffrent les pauvres.

Le second courant est dit non monétaire ou multidimensionnel. Il est développé et soutenu, surtout ces dernières années, par les partisans de l'école dite des besoins de base et ceux de l'école des capacités et des fonctionnements avec Amartya Sen à sa tête. Ce courant approche la pauvreté en tenant compte de plusieurs dimensions. Selon lui, les pauvres ne sont pas seulement ceux qui ont un revenu faible, mais aussi ceux qui ne peuvent pas satisfaire leurs besoins essentiels relatifs à la nourriture, au logement, à l'habillement, à la santé, à l'éducation, ..., etc. Sen, définit même la pauvreté comme étant un manque de libertés réelles et formelles, autrement dit, comme un manque de capacités d'être et de faire. La pauvreté est alors vue comme une privation multiple qui ne peut pas se réduire au seul manque de ressources

La perspective dans laquelle nous évoluerons dans le cadre de cette analyse est celle d'une approche multidimensionnelle des besoins de bases afin de dégager un indice de pauvreté pouvant exprimer la situation de la RDC. Les données que nous avons utilisées proviennent de l'enquête 1-2-3 de 2004 et 2005 réalisée par l'institut national de la statistique, INS.

Cette enquête est composée de trois sous enquêtes intégrées, la phase 1 concerne emploi, la phase 2 qui couvre le secteur informel et la phase 3 qui est relative à la consommation des ménages. La taille de l'échantillon de l'enquête 1-2-3 est large, elle est de 72.685 personnes enquêtées soient 13.215 ménages, pour une taille moyenne du ménage de 4, 5 personnes. Cette enquête couvre les dix provinces du pays, en plus de la capitale Kinshasa considérée comme province et capitale en même temps. Dans la présente étude nous utiliserons la phase 1 pour l'étude multidimensionnelle de la pauvreté

L'objectif général est donc d'approcher la pauvreté en milieu urbain de la ville de Kinshasa de façon multidimensionnelle. Nous y élaborons une étude de pauvreté non monétaire, c'est-à-dire selon plusieurs dimensions. De façon spécifique, à travers ce travail, nous cherchons à :

Ø faire une analyse descriptive des différentes dimensions de la pauvreté au niveau des ménages de la ville de Kinshasa ;

Ø calculer, en utilisant les méthodes statistiques avancées, à savoir l'analyse des correspondances multiples (ACM), l'analyse en composantes principales (ACP), un indicateur composite de la pauvreté (ICP);

Ø calculer un seuil de pauvreté multidimensionnelle en utilisant les centres mobiles qui est une technique de classification automatique,

Ø estimer plusieurs indices de pauvreté multidimensionnelle en utilisant l'indice FGT

2. Cadre conceptuel et approches de la pauvreté

Malgré l'abondance des écrits, le concept de la pauvreté reste globalement ambigu et imprécis. Il est ainsi difficile à définir, à comprendre, à caractériser et donc à mesurer. Il existe alors plusieurs façons de définir la pauvreté qui conduisent à des identifications différentes des pauvres.

La pauvreté fait généralement référence à une situation, à un état caractérisé par le non possession d'un certain nombre de ressources et conditions élémentaires nécessaires à un minimum de bien-être matériel, mais aussi social, culturel.

Dans le sens ou nous l'entendons, cette non possession ne fait bien évidemment par référence aux renonciations volontaires que sont les formes, principalement religieuses, de voeux de pauvreté, mais est associé à l'absence subie ou contrainte de ces ressources et conditions élémentaires, donnant lieu alors à des expressions sous forme de manques ou de besoins 

De façon générale, la pauvreté correspond à une ou plusieurs situations jugées comme "inacceptables" ou encore "injustes" sur les plans économique et social. Cependant, la détermination de l'espace de référence à considérer pour identifier ce type de situations est problématique et est sujet à plusieurs débats. Trois principales approches se distinguent à ce niveau. Chacune considère son propre espace de référence. La première retient ce que l'on appelle les ressources, la deuxième ce qui est dit besoins de base, alors que la troisième considère un sous ensemble de capacités identifiées comme étant des "capacités de base".

Sur le plan méthodologique et empirique, l'approche des ressources retient généralement une variable monétaire (revenu ou dépense de consommation), puis fixe un seuil de pauvreté pour identifier les individus pauvres. Cette approche tire ses origines principalement de la microéconomie classique qui considère que l'utilité (approchée par le revenu ou la consommation) est l'élément clef dans le comportement et le bien-être des individus.

Les approches multidimensionnelles, comme leur nom l'indique, reposent sur plusieurs Indicateurs. Elles nécessitent des procédures d'agrégation de ces derniers en un seul indicateur qui résumerait l'information apportée par ces indicateurs de base puis la détermination d'un seuil de pauvreté. Ces approches non monétaires considèrent que le revenu (ou la dépense) à lui seul n'est pas capable d'expliquer la situation de pauvreté. Selon cette approche, les besoins des individus sont de plusieurs ordres. La pauvreté est donc un phénomène multidimensionnel qui ne peut se réduire au manque de ressources.

L'approche des besoins de base identifie plusieurs dimensions et des ensembles de pauvres selon chacune de ces dimensions qu'elle combine, d'une façon ou d'une autre, pour définir l'ensemble de la sous population pauvre. Il s'agit en particulier de l'alimentation, du logement, de l'accès à la santé, à l'éducation, à l'assainissement, etc. Les partisans de l'approche des besoins de base considèrent que la pauvreté doit être analysée dans toutes ses dimensions. Un individu est pauvre s'il n'arrive pas à satisfaire ses besoins fondamentaux essentiels. Autrement dit, un individu est pauvre s'il est privé d'un ensemble de biens et services de base jugés nécessaires pour atteindre une certaine qualité de vie.

L'approche dite des capacités en matière d'approche de la pauvreté est promue et préconisée par Amartya Sen au cours des vingt dernières années. Elle s'appuie principalement sur la théorie de la justice développée par Rawls en 1715. Ce dernier critique l'approche utilitariste. Selon lui une société qui respecte le principe de justice sociale procurerait à ses membres une équité fondée sur un ensemble d'éléments essentiels. Parmi ces éléments, Rawls évoque ce qu'il appelle les biens premiers qu'il considère comme étant « les biens utiles quel que soit le projet de vie rationnel » (Audard, 1997). En d'autre termes « les biens que tout homme rationnel est supposé désirer ». Rawls distingue, aussi les biens premiers naturels et les biens premiers sociaux. Les premiers sont les qualités innées dont disposent les individus, comme la santé et vigueur, l'intelligence et l'imagination. Quant aux biens premiers sociaux, ils sont « identifiés par la question de savoir ce qui est généralement nécessaire, en termes de conditions sociales et de moyens polyvalents, pour permettre aux citoyens, tenus pour libres et égaux, de développer de manière adéquate et d'exercer pleinement leurs deux facultés morales, ainsi que de chercher à réaliser leur conception déterminée du bien ».

Même si, à la base, cette approche n'est pas orientée directement vers l'étude de la pauvreté, elle fournit une base informationnelle et multidimensionnelle qui permet de proposer une définition de la pauvreté concentrée particulièrement sur les biens premiers sociaux.

Partant de cette théorie de la justice, Sen a développé son approche des capacités. Sen a d'abord remis en cause les autres approches de la pauvreté. Il précise que celles-ci ignorent la notion de diversité des êtres humains. En effet, deux individus dotés des mêmes ressources, peuvent atteindre des résultats différents en termes de bien-être. En effet, ces deux individus ne vont pas utiliser leurs ressources de la même manière. Ils auraient des caractéristiques différentes (physiques et mentales), et donc même si les biens envisagés ont des caractéristiques identiques, les niveaux de bien-être réalisés seraient différents. Sen affirme ainsi que les ressources des individus ne peuvent pas suffire pour décrire leur bien-être. Il s'agit alors d'évaluer ce que l'individu peut accomplir grâce à ses ressources. Sen définit alors ce qui est dit espace des capacités. Dans cette approche, un individu est pauvre s'il n'a pas la capacité de transformer ses ressources en accomplissements. Bien que l'approche de Sen soit stimulante et ait donné naissance à une littérature abondante, elle demeure plutôt difficile à opérationnaliser. Elle décrit et propose des concepts à plusieurs facettes qui ne sont ni directement observables ni facilement mesurables. Pour conclure, à l'inverse de l'approche monétaire de la pauvreté, les deux approches dites multidimensionnelle, l'approche des besoins de base et l'approche des capacités, définissent la pauvreté selon plusieurs critères. Elles couvrent une analyse globale du phénomène de la pauvreté permettant de dépasser l'analyse unidimensionnelle classique. Nous constatons finalement l'absence d'un consensus sur une définition de la pauvreté. Il y a plusieurs approches concurrentes. Le sous ensemble de la population à considérer comme pauvre reste dépendant de l'approche retenue.

3. Mesure multidimensionnelle de la pauvreté : approche théorique

Dans les analyses et les études sur la mesure de la pauvreté, comme nous l'avons précisé ci-dessus, plusieurs approches peuvent être proposées. En effet, par définition, il semble que plusieurs dimensions doivent être simultanément retenues. La mesure qui découlerait serait naturellement composite voir complexe. Certains indicateurs à prendre en considération apporteraient des informations mieux que d'autres sur ce phénomène, mais aucun indicateur ne semble être suffisant à lui seul pour rendre compte de la situation. Ainsi, chacune des dimensions à identifier devrait être prise en considération.

3.1. Considérations méthodologiques

Plusieurs arguments, théoriques et pratiques, peuvent être développés et avancés pour justifier le recours à des approches multidimensionnelles pour mesurer la pauvreté. Ainsi, sur le plan théorique, la constatation repose sur le fait que la pauvreté n'est pas liée à la seule faiblesse du revenu ou de la dépense de consommation par exemple. Elle est aussi due à des manques au niveau d'autres dimensions (voir ci-dessus). Chacune de ces dimensions reflète en effet, et de façon nette, un aspect particulier du bien être. Pris ensemble, d'une façon ou d'une autre, toutes ces dimensions illustrent le caractère multidimensionnel de la pauvreté. Sur le plan pratique, il est généralement admis, que le seul indicateur basé sur une mesure monétaire (revenu ou dépense) ne reflète pas le niveau de vie de l'individu et ne permet aucune comparaison valable, ni dans le temps ni dans l'espace. En effet, à travers les enquêtes statistiques généralement exploitées, il n'est pas du tout évident que les niveaux de ces grandeurs soient convenablement observés et approchés.

L'approche de la pauvreté ne peut et ne doit donc être que multidimensionnelle, c'est-à-dire beaucoup plus large et plus riche que l'approche qui ne serait basée que sur un seul indicateur (le revenu ou la dépense de consommation). Cependant, l'adoption d'une approche multidimensionnelle nécessite naturellement l'utilisation de plusieurs données individuelles sur plusieurs dimensions du bien être. Cette exigence a alors longtemps découragé les économistes tout comme les statisticiens à développer des mesures de la pauvreté qui tiennent compte du caractère multidimensionnel de ce phénomène.

Par ailleurs, et en plus du problème des données, sur les plans à la fois théorique et pratique, il ressort que l'un des problèmes fondamentaux des approches de la pauvreté est la difficulté, voir l'impossibilité pratique, de capter simultanément toutes ses facettes. En effet, et à cause de sa nature complexe et multidimensionnelle, il existerait a priori plus d'une approche pour mesurer la pauvreté des ménages ou des personnes, qui sont en général les unités statistiques de référence des différentes enquêtes. Dans ces approches, il se pose en effet toujours et très rapidement, comme on vient de le voir, le problème des dimensions à retenir ainsi que les indicateurs (binaires ou continues) associés à intégrer dans toute mesure à proposer. Par la suite, et à supposer que le problème des dimensions à retenir est résolu, se pose celui de l'agrégation (ou pas) de ces indicateurs en un indicateur composite de synthèse en utilisant un système précis et objectif de pondérations.

3.2 Mesure de la pauvreté multidimensionnelle

Dans le cadre de la pauvreté multidimensionnelle, il faut avoir un indicateur composite de pauvreté (Il représente la valeur agrégée de plusieurs indicateurs de pauvreté à l'aide d'une forme fonctionnelle), d'un indice composite de pauvreté (résultante de l'agrégation de l'indicateur composite de pauvreté sur une population donnée) et spécifier les dimensions de bien être choisies (ce point sera abordé au chapitre suivant). Dans ce qui suit nous allons développer les différentes approches qui sont utilisées pour la construction des indicateurs composites de pauvreté et après nous parlerons des indices composites des pauvretés.

4 Les indicateurs composites de pauvreté

La construction d'un indicateur composite de pauvreté est un exercice difficile. Dans la littérature, il y a principalement trois techniques : la technique basée sur la théorie des ensembles flous, la technique basée sur l'entropie et la technique basée sur la théorie de l'inertie.

4.1 L'approche de l'entropie

Développée à l'origine par Claude Shannon (1948, A Mathematical Theory of Communication) pour mesurer la quantité d'information, l'entropie est définit comme la mesure de l'incertitude associée à une variable aléatoire.

E. Maasoumi (Maasoumi; 1999) est parti de cette théorie pour proposer un indicateur composite de pauvreté.

4.2 L'approche de l'inertie

Cette approche est basée sur les techniques dites d'analyse des données dont les principales méthodes sont l'Analyse en Composantes Principales (ACP), l'Analyse Factorielle des Correspondances (AFC) et l'Analyse Factorielle des Correspondances Multiples (ACM). Ces méthodes factorielles relèvent de la géométrie euclidienne et conduisent à diagonaliser une matrice carrée en extrayant les valeurs et les vecteurs propres. Ces sont des méthodes exploratoire multidimensionnelle qui permettent de décrire des relations entre deux ou plusieurs variables en fournissant une représentation graphique sous forme d'un nuage de points projetés dans un sous-espace de faible dimension. Nous pouvons à l'aide de ces méthodes réaliser une étude d'homogénéité entre les indicateurs de bien être et construire un indicateur de bien être.

5 La ligne de pauvreté multidimensionnelle

Il s'agit de trouver une valeur en dessous de laquelle une personne ou un ménage est considéré comme n'ayant pas le minimum de bien être. La détermination du seuil de pauvreté est une tache délicate. Nous détaillerons la démarche choisie dans le cadre de ce travail au prochain chapitre.

6 Les indices de pauvreté multidimensionnelle

Une fois le seuil déterminé on peut calculer les indices de pauvreté. Il est à noter que même l'approche non monétaire utilise les indices FGT.

6.0. Les mesure de ressemblance

Tout système ayant pour but d'analyser ou d'organiser automatiquement un ensemble de données ou de connaissances doit utiliser, sous une forme ou une autre, un opérateur capable d'évaluer précisément les ressemblances ou les dissemblances qui existent entre ces données.

La notion de ressemblance (ou Proximité) a fait l'objet d'importantes recherches dans des domaines extrêmement divers. Pour qualifier cet opérateur, plusieurs notions comme la similarité, la dissimilarité ou la distance peuvent être utilisées.

6.0.1 Définition

Nous appelons similarité ou dissimilarité toute application à valeurs numériques qui permet de mesurer le lien entre les individus d'un même ensemble. Pour une similarité le lien entre deux individus sera d'autant plus fort que sa valeur est grande. Pour une dissimilarité le lien sera d'autant plus fort que sa valeur dissimilarité est petite

6.0.2 Indice de dissimilarité

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de dissimilarité (ou dissimilarité), s'il vérifie les propriétés suivantes :

1. (propriété de symétrie)

2. (propriété de positivé)

6.1 Distance

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit distance, s'il vérifie en plus des deux propriétés 1 et 2 les propriétés d'identité et d'inégalité triangulaire suivantes :

3. (propriété de d'identité)

4. (inégalité triangulaire)

6.2 Indice de similarité

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de similarité (ou similarité), s'il vérifie en plus de la propriété de symétrie (1) les deux propriétés suivantes :

5. (propriété de positivité)

6. (propriété de maximisation).

Il convient de noter ici que le passage de l'indice de similarité s à la notion duale d'indice de dissimilarité (que nous noterons d), est trivial. Etant donné smax la similarité d'un individu avec lui-même (smax= 1 dans le cas d'une similarité normalisée), il suffit de poser :

6.3 Mesure de ressemblance entre individus à descriptions classiques

Le processus de classification vise à structurer les données contenues dans X={X1, X2, ..., Xn} en fonction de leurs ressemblances, sous forme d'un ensemble de classes à la fois homogènes et contrastées.

L'ensemble d'individu X est décrit généralement sur un ensemble de m variables Y= {Y1, Y2,..., Ym} définies chacune par :

Où Äh est le domaine d'arrivée de la variable Yh.

En conséquence, les données de classification sont décrites dans un tableau Individus-variables où chaque case du tableau contient la description d'un individu sur une des m variables. Ce tableau Individus-Variables est en général un tableau homogène qui peut être de type quantitatif (cas où toutes les variables sont quantitatives) ou qualitatif (cas où toutes les variables sont qualitatives).

6.4 Tableau de données numériques (continues ou discrètes)

La distance la plus utilisée pour les données de type quantitatives continues ou discrètes est la distance de Minkowski d'ordre á définie dans Rm par :

, si :

Ø est la distance de city-block ou Manhattan.

Ø est la distance Euclidienne classique.

Avant de continuer nous allons faire une présentation des méthodes statistiques que nous avons retenues. Vu que L'ACM est souvent définie comme une analyse factorielle sur un tableau disjonctif complet et l'analyse factorielle est à son tour définie comme une double analyse en composantes principales. Nous allons faire un petit rappel rapide sur ces méthodes factorielles en commençant par l'analyse en composante principal et nous allons chuter avec la l'ACM.

7. Analyse en composante principale

Le but de l'A.C.P est de transformer un jeu de variables corrélées en des variables non corrélées, qui, dans un contexte idéal (Gaussien) pourraient être interprétées comme des facteurs indépendants sous-jacents au phénomène. C'est pourquoi ces quantités orthogonales seront appelées «facteurs», bien que cette interprétation ne soit pas toujours parfaitement adéquate.

7.1 Principes de l'ACP

L'Analyse en Composante Principale (ACP) fait partie des analyses descriptives multivariées. Le but de cette analyse est de résumer le maximum d'informations possibles en perdant le moins possible pour :

Ø Faciliter l'interprétation d'un grand nombre de données initiales,

Ø Donner plus de sens aux données réduites

L'ACP permet donc de réduire des tableaux de grandes tailles en un petit nombre de variables (2 ou 3 généralement) tout en conservant un maximum d'information. Les variables de départ sont dites « métriques ». L'idée de l'ACP est de déterminer un nouveau repère de associé de manière naturelle à la structure du nuage considéré, de façon à pouvoir l'y examiner plus commodément.

Pour s'affranchir des effets d'échelle dus à l'hétérogénéité éventuelle des variables, ces dernières sont en général normalisées, c'est à dire que chaque colonne est divisée par son écart-type; toutes sont dès lors exprimées dans la même échelle standard.

D'autre part, l'origine est placée au centre de gravité du nuage. C'est le nuage ainsi transformé qui est en fait considéré; l'utilisateur n'a cependant pas à se préoccuper de ces transformations préalables, sauf demande contraire, elles sont exécutées automatiquement par les logiciels d'ACP.

7.2 Directions principales - plans principaux et Représentation des individus

Le nuage présente généralement des directions d'allongement privilégiées, celle d'allongement maximal D1 est dite première direction principale (axe principal) (du nuage), la suivante D2 parmi toutes celles perpendiculaires à D1 est la seconde direction principale, la suivante D3 parmi toutes celles perpendiculaires à D1 et D2 est la troisième direction principale, etc.

On choisit un vecteur unitaire sur chaque direction (le choix du sens est libre et décidé arbitrairement par le logiciel utilisé) et on obtient une base orthonormée de , c'est la base principale du nuage.

On appelle plan principal i j le plan vectoriel déterminé par les directions et . En général, le nuage est approximativement situé dans un sous-espace de de faible dimension, engendré par les premières directions principales; l'examen de ses projections sur quelques plans principaux bien choisis (12, 13, etc.) permet alors de découvrir ses particularités et de décrire sa structure assez précisément.

a) Composantes principales - représentation des variables

De même que les variables initiales sont associées aux axes canoniques de, de nouvelles variables appelées composantes principales sont associées aux axes principaux: la composante principale est le vecteur de qui donne les coordonnées des individus sur l'axe principal muni du vecteur unitaire .

Les composantes principales sont naturellement des combinaisons linéaires des variables initiales, on montre qu'elles sont centrées et non corrélées.

L'examen des corrélations entre les variables initiales et les composantes principales permet d'interpréter ces dernières et les axes principaux correspondants.

Inertie

Un individu i du nuage (supposé muni des poids uniformes = 1) a une inertie I(i) :

I(i) = O = O

Si est la projection de i sur l'axe principal , l'inertie de i suivant cet axe est: (i) = O

L'inertie de i se décompose en la somme de ses inerties suivant les différents axes principaux (perpendiculaires):

I(i)=

L'inertie totale suivant l'axe , est:

Et l'inertie totale du nuage est :

I= =

Les directions principales d'allongement du nuage sont en fait les directions perpendiculaires successives d'inertie maximum du nuage.

Taux d'inertie

Il s'agit des inerties successives etc. suivant les axes principaux etc. du nuage. Leurs valeurs relatives traduisent l'importance de l'allongement suivant ces directions successives. On édite les taux relatifs etc., ainsi que les taux relatifs cumulés

Lorsque ces derniers approchent 100%, on considère que l'on a assez d'axes principaux pour représenter convenablement le nuage.

Contributions des axes aux individus (COR)

Il s'agit des ratios tels que:

COR(k, i) = qui mesure la qualité de la représentation de l'individu i sur l'axe principal

On a:

Il n'est licite de commenter la position de l'individu i sur le plan principal kh que si le ratio:

n'est pas trop faible.

La considération de ces ratios, qui sont des cosinus carrés, n'est pertinente que pour les points pas trop proches de l'origine. Pour ceux-ci, c'est plus leur position, centrale, que la direction dans laquelle se manifeste leur faible éloignement, qui les caractérise.

Contributions des individus aux axes (CTR)

Il s'agit des ratios tels que :

CTR(i, k) = qui mesure la part prise par l'individu i dans la détermination de l'axe principal

On a:

Contributions des axes aux variables (COR)

Il s'agit des coefficients de corrélation au carré tels que:

COR(k, j) = entre la variable initiale et la composante principale . Elles permettent comme on l'a vu de dégager la signification des axes.

On a :

Ces quantités sont les carrés de celles figurées dans le cercle des corrélations utilisé pour représenter graphiquement les variables.

Contributions des variables aux axes (CTR)

Il s'agit des ratios tels que:

CTR(j, k) = corr2(ck, x.j) / S corr2(ck, x.i)

On a: = 1

L'observation des premiers plans principaux ne permet aucune conclusion, et peut même être source de contresens, si elle ne s'accompagne pas de l'examen des quantités précédentes. Il faut donc toujours les faire éditer par le logiciel utilisé et les consulter.

7.3 Analyse des résultats d'une ACP

Analyser les résultats d'une ACP, c'est répondre à trois questions :

1. Les données sont-elles factorisables ?

2. Combien de facteurs retenir ?

3. Comment interpréter les résultats ?

8. Analyse factorielle des correspondances multiples

L'analyse des correspondances multiples (ACM) est une technique de description de données qualitatives : on considère ici n individus décrits par p variables X1, X2, .... Xp à m1, m2,...,mp catégories. Cette méthode est particulièrement bien adaptée à l'exploration d'enquête où les questions sont à réponses multiples.

Sur le plan formel il s'agit d'une application de l'analyse des correspondances au tableau disjonctif complet des m1 + m2 +...+mp indicatrices des catégories. Cette méthode peut être considérée comme l'équivalent de l'analyse en composantes principales pour les données qualitatives.

Codage des individus

Les données peuvent être rassemblées dans un tableau de type Individus × variables. Les lignes représentent les individus, les colonnes représentent les variables : à l'intersection de la ligne i et de la colonne j, se trouve la valeur xij de l'individu i pour la variable j. Naturellement, les valeurs xij sont des codifications qui ne possèdent pas de propriétés numériques. Si la variable j est la couleur des yeux des individus, cette couleur peut être codifiée ainsi : bleu = 1, blanc = 2. Il est clair que la moyenne entre bleu et blanc n'a pas de sens numériques.

Une autre façon de présenter ces mêmes données est de construire un tableau Disjonctif Complet (voir tableau 2.1). Dans ce tableau, les lignes représentent les individus et les colonnes représentent les modalités des variables : à l'intersection de la ligne i et de la colonne j on trouve xij qui vaut 1 ou 0 selon que l'individu i possède la modalité j ou non. L'origine de la terminologie Tableau Disjonctif Complet est la suivante : l'ensemble des valeurs xij d'un même individu, pour les modalités d'une même variable, comporte la valeur 1 une fois (complet) et une fois seulement (disjonctif).

Tableau 2.1 : tableau disjonctif complet

Il existe d'autres formes de représentation des données : l'hyper tableau de contingence et le tableau de Burt (tableau 2.2). Le tableau de Burt est construit en multipliant le tableau disjonctif complet avec sa transposé T'T.

On appelle Analyse Factorielle des Correspondances Multiples (ACM) des variables (X1, ..., Xp) relativement à l'échantillon considéré l'AFC réalisée soit sur la matrice X appelée tableau disjonctif complet, soit sur la matrice de Burt B (A. Baccini et P. Besse) ( Springer, 359-368 (1996)

Tableau 2.2 : tableau de Burt

Analyse factorielle de correspondances appliquée au Tableau Disjonctif Complet

L'analyse factorielle de correspondances (AFC) est conçue pour traiter des tableaux de fréquences issues d'un tableau de contingence. En revanche, si on applique les principes de l'AFC et la métrique de khi-deux à un TDC, on aboutira aux mêmes axes factoriels (voir Gilbert SAPORTA pour la démonstration, Probabilité, Analyse de données et statistique 2006). Mais, dans ce cas, ces calculs doivent être réinterprétés en fonction de la nature particulière du tableau. Ces calculs, munis de cette nouvelle interprétation, constituent une méthode à part entière ; d'où l'introduction du vocale Analyse des correspondances multiples. L'AFC d'un TDC n'est qu'une façon pratique de réaliser les calculs, d'ailleurs incomplète puisqu'elle ignore la notion de variables et donc ne fournit aucun résultat les concernant. Cela étant nous suivrons cette démarche historique et commode pour présenter l'Analyse des correspondances multiples.

Nuage des individus

Un individu est représenté par les modalités qu'il possède. Pour calculer la distance entre deux individus on utilise la métrique de khi-deux. Plus précisément, la distance entre les individus i et i' s'écrit :

Les coordonnées des points lignes (les composantes principales) s'obtiennent en diagonalisant le produit suivant :

Avec T : le tableau disjonctif complet, D-1 la transposée matrice des effectifs marginaux des modalités et K le nombre des variables. Les vecteurs propres du produit seront les composantes principales des individus.

Nuage des modalités

La modalité k est représentée par le profil de la colonne k. les nombres du TDC ne peuvent prendre que les valeurs 0 ou 1, le profil de la colonne k ne contient à son tour que deux valeurs possibles : 0 ou 1. La distance entre deux modalités k et h est définie par :

Les coordonnées des variables sont les vecteurs propres du produit suivant 

Remarque : dans ce travail nous nous sommes intéressés directement aux composantes principales pour obtenir directement les coordonnées factorielles des profils lignes et colonnes. Les ouvrages d'analyse des données donnent aussi les formules pour trouver les facteurs. En analysant les facteurs et les composantes principales on constate une parfaite symétrie entre les résultats de deux profils. Cette symétrie conduit alors à des représentations simultanées des deux profils sur un même plan.

Relation des transitions

Les coordonnées des profils lignes et les coordonnées des profils colonnes sont reliées par des formules simples dont le premier intérêt est d'éviter de réaliser deux diagonalisations. On diagonalisera la matrice la plus petite.

Avec ? ?? la á nième coordonnée des variables, Fá la á nième coordonnée des individus et ëá nième la á nième valeur propre. Il faut noter que les deux diagonalisations donnent les mêmes valeurs propres.

Pratique de L'analyse factorielle des correspondances multiples

L'interprétation des résultats d'une analyse factorielle des correspondances multiples se fait comme une analyse factorielle des correspondances et comme en analyse en composantes principales. On prendra garde ici au fait que les pourcentages d'inertie n'ont qu'un intérêt restreint. La sélection et l'interprétation des axes factorielles se fait essentiellement à l'aide des contributions des variables actives et des valeurs-tests associées aux variables supplémentaires.

9. Classification Automatique

L'objectif de la classification est le suivant : on dispose de données non étiquetées. On souhaite les regrouper par données ressemblantes. Cette manière de définir intuitivement l'objectif de la classification cache la difficulté de formaliser la notion de ressemblance entre deux données. Au-delà des algorithmes existant, une bonne partie de l'art à acquérir consiste ici à imaginer cette formalisation. Ainsi, soit un ensemble X de N données décrites chacune par leurs P attributs. La classification consiste à créer une partition ou une décomposition de cet ensemble en groupes telle que :

Critère 1 : les données appartenant au même groupe se ressemblent ;

Critère 2 : les données appartenant à deux groupes différents soient peu ressemblantes.

Hartiga (Référence ???) est un des premiers à discuter différents choix possibles du nombre de classes. Au fil des années, plusieurs statistiques ont été proposées afin de décider le nombre de classes à choisir et peuvent être utilisées comme règle d'arrêt dans le cadre des méthodes hiérarchiques. Elles utilisent généralement les sommes des carrés inter - groupes, ainsi que les sommes des carrés intra - groupes, notées respectivement par B et W pour une partition P en k classes {c1....Ck}:

, j = 1, ..., k, est le centre de gravité de la classe Cj et g le centre de gravité de l'ensemble des objets. nj représente le poids de la classe Cj

, j = 1, ..., k, est le centre de gravité de la classe Cj

On peut également exprimer ces mesures à l'aide des notions d'inertie d'un groupe.

Soit P, une partition en k classe {C1... Ck} alors on obtient :

, j = 1, ..., k, est le centre de gravité de l'ensemble des points de Cj avec g =   avec

#Cj représentant le nombre de points dans Cj. D'après le théorème de Koeng - Huygens, l'inertie totale T ne dépend pas de la partition choisie et est exprimée par T = W + B et vaut T= (xi, g). L'inertie intra- classe W est un critère classique d'évaluation d'une partition, mesurant l'homogénéité des classes de la partition. Par conséquent, il suffit de trouver une partition qui minimise W(Pk). De manière équivalente, on cherchera à maximise B(Pk) l'inertie interclasse qui mesure la séparation des classes. Dans ce cas, une partition vérifie les principes de cohésion interne et d'isolation externe

10. Construction de l'ICP

Usuellement, l'analyse de la pauvreté multidimensionnelle est fondée sur une méthodologie de construction d'un Indice Composite de Pauvreté (ICP). Dans le chapitre précédent nous avons présenté les trois approches de construction d'un tel indicateur. Dans le cadre de notre étude nous avons portés notre choix sur l'approche d'inertie les méthodes factorielles.

La construction de notre indicateur se fera en trois étapes. Nous réaliserons une première ACM dite exploratoire sur les variables qui seront choisies. Cette ACM aura pour but de faciliter la sélection des variables qui sont en mesure de faire une discrimination des individus selon le caractère étudié. Le critère utilisé pour sectionner les variables est la consistance ordinale sur le premier axe (COPA). Et enfin nous réaliserons l'ACP sur les dix premiers facteurs de la dernière ACM.

La COPA consiste dans ce contexte, pour tout indicateur partiel (ou variable), à vérifier si sa structure ordinale en terme de bien être est respectée par la structure ordinale des coordonnées de ses modalités sur le premier axe factoriel (ici l'ICP). Autrement dit, une variable vérifie la COPA si l'ordre de sa structure ordinale respecte l'ordre des scores factoriels de ses modalités, selon l'ICP (Touhami et Fouzia) (Novembre 7-9 2009).

Certaines variables peuvent retrouver la COPA suite à un regroupement de leurs modalités (avec le risque de perdre une partie de l'information). Dans notre analyse nous n'avons pas appliqué la COPA parce qu'il sembre forfaitaire, nous avons effectuer une Analyse en Composantes Principales sur les axes de l'ACM et Le premier facteur de l'ACP sera considéré comme indicateur de pauvreté.

Justification du choix de l'ACM pour la construction de l'ICP

La logique de l'ACM est la suivante : une modalité a un poids d'autant plus grand qu'elle est plus rare. Ainsi, dit, l'ACM attribue des poids plus importants à des modalités rares. Cette logique permet une meilleure identification des populations pauvres.

10.1 La détermination du seuil de pauvreté multidimensionnelle

Avec l'indicateur composite de pauvreté Ci calculé il est possible de calculer les indices de pauvreté multidimensionnelle une fois qu'il a été déterminé un seuil de pauvreté multidimensionnelle. Le seuil permet de constituer de classe homogène (selon le niveau de bien être) de la population analysé.

Pour construire un seuil de multidimensionnelle, nous allons appliquer la classification automatique sur les axes de notre ACP obtenus en vue de scinder la population en deux classes homogènes des pauvres et non pauvres pour en déduire le seuil multidimensionnel.

Le seuil peut être déduit en utilisant la formule suivante

Seuil ICP= (max Cip+min Cri)/2

Ou :

Max Cip est la valeur maximale de l'ICP dans la classe pauvre

Min Cip est la valeur minimale de l'ICP dans la classe non pauvre

Pour chaque ménage de la population Kinoise une valeur de l'ICP a été déduite. Cette valeur peut être négative c'est-à-dire le cas des ménages les plus pauvres selon cette approche). Sur ce nous construisons un nouvel ICP2 en faisant une simple translation de l'ICP de base en ajoutant la valeur la plus faible négative prise en valeur absolue.

PRESENTATION DES DONNEES ET CALCULS DES INDICES MULTIDIMENSIONNELS

Présentation des dimensions et des variables utilisées

Pour ce travail, nous avons extrait le sous fichier de l'enquête 123 relatif à la ville de Kinshasa. En fait, deux sous fichiers sont consultés : le premier contient les informations liées aux dépenses sur les personnes, Le second est relatif aux ménages et contient les différents aspects en liaison directe avec les conditions générales d'habitat des ménages en particulier. Pour répondre aux objectifs de ce travail, et comme nous ne considérons que le niveau ménage, nous avons exploité les données issues du deuxième sous fichier.

Les principales dimensions que nous retenons pour approcher le bien-être des ménages au niveau de notre approche sont : certaines caractéristiques de l'habitat, quelques éléments de base du logement, certains éléments de confort à la disposition du ménage. Chacune des dimensions retenues regroupe en fait un ensemble d'indicateurs. La justification du choix des différentes dimensions est donnée à l'occasion de leur description. Les chiffres et résultats présentés ci-dessous découlent de notre exploitation directe du sous fichier de 123 au niveau de Kinshasa.


· L'habitat

L'explosion démographique au niveau de la ville de Kinshasa en général, a rendu le coût du logement le plus élevés en République Démocratique du Congo. Ce phénomène a rendu l'accès à un habitat salubre et de qualité moyenne difficile pour les ménages les plus démunis. L'habitat est ainsi un vu comme facteur net de discrimination et doit de ce fait, être considéré parmi les dimensions de pauvreté ou de bien-être. Plusieurs indicateurs sont en général définis pour intégrer la dimension habitat dans une approche non monétaire de la pauvreté :

Ø Type Habitat,

Ø Matériaux des Murs ;

Ø Nature de sol ;

Ø Nature de toiture ;

Ø Statut d'occupation 

D'après les données d'enquête 123 de 2005, la structure de l'habitat dans la ville de Kinshasa se présente comme suit :

1. Type d'habitat : Caractérise par une prédominance des maisons de concession habitées près de 78,38% des ménages de la ville de Kinshasa. 5 % habitent des maisons en pièces sans dépendances, 4,69% habitent des villas et 4% habitent des appartements, 6% des Kinois habitent dans des maisons en bandes et 2% habitent dans les studios. Ces derniers seraient des ménages à considérer comme les plus pauvres selon ce critère.

2. Matériaux des Murs : Caractérisé par une dominance des maisons construites avec du bloc ciment, 2,17% sont en béton armés, 6,46% de maisons kinoises sont en briques cuites, 5,4% en briques adobes, 1% en mur pisé, 2% en bois ou planches et 0,1% sont faites à l'aide des végétaux ou nattes. Le 1% sont construites selon l'enquête par les matériaux non prévues ;

3. Nature de sol : Caractérisée par une forte apparition de plus de 76,7% du sol en planche/ciment, le sol en carrelage occupe 1,24% dans la ville de Kinshasa, 10,54% sont en terre battue et 0,13% sont en bois ;

4. Nature de toiture : elle est caractérisée par 78,11% des toitures avec du tôles galvanisées, 8,7% avec des eternits, 1,91% en tuiles, 7,79% sont faites avec des tôles de récupération, 0,45% en Ardoise, 2,46% à l'aide des dalles en béton et 0,26% avec la chaume ;

5. Statut d'occupation : cet indicateur est dominé par plus de 47,75% des résidents propriétaires, 35 ;8% sont des locataires, 3,03% sont logés par l'employeur, 2,5% logés gratuitement par un tiers, 0,3% sont logés dans les concessions familiales et près de 10,44% sont dans les locations ventes ;

Assainissement

Un certain niveau ou une certaine qualité de vie et l'assurance d'une sécurité sanitaire sont généralement conditionnés par un cadre de vie assaini et amélioré. Ce cadre étant l'assainissement qui est étroitement lié à l'habitat. C'est en quelque sorte la partie infrastructure de ce dernier. Les indicateurs retenus à ce niveau dans le cadre de ce travail sont :

a. Approvisionnement en eau

b. Aisance ;

c. Evacuation ordures

En rapport avec les données de 123, nous constatons des statistiques suivantes :

1. Approvisionnement en eau : cette variable est caractérisée par une prédominance d'environ 41,33% des foyers qui ont des robinets extérieurs, 11,99% des ménages ont des robinets intérieurs, 2,13% des ménages font recours au forage pour s'approvisionner en eau, 31,37% utilisent les robinets d'un autre ménage, 3,03% des ménages kinois ont des puits protégés et 1,4% ont des puits non protégés,3,09% utilisent des sources aménagées, 4,28% utilisent des sources non aménagées, 0,18% des kinois selon l'échantillon utilisent les cours d'eau et seulement 0,09% font usage de borne fontaines.

2. Aisance : cet indicateur qui est lié à l'habitat et qui le montre le minimum de condition sanitaire nous révèle qu'il ya plus de 42,13% des ménages kinois utilisent un trou dans la parcelle comme toilette, 10,24% des ménages ont des toilettes intérieures privées chasse eau, 13,90% en ont en externe privée chasse eau, 17,35% des foyers utilisent des toilettes communes des ménages, 10,59% ont des latrines aménagées privées et 4,87% ont des latrines aménagées publiques et nous avons plus de 0,79% des ménages kinois qui manquent des toilettes.

3. Evacuation ordures : L'utilisation inconsidérée des ressources et l'élimination des déchets dans l'environnement contribuent à la dégradation du milieu. Cette dégradation a des implications sur la santé humaine, l'économie, la production alimentaire, le tourisme, la flore et la faune. Nous ne verrons notre qualité de vie s'améliorer que si nous donnons à l'environnement, que tous nous partageons, les soins qui lui sont dû, c'est-à-dire en exploitant les ressources de façon judicieuse et en prévenant le gaspillage inutile. Nous remarquons concernant l'évacuation des déchets qu'au moins 20,63% des ménages font des dépotoirs sauvages de leurs déchets, 22,71% utilisent l'enfouissement, 16,73% ont des services publics ou privés, 13,18% des ménages font l'incinération de leurs déchets, 8,32% des ménages utilisent des voies publiques pour évacuer leurs déchets, 6,44% font usage des cours d'eau et 9,14% les utilisent comme fumier.

Energie

Que ce soit sur le plan environnemental ou sur le plan économique, les économies d'énergie électrique sont une priorité pour l'homme moderne, car il en sera à terme, le premier bénéficiaire. Elle consiste à fournir le même résultat dans les domaines du chauffage, de l'éclairage, de l'électro ménager.


Dans nos logements, nous consommons une part importante de l'énergie électrique produite, pour nous chauffer, nous laver, nous nourrir, nous distraire, nous éclairer, etc. Mais cette énergie coûte cher et actuellement l'essentiel de sa production n'est pas sans effet sur notre environnement. Les économies d'énergie électrique dans l'habitat, permettent d'économiser les énergies non renouvelables. Economiser l'électricité, n'est pas un choix, mais bien une urgente nécessité. Les indicateurs retenus dans cette dimension pour évaluer le degré de pauvreté sont les suivants :

a. Eclairage

b. Energie cuisine

Par rapport aux données de cette enquête, nous observons des statistiques suivantes :

1. Eclairage : pour cet indicateur les ménages kinois qui utilisent l'électricité comme source d'éclairage représente 65,03%, 32,16% utilisent du pétrole plus la lampe tempête, 1 ,3% utilisent la lampe Coleman, 0,36% font recours aux groupes électrogènes.

2. Energie cuisine : plus de 44,64% des ménages interrogés utilisent de l'électricité pour leur cuisine, 1,82% font recours au gaz, 39,55% utilisent du pétrole et environ 0,89% font usage de feu de bois

Education

L'influence que peut exercer l'éducation des hommes sur leur productivité et sur la croissance économique avait été soulignée par les économistes classiques, et notamment par Adam Smith. Aujourd'hui, le rôle de l'éducation est glorifié par les institutions internationales. C'est d'ailleurs, le deuxième point des objectifs du millénaire pour le développement (OMD). L'éducation constitue donc l'une des dimensions les plus importantes de l'analyse de la pauvreté. Elle peut cependant être appréhendée par plusieurs indicateurs, chacun caractérisant un aspect particulier de la mobilisation de cet actif. Dans le cadre de cette étude sur la pauvreté, le variable retenue pour caractériser l'éducation est le diplôme le plus élevé du chef de ménage interrogé ; 21,21% ont des certificats de l'école primaire, 7,34% ont des brevets du secondaire, 3,78% des chefs de ménages sont des d4, 11,38% sont des diplômés d'Etat, 3,61% ont un diplôme de graduat, 1,65% des ménages interrogés sont des licenciés et seulement 0,086% ont une thèse

Calculs des Indices Multidimensionnels

Notions

Pour conduire une ACM, on suppose que l'on dispose de N individus (ménages de la ville de Kinshasa dans notre cas) décrits par p variables qualitatives notées X1, X2, ......, Xp. Si les variables ne sont pas qualitatives à la base (continues ou discrètes avec plusieurs modalités) elles sont alors « recodifiées » de façon appropriée en des variables catégorielles (classes) avant l'analyse. On désignera alors par X le tableau des données obtenues à partir des observations de ces p variables sur l'ensemble des N individus. C'est donc une matrice de N lignes et P colonnes. Le tableau (ou la matrice) X est donc la base de données de l'ACM à conduire.

Soit Q l'ensemble des P variables considérées (Card Q = P). Pour chacune des P variables de l'ensemble Q (p = 1, ..., P) on considère l'ensemble Jp de toutes les modalités possibles associées à la variable (qualitative) p. On note ensuite par J l'ensemble union des modalités de toutes les variables. À partir du tableau des données de base X, on définit un nouveau tableau avec des caractéristiques particulières. Ainsi, pour tout individu

i?N (i = 1, ..., N) et pour toute variable p?P (p = 1, ..., P) on pose : Kj = 1 si i a la modalité j de la variable p, et Kj = 0 sinon. Le tableau qui découle de ce processus, de terme général Kij (i ?N, j ?Jp) est appelé Tableau Disjonctif Complet (TDC) associé au tableau X. sur ce tableau que nous que nous réaliserons notre analyse.

Calculs

On sait que la contribution de la modalité j est autant plus grande que sa fréquence d'apparition est faible. Sur le plan pratique, ceci implique que les modalités à faible effectifs risquent d'avoir trop d'importance dans la définition des axes factoriels. Ainsi nous avons effectué une première ACM en analysant les résultats, les modalités à faible fréquence ont été éliminées. En plus les variables retenues ont un pouvoir discriminant important, car le pouvoir discriminant montrer la dispersion des modalités dans une dimension ou dans un axe

L'Analyse Multiples des Correspondances effectuée donne les axes factoriels et les projections de chaque variable sur les axes factoriels. Les résultats de cette analyse nous informent sur les valeurs propres, le taux d'inertie, les corrélations entre les variables initiales et les axes, la représentation des modalités sur les axes. Etc.....

Les valeurs propres permettent de rendre compte de l'importance relative de chaque dimension dans la part d'information statistique pris en compte par la solution.

Le taux d'inertie est le rapport entre la valeur propre avec la somme totale des valeurs propres, cette quantité constitue une mesure de la part de variabilité globale prise en compte par cet axe ou la part d'information contenue dans cet axe. Le tableau suivant donne les 5 premiers axes factoriels, les valeurs propres correspondances ainsi que le taux d'inertie lié à une valeur propre.

Axes

Le coef. alpha de Cronbach

Valeur Propre

Taux d'inertie

1

,840

0,33

,362

2

,706

0,217

,236

3

,477

0,14

,148

4

,439

0,13

,140

5

,373

0,11

,127

Analyse et Interprétation des résultats

Le coefficient d'Alpha de Cronbach

Le coefficient alpha de Cronbach, parfois appelé simplement coefficient, est une statistique utilisée notamment en psychométrie pour mesurer la cohérence interne (ou la fiabilité) des questions posées lors d'un test (les réponses aux questions portant sur le même sujet devant être corrélées). Sa valeur s'établit entre 0 et 1, étant considérée comme "acceptable" à partir de 0,7. Il permet donc l'estimation de la fidélité du score à un test. Présenté par Lee Cronbach en 1951

Dans le cadre de notre travail, le coefficient alpha de Cronbach sera utilisé comme indicateur de nos échelles de mesure. Il s'agit en effet d'une méthode éprouvée et utilisée dans la plupart des travaux de recherche actuels (Evrard et al., 1997) malgré ses limites (Peterson, 1994 ; Thiétart, 1999) et l'existence d'indices concurrents ( ex : rhô de Joreskog ; Joreskog, 1971 ; Osburn, 2000). Ce coefficient est une estimation de la variance du score total de l'échelle due à tous les facteurs communs propres aux items de l'échelle testée. Il permet de vérifier si les énoncés d'une échelle de mesure ou d'un indicateur partagent des notions communes, c'est à dire si chaque item présente une cohérence avec l'ensemble des autres énoncés de l'échelle. En pratique, l'alpha de Cronbach est un nombre inférieur à 1 qui doit être le plus élevé possible. Ainsi, plus alpha se rapproche de 1, plus les items ou les indicateurs sont corrélés entre eux et plus l'échelle a une cohérence interne. Si le score d'alpha est satisfaisant, alors les items ou les indicateurs sont cohérents entre eux et peuvent être additionnés pour former un score global puisqu'ils sont admis à mesurer un même phénomène. . Donc selon le tableau ci-dessus, seuls les deux premiers axes nous donnent un coefficient supérieur à 0,7, c'est-à-dire une cohérence interne des modalités d'un indicateur qui peuvent être agrégés pour en former un seul.

Les deux axes nous donnent une quantité d'information d'environ 60%, et le premier axe contient 36,2% d'informatique cet axe sera considéré comme notre Indicateur Composite de la pauvreté(ICP)

Mesure de Discrimination

 

Dimension

Variables

1

2

Type habitat

,484

,241

Matériaux des murs

,288

,299

Nature de sol

,407

,391

Nature de toiture

,414

,248

Statut d'occupation

,282

,224

Energie cuisine

,480

,258

Eclairage

,363

,140

Approvisionnement en eau

,621

,463

Aisance

,656

,430

Evacuation ordures

,252

,120

Situation matrimoniale

,007

,002

Diplôme le plus élève obtenu

,086

,017

 
 
 

Le tableau suivant donne les mesures de discriminations des indicateurs sur les axes, nous remarquons que la variable Aisance discrimine le mieux les ménages sur le premier axe , suivi de l'approvisionnement en Eau et le type d'habitat, cela confirme même les statistiques que nous avons fait au début, l a situation matrimoniale et le niveau du diplôme n'ont pas un grand pouvoir discriminatif. D'une façon générale, les indicateurs considérés ont un pouvoir discriminatif important sur le premier axe que dans les autres axes.

Ainsi, les deux dimensions retenues permettent de prendre en compte 60% du taux d'inertie totale à travers une représentation graphique plane interprétable en termes de distances entre observations, ce taux est utilisé pour exprimer ou apprécier la qualité de la représentation des modalités ou des individus sur le plan 1X2.

Projections des modalités sur le plan 1x2

Nous remarquons une situation de pauvreté dans le troisième et deuxième quadrant, une situation de pauvreté moyenne dans le premier quadrant et de non pauvreté dans le quatrième. Cela montre que la première dimension explique en quelque sorte le bien-être. plus une modalité a une valeur très élevée plus elle exprime une situation de non pauvreté. Les modalités se retrouvant concentrées au centre posent un problème de codification effectué et le poids par rapports aux effectifs n'est pas équitable à chaque modalité

Recherche du seuil de la pauvreté multidimensionnelle

Pour avoir le seuil multidimensionnel, nous appliquons la technique de classification automatique des centres mobiles sur notre ICP et également la régression linéaire simple en vue de segmenter ou de scinder notre échantillon des ménages en deux groupes homogènes, voici le résultat de l'algorithme exécuté sous SPSS

 
 

Effectif

Groupe

1

2306

2

10405

Total individus

12711

Données Manquantes

,000

Calcul du seuil multidimensionnel

Le seuil sera déduit à l'aide de la formule décrite ci-dessus, après calcul notre seuil trouvé a une valeur de

3,51%. Une fois ce seuil est trouvé, nous pouvons maintenant calculer les indices de pauvreté en se servant de la formule de FGT

Où, N est le nombre de ménages dans l'espace géographique considéré, z le seuil de pauvreté multidimensionnelle associé sur l'axe ICP2 et á ?0 est un coefficient d'aversion à la pauvreté multidimensionnelle pouvant prendre l'une des valeurs 0, 1 ou 2 et q le nombre de ménages ayant un ICP2 inférieur à z si á=0 on aura FGT0 ou P0 (la part de la population dont la consommation est en dessous de la ligne de pauvreté), á=1 on aura FGT1 (indice de profondeur de la pauvreté) et á=2 P2 (mesure la sévérité de la pauvreté).

P0=82%

D'autres indices tels que la sévérité et la profondeur peuvent être calculé, et une décomposition spatiale par commune de la pauvreté

CONCLUSION ET RECOMMANDATION

Dans le cadre de cette étude, nous avons élaboré analyse de la pauvreté multidimensionnelle non monétaire de la ville de Kinshasa.

Comme nos analyses les indiquent, Comme le montrent d'autres études du même type mais avec des méthodes différentes, nos résultats confirment que la pauvreté, mesurée de façon autre que monétaire, semble beaucoup plus intense et étendue dans cette ville. Elle toucherait plus de ménages et de personnes que le laisserait entendre une approche monétaire basée sur la dépense ou la consommation par exemple.

Sur la base des résultats obtenus, nous montrons l'importance de l'approche multidimensionnelle de la pauvreté dans la prise en comptes de plusieurs indicateurs du bien être. Basée sur la seule approche monétaire, toute politique de lutte contre la pauvreté risquerait de ne pas être efficace, par exemple la grande part de consommation des ménages kinois ne dépend pas des revenus.

L'incidence de la pauvreté multidimensionnelle par rapport au seuil obtenu en classifiant de manière automatique est environ de 82%.

Les résultats de la pauvreté issue de l'approche monétaire sont moins explicatifs que ceux de l'analyse non monétaire du fait qu'il considère qu'un seul indicateur. L'analyse multidimensionnelle nous montre que les ménages kinois ne sont pas affectés par la même forme de pauvreté. Les ménages sont plus pauvres en 68% par le manque de bon endroit pour s'approvisionner en eau potable, 64% manque d'électricité permanente et qui doit recourir soit au gaz, pétrole ou bois pour faire la cuisine. Dans 54% de ménages pauvres le diplôme le plus élevé est inferieur au graduat, plus de 62% des ménages n'ont pas des bonnes toilettes. Notre analyse montre que c'est la variable Aisance qui discrimine le mieux les ménages. Une situation d'extrême pauvreté est décrite par les modalités suivantes : approvisionnement en eau chez les voisins, pétrole comme source d'énergie, cuisine et éclairage, pas des toilettes ou un trou dans la parcelle, habitation en bois ou planches, nature du sol en terre battue.

Nous formulons des recommandations aux organismes luttant pour la réduction de la pauvreté d'apporter les efforts sur l'éducation car plus le chef de ménage a un niveau d'étude élevé, moins le ménage est trop pauvre, amélioration des sources d'eaux potables et mettre en place une politique pour l'évacuation des ordures, de revoir l'énergie électrique car ces secteurs décrivent une forme de pauvreté dont plus de la moitié de la population kinoise souffre.

En ce qui concerne les données qui nous ont permis d'effectuer cette étude, nous recommandons que l'enquête soit élaborée ou menée dans le cadre des analyses de pauvreté multidimensionnelle, d'éviter une grande différence par rapport au nombre de modalités des variables, que la répartition des enquêteurs soit équilibrée dans toutes les communes.

Comme perspective, nous souhaitons effectuer une analyse multidimensionnelle multi indicateurs pour pallier aux failles de l'approche d'ICP et faire le ciblage des politiques à l'aide du modèle MIMIC pour identifier des groupes des pauvres et l'influence de chaque indicateur à la composition de la pauvreté en suite étendre cette étude sur le plan national.

BIBLIOGRAPHIE

1. AMBAPOUR S: Pauvreté multidimensionnelle au Congo, Bureau d'application des méthodes Statistique et Informatique.

2. Baccini Aet P. Besse : Exploration statistique, Institut National des Sciences Appliquées de Toulouse.

3. BOSCO J, Salimata F et Bocar F : Pauvreté multidimensionnelle au Sénégal, Cahier de recherche PMMA 2005-05.

4. NINGAYE Paul : Le ciblage de la multi pauvreté par les scores dimensionnels Avec application aux données camerounaises Mars 2010.

5. DAGNELI P : Méthode Statistique volume 1 et volume 2 Economica, 1995.

6. Escoffier B et Jerome Pagès : Analyses factorielles simples multiples, Dunod, 4 éd., 2008.

7. Francis NDOM : construction d'un indicateur de la qualité de la dépense publique du système camerounais, mémoire de master.

8. Lachaud J-P: Dépenses des ménages, développement humain et pauvreté au Burkina Faso : complément ou substitution ?

9. Lalanne C : Introduction aux statistiques et à l'utilisation du logiciel R.

10. Moummi A: Analyse de la pauvreté en République Démocratique du Congo, Working Papers Series N° 112, African Development Bank.

11. Paradis E : R pour débutant.

12. PREUX  P: Cours de Fouilles de données, Université de Lille3.

13. SAPORTA G : Probabilités, Statistiques et analyse de données, Technip, Paris 2006.

14. Touhami Abdelkhalek et F. Ejjanoui : Approche Multidimensionnelle de la Pauvreté: Présentation Théorique et Application Au Cas de la Ville de Marrakech, Institut national de statistique et d'économie appliquée.






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Un démenti, si pauvre qu'il soit, rassure les sots et déroute les incrédules"   Talleyrand