ANALYSE MULTIDIMENSIONNELLE DE LA PAUVRETE PAR APPROCHE
DE L'ANALYSE DE DONNEES
« CAS DE LA VILLE DE KINSHASA »
PAR
KALOMBO MAYOMBO Samuel
kalombosamuel@gmail.com
1. Introduction
La pauvreté est un phénomène qui a
existé depuis toujours. Vraisemblablement, et pour des raisons
démographiques, le nombre de pauvres était relativement plus
faible mais le taux de pauvreté était lui plus
élevé. A travers le monde, les préoccupations des
responsables étaient différentes de ce qu'elles sont
actuellement vis-à-vis de ce phénomène. Elles se
focalisaient beaucoup plus sur les autres aspects du développement et
sur la croissance des agrégats macro-économiques et beaucoup
moins sur la lutte contre la pauvreté. Par la suite, et depuis la fin
des années quatre vingt du siècle précédent, le
problème de la pauvreté a commencé à susciter un
intérêt de plus en plus grand auprès des chercheurs et des
décideurs. Cette récente prise en considération de ce
phénomène s'explique par sa persistance (voire son accentuation)
un peu partout à travers le monde. Par ailleurs, la mise en place de
politiques sociales pour contrer certains effets négatifs des politiques
de stabilisation macro-économique contenues dans les programmes
d'ajustement structurel, que certains pays comme la République
démocratique du Congo ont connus, ont commencé à mobiliser
les politiciens et les économistes du monde entier. Ces politiques
sociales laissent par nature de la place à la lutte contre la
pauvreté. Dans ce sens, et lors de l'Assemblée
Générale de l'Organisation des Nations Unies (ONU),
organisée le 8 septembre 2000, 189 pays ont adopté à
l'unanimité, la réduction de moitié de l'extrême
pauvreté et de la faim entre 1990 et 2015. Cet objectif est aujourd'hui
érigé comme l'axe majeur des Objectifs du Millénaire pour
le Développement (O.M.D.). Réduire de moitié
l'extrême pauvreté, dans n'importe quel pays, nécessite la
mise en place de stratégies de lutte efficaces et bien ciblées.
Ces politiques sont, cependant, conditionnées par une bonne
identification des populations pauvres et leur caractérisation. En
effet, une mauvaise identification de ce sous groupe de la population limite
l'efficacité de toute politique d'allégement de la
pauvreté sous toutes ses formes.
Théoriquement, l'identification des pauvres et la
mesure de la pauvreté semblent être une procédure
séquentielle simple : la sélection des indicateurs de mesure du
bien-être, la définition d'un ou plusieurs seuils de
pauvreté et l'établissement des indices de mesure du degré
de la pauvreté. Toutefois, dans la pratique, l'opération se
révèle très complexe et fait l'objet d'un large
débat entre au moins deux principaux courants de pensée. Le
premier est dit utilitariste et définit comme pauvre tout individu qui a
un revenu (ou une dépense) insuffisant ne lui permettant pas de subvenir
à ses besoins. Cette approche, bien qu'elle mette en valeur une
dimension importante du bien être, ne donne qu'une vision très
incomplète des différents manques dont souffrent les pauvres.
Le second courant est dit non monétaire ou
multidimensionnel. Il est développé et soutenu, surtout ces
dernières années, par les partisans de l'école dite des
besoins de base et ceux de l'école des capacités et des
fonctionnements avec Amartya Sen à sa tête. Ce courant approche la
pauvreté en tenant compte de plusieurs dimensions. Selon lui, les
pauvres ne sont pas seulement ceux qui ont un revenu faible, mais aussi ceux
qui ne peuvent pas satisfaire leurs besoins essentiels relatifs à la
nourriture, au logement, à l'habillement, à la santé,
à l'éducation, ..., etc. Sen, définit même la
pauvreté comme étant un manque de libertés réelles
et formelles, autrement dit, comme un manque de capacités d'être
et de faire. La pauvreté est alors vue comme une privation multiple qui
ne peut pas se réduire au seul manque de ressources
La perspective dans laquelle nous évoluerons dans le
cadre de cette analyse est celle d'une approche multidimensionnelle des
besoins de bases afin de dégager un indice de pauvreté pouvant
exprimer la situation de la RDC. Les données que nous avons
utilisées proviennent de l'enquête 1-2-3 de 2004 et 2005
réalisée par l'institut national de la statistique, INS.
Cette enquête est composée de trois sous
enquêtes intégrées, la phase 1 concerne emploi, la phase 2
qui couvre le secteur informel et la phase 3 qui est relative à la
consommation des ménages. La taille de l'échantillon de
l'enquête 1-2-3 est large, elle est de 72.685 personnes
enquêtées soient 13.215 ménages, pour une taille moyenne du
ménage de 4, 5 personnes. Cette enquête couvre les dix provinces
du pays, en plus de la capitale Kinshasa considérée comme
province et capitale en même temps. Dans la présente étude
nous utiliserons la phase 1 pour l'étude multidimensionnelle de la
pauvreté
L'objectif général est donc d'approcher la
pauvreté en milieu urbain de la ville de Kinshasa de façon
multidimensionnelle. Nous y élaborons une étude de
pauvreté non monétaire, c'est-à-dire selon plusieurs
dimensions. De façon spécifique, à travers ce travail,
nous cherchons à :
Ø faire une analyse descriptive des différentes
dimensions de la pauvreté au niveau des ménages de la ville de
Kinshasa ;
Ø calculer, en utilisant les méthodes
statistiques avancées, à savoir l'analyse des correspondances
multiples (ACM), l'analyse en composantes principales (ACP), un indicateur
composite de la pauvreté (ICP);
Ø calculer un seuil de pauvreté
multidimensionnelle en utilisant les centres mobiles qui est une technique de
classification automatique,
Ø estimer plusieurs indices de pauvreté
multidimensionnelle en utilisant l'indice FGT
2. Cadre conceptuel et approches de la pauvreté
Malgré l'abondance des écrits, le concept de la
pauvreté reste globalement ambigu et imprécis. Il est ainsi
difficile à définir, à comprendre, à
caractériser et donc à mesurer. Il existe alors plusieurs
façons de définir la pauvreté qui conduisent à des
identifications différentes des pauvres.
La pauvreté fait généralement
référence à une situation, à un état
caractérisé par le non possession d'un certain nombre de
ressources et conditions élémentaires nécessaires à
un minimum de bien-être matériel, mais aussi social, culturel.
Dans le sens ou nous l'entendons, cette non possession ne fait
bien évidemment par référence aux renonciations
volontaires que sont les formes, principalement religieuses, de voeux de
pauvreté, mais est associé à l'absence subie ou contrainte
de ces ressources et conditions élémentaires, donnant lieu alors
à des expressions sous forme de manques ou de besoins
De façon générale, la pauvreté
correspond à une ou plusieurs situations jugées comme
"inacceptables" ou encore "injustes" sur les plans économique et
social. Cependant, la détermination de l'espace de
référence à considérer pour identifier ce type de
situations est problématique et est sujet à plusieurs
débats. Trois principales approches se distinguent à ce niveau.
Chacune considère son propre espace de référence. La
première retient ce que l'on appelle les ressources, la deuxième
ce qui est dit besoins de base, alors que la troisième considère
un sous ensemble de capacités identifiées comme étant des
"capacités de base".
Sur le plan méthodologique et empirique, l'approche des
ressources retient généralement une variable monétaire
(revenu ou dépense de consommation), puis fixe un seuil de
pauvreté pour identifier les individus pauvres. Cette approche tire ses
origines principalement de la microéconomie classique qui
considère que l'utilité (approchée par le revenu ou la
consommation) est l'élément clef dans le comportement et le
bien-être des individus.
Les approches multidimensionnelles, comme leur nom l'indique,
reposent sur plusieurs Indicateurs. Elles nécessitent des
procédures d'agrégation de ces derniers en un seul indicateur qui
résumerait l'information apportée par ces indicateurs de base
puis la détermination d'un seuil de pauvreté. Ces approches non
monétaires considèrent que le revenu (ou la dépense)
à lui seul n'est pas capable d'expliquer la situation de
pauvreté. Selon cette approche, les besoins des individus sont de
plusieurs ordres. La pauvreté est donc un phénomène
multidimensionnel qui ne peut se réduire au manque de ressources.
L'approche des besoins de base identifie plusieurs dimensions
et des ensembles de pauvres selon chacune de ces dimensions qu'elle combine,
d'une façon ou d'une autre, pour définir l'ensemble de la sous
population pauvre. Il s'agit en particulier de l'alimentation, du logement, de
l'accès à la santé, à l'éducation, à
l'assainissement, etc. Les partisans de l'approche des besoins de base
considèrent que la pauvreté doit être analysée dans
toutes ses dimensions. Un individu est pauvre s'il n'arrive pas à
satisfaire ses besoins fondamentaux essentiels. Autrement dit, un individu est
pauvre s'il est privé d'un ensemble de biens et services de base
jugés nécessaires pour atteindre une certaine qualité de
vie.
L'approche dite des capacités en matière
d'approche de la pauvreté est promue et préconisée par
Amartya Sen au cours des vingt dernières années. Elle s'appuie
principalement sur la théorie de la justice développée par
Rawls en 1715. Ce dernier critique l'approche utilitariste. Selon lui une
société qui respecte le principe de justice sociale procurerait
à ses membres une équité fondée sur un ensemble
d'éléments essentiels. Parmi ces éléments, Rawls
évoque ce qu'il appelle les biens premiers qu'il considère comme
étant « les biens utiles quel que soit le projet de vie rationnel
» (Audard, 1997). En d'autre termes « les biens que tout homme
rationnel est supposé désirer ». Rawls distingue, aussi les
biens premiers naturels et les biens premiers sociaux. Les premiers sont les
qualités innées dont disposent les individus, comme la
santé et vigueur, l'intelligence et l'imagination. Quant aux biens
premiers sociaux, ils sont « identifiés par la question de savoir
ce qui est généralement nécessaire, en termes de
conditions sociales et de moyens polyvalents, pour permettre aux citoyens,
tenus pour libres et égaux, de développer de manière
adéquate et d'exercer pleinement leurs deux facultés morales,
ainsi que de chercher à réaliser leur conception
déterminée du bien ».
Même si, à la base, cette approche n'est pas
orientée directement vers l'étude de la pauvreté, elle
fournit une base informationnelle et multidimensionnelle qui permet de proposer
une définition de la pauvreté concentrée
particulièrement sur les biens premiers sociaux.
Partant de cette théorie de la justice, Sen a
développé son approche des capacités. Sen a d'abord remis
en cause les autres approches de la pauvreté. Il précise que
celles-ci ignorent la notion de diversité des êtres humains. En
effet, deux individus dotés des mêmes ressources, peuvent
atteindre des résultats différents en termes de bien-être.
En effet, ces deux individus ne vont pas utiliser leurs ressources de la
même manière. Ils auraient des caractéristiques
différentes (physiques et mentales), et donc même si les biens
envisagés ont des caractéristiques identiques, les niveaux de
bien-être réalisés seraient différents. Sen affirme
ainsi que les ressources des individus ne peuvent pas suffire pour
décrire leur bien-être. Il s'agit alors d'évaluer ce que
l'individu peut accomplir grâce à ses ressources. Sen
définit alors ce qui est dit espace des capacités. Dans cette
approche, un individu est pauvre s'il n'a pas la capacité de transformer
ses ressources en accomplissements. Bien que l'approche de Sen soit stimulante
et ait donné naissance à une littérature abondante, elle
demeure plutôt difficile à opérationnaliser. Elle
décrit et propose des concepts à plusieurs facettes qui ne sont
ni directement observables ni facilement mesurables. Pour conclure, à
l'inverse de l'approche monétaire de la pauvreté, les deux
approches dites multidimensionnelle, l'approche des besoins de base et
l'approche des capacités, définissent la pauvreté selon
plusieurs critères. Elles couvrent une analyse globale du
phénomène de la pauvreté permettant de dépasser
l'analyse unidimensionnelle classique. Nous constatons finalement l'absence
d'un consensus sur une définition de la pauvreté. Il y a
plusieurs approches concurrentes. Le sous ensemble de la population à
considérer comme pauvre reste dépendant de l'approche retenue.
3. Mesure multidimensionnelle de la pauvreté :
approche théorique
Dans les analyses et les études sur la mesure de la
pauvreté, comme nous l'avons précisé ci-dessus, plusieurs
approches peuvent être proposées. En effet, par définition,
il semble que plusieurs dimensions doivent être simultanément
retenues. La mesure qui découlerait serait naturellement composite voir
complexe. Certains indicateurs à prendre en considération
apporteraient des informations mieux que d'autres sur ce
phénomène, mais aucun indicateur ne semble être suffisant
à lui seul pour rendre compte de la situation. Ainsi, chacune des
dimensions à identifier devrait être prise en
considération.
3.1. Considérations méthodologiques
Plusieurs arguments, théoriques et pratiques, peuvent
être développés et avancés pour justifier le recours
à des approches multidimensionnelles pour mesurer la pauvreté.
Ainsi, sur le plan théorique, la constatation repose sur le fait que la
pauvreté n'est pas liée à la seule faiblesse du revenu ou
de la dépense de consommation par exemple. Elle est aussi due à
des manques au niveau d'autres dimensions (voir ci-dessus). Chacune de ces
dimensions reflète en effet, et de façon nette, un aspect
particulier du bien être. Pris ensemble, d'une façon ou d'une
autre, toutes ces dimensions illustrent le caractère multidimensionnel
de la pauvreté. Sur le plan pratique, il est généralement
admis, que le seul indicateur basé sur une mesure monétaire
(revenu ou dépense) ne reflète pas le niveau de vie de l'individu
et ne permet aucune comparaison valable, ni dans le temps ni dans l'espace. En
effet, à travers les enquêtes statistiques
généralement exploitées, il n'est pas du tout
évident que les niveaux de ces grandeurs soient convenablement
observés et approchés.
L'approche de la pauvreté ne peut et ne doit donc
être que multidimensionnelle, c'est-à-dire beaucoup plus large et
plus riche que l'approche qui ne serait basée que sur un seul indicateur
(le revenu ou la dépense de consommation). Cependant, l'adoption d'une
approche multidimensionnelle nécessite naturellement l'utilisation de
plusieurs données individuelles sur plusieurs dimensions du bien
être. Cette exigence a alors longtemps découragé les
économistes tout comme les statisticiens à développer des
mesures de la pauvreté qui tiennent compte du caractère
multidimensionnel de ce phénomène.
Par ailleurs, et en plus du problème des
données, sur les plans à la fois théorique et pratique, il
ressort que l'un des problèmes fondamentaux des approches de la
pauvreté est la difficulté, voir l'impossibilité pratique,
de capter simultanément toutes ses facettes. En effet, et à cause
de sa nature complexe et multidimensionnelle, il existerait a priori plus d'une
approche pour mesurer la pauvreté des ménages ou des personnes,
qui sont en général les unités statistiques de
référence des différentes enquêtes. Dans ces
approches, il se pose en effet toujours et très rapidement, comme on
vient de le voir, le problème des dimensions à retenir ainsi que
les indicateurs (binaires ou continues) associés à
intégrer dans toute mesure à proposer. Par la suite, et à
supposer que le problème des dimensions à retenir est
résolu, se pose celui de l'agrégation (ou pas) de ces indicateurs
en un indicateur composite de synthèse en utilisant un système
précis et objectif de pondérations.
3.2 Mesure de la pauvreté multidimensionnelle
Dans le cadre de la pauvreté multidimensionnelle, il
faut avoir un indicateur composite de pauvreté (Il représente la
valeur agrégée de plusieurs indicateurs de pauvreté
à l'aide d'une forme fonctionnelle), d'un indice composite de
pauvreté (résultante de l'agrégation de l'indicateur
composite de pauvreté sur une population donnée) et
spécifier les dimensions de bien être choisies (ce point sera
abordé au chapitre suivant). Dans ce qui suit nous allons
développer les différentes approches qui sont utilisées
pour la construction des indicateurs composites de pauvreté et
après nous parlerons des indices composites des pauvretés.
4 Les indicateurs composites de pauvreté
La construction d'un indicateur composite de pauvreté
est un exercice difficile. Dans la littérature, il y a principalement
trois techniques : la technique basée sur la théorie des
ensembles flous, la technique basée sur l'entropie et la technique
basée sur la théorie de l'inertie.
4.1 L'approche de l'entropie
Développée à l'origine par Claude Shannon
(1948, A Mathematical Theory of Communication) pour mesurer la quantité
d'information, l'entropie est définit comme la mesure de l'incertitude
associée à une variable aléatoire.
E. Maasoumi (Maasoumi; 1999) est parti de cette théorie
pour proposer un indicateur composite de pauvreté.
4.2 L'approche de l'inertie
Cette approche est basée sur les techniques dites
d'analyse des données dont les principales méthodes sont
l'Analyse en Composantes Principales (ACP), l'Analyse Factorielle des
Correspondances (AFC) et l'Analyse Factorielle des Correspondances Multiples
(ACM). Ces méthodes factorielles relèvent de la
géométrie euclidienne et conduisent à diagonaliser une
matrice carrée en extrayant les valeurs et les vecteurs propres. Ces
sont des méthodes exploratoire multidimensionnelle qui permettent de
décrire des relations entre deux ou plusieurs variables en fournissant
une représentation graphique sous forme d'un nuage de points
projetés dans un sous-espace de faible dimension. Nous pouvons à
l'aide de ces méthodes réaliser une étude
d'homogénéité entre les indicateurs de bien être et
construire un indicateur de bien être.
5 La ligne de pauvreté multidimensionnelle
Il s'agit de trouver une valeur en dessous de laquelle une
personne ou un ménage est considéré comme n'ayant pas le
minimum de bien être. La détermination du seuil de pauvreté
est une tache délicate. Nous détaillerons la démarche
choisie dans le cadre de ce travail au prochain chapitre.
6 Les indices de pauvreté
multidimensionnelle
Une fois le seuil déterminé on peut calculer les
indices de pauvreté. Il est à noter que même l'approche non
monétaire utilise les indices FGT.
6.0. Les mesure de ressemblance
Tout système ayant pour but d'analyser ou d'organiser
automatiquement un ensemble de données ou de connaissances doit
utiliser, sous une forme ou une autre, un opérateur capable
d'évaluer précisément les ressemblances ou les
dissemblances qui existent entre ces données.
La notion de ressemblance (ou Proximité) a fait l'objet
d'importantes recherches dans des domaines extrêmement divers. Pour
qualifier cet opérateur, plusieurs notions comme la similarité,
la dissimilarité ou la distance peuvent être utilisées.
6.0.1 Définition
Nous appelons similarité ou dissimilarité
toute application à valeurs numériques qui permet de mesurer le
lien entre les individus d'un même ensemble. Pour une
similarité le lien entre deux individus sera d'autant plus fort que sa
valeur est grande. Pour une dissimilarité le lien sera d'autant plus
fort que sa valeur dissimilarité est petite
6.0.2 Indice de dissimilarité
Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de dissimilarité (ou dissimilarité), s'il
vérifie les propriétés suivantes :
1. (propriété de symétrie)
2. (propriété de positivé)
6.1 Distance
Un opérateur de ressemblance défini sur l'ensemble d'individus est dit distance, s'il vérifie en plus des deux
propriétés 1 et 2 les propriétés d'identité
et d'inégalité triangulaire suivantes :
3. (propriété de d'identité)
4. (inégalité triangulaire)
6.2 Indice de similarité
Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de similarité (ou similarité), s'il
vérifie en plus de la propriété de symétrie (1) les
deux propriétés suivantes :
5. (propriété de positivité)
6. (propriété de maximisation).
Il convient de noter ici que le passage de l'indice de
similarité s à la notion duale d'indice de dissimilarité
(que nous noterons d), est trivial. Etant donné smax la
similarité d'un individu avec lui-même (smax= 1 dans le cas d'une
similarité normalisée), il suffit de poser :
6.3 Mesure de ressemblance entre individus à
descriptions classiques
Le processus de classification vise à structurer les
données contenues dans X={X1, X2, ...,
Xn} en fonction de leurs ressemblances, sous forme d'un ensemble de
classes à la fois homogènes et contrastées.
L'ensemble d'individu X est décrit
généralement sur un ensemble de m variables Y= {Y1,
Y2,..., Ym} définies chacune par :
Où Äh est le domaine d'arrivée
de la variable Yh.
En conséquence, les données de classification
sont décrites dans un tableau Individus-variables où chaque case
du tableau contient la description d'un individu sur une des m variables. Ce
tableau Individus-Variables est en général un tableau
homogène qui peut être de type quantitatif (cas où toutes
les variables sont quantitatives) ou qualitatif (cas où toutes les
variables sont qualitatives).
6.4 Tableau de données numériques
(continues ou discrètes)
La distance la plus utilisée pour les données de
type quantitatives continues ou discrètes est la distance de Minkowski
d'ordre á définie dans Rm par :
Où , si :
Ø est la distance de city-block ou Manhattan.
Ø est la distance Euclidienne classique.
Avant de continuer nous allons faire une présentation
des méthodes statistiques que nous avons retenues. Vu que L'ACM est
souvent définie comme une analyse factorielle sur un tableau disjonctif
complet et l'analyse factorielle est à son tour définie comme une
double analyse en composantes principales. Nous allons faire un petit rappel
rapide sur ces méthodes factorielles en commençant par l'analyse
en composante principal et nous allons chuter avec la l'ACM.
7. Analyse en composante principale
Le but de l'A.C.P est de transformer un jeu de variables
corrélées en des variables non corrélées, qui, dans
un contexte idéal (Gaussien) pourraient être
interprétées comme des facteurs indépendants sous-jacents
au phénomène. C'est pourquoi ces quantités orthogonales
seront appelées «facteurs», bien que cette
interprétation ne soit pas toujours parfaitement adéquate.
7.1 Principes de l'ACP
L'Analyse en Composante Principale (ACP) fait partie des
analyses descriptives multivariées. Le but de cette analyse est de
résumer le maximum d'informations possibles en perdant le moins
possible pour :
Ø Faciliter l'interprétation d'un grand nombre
de données initiales,
Ø Donner plus de sens aux données
réduites
L'ACP permet donc de réduire des tableaux de grandes
tailles en un petit nombre de variables (2 ou 3 généralement)
tout en conservant un maximum d'information. Les variables de départ
sont dites « métriques ». L'idée de l'ACP est
de déterminer un nouveau repère de associé de manière naturelle à la structure du
nuage considéré, de façon à pouvoir l'y examiner
plus commodément.
Pour s'affranchir des effets d'échelle dus à
l'hétérogénéité éventuelle des
variables, ces dernières sont en général
normalisées, c'est à dire que chaque colonne est divisée
par son écart-type; toutes sont dès lors exprimées dans la
même échelle standard.
D'autre part, l'origine est placée au centre de
gravité du nuage. C'est le nuage ainsi transformé qui est en fait
considéré; l'utilisateur n'a cependant pas à se
préoccuper de ces transformations préalables, sauf demande
contraire, elles sont exécutées automatiquement par les logiciels
d'ACP.
7.2 Directions principales - plans principaux et
Représentation des individus
Le nuage présente généralement des
directions d'allongement privilégiées, celle d'allongement
maximal D1 est dite première direction principale (axe
principal) (du nuage), la suivante D2 parmi toutes celles
perpendiculaires à D1 est la seconde direction principale, la suivante
D3 parmi toutes celles perpendiculaires à D1 et
D2 est la troisième direction principale, etc.
On choisit un vecteur unitaire sur chaque direction (le choix du sens est libre et décidé arbitrairement par
le logiciel utilisé) et on obtient une base orthonormée de , c'est la base principale du nuage.
On appelle plan principal i j le plan vectoriel
déterminé par les directions et . En général, le nuage est approximativement situé
dans un sous-espace de de faible dimension, engendré par les premières directions
principales; l'examen de ses projections sur quelques plans principaux bien
choisis (12, 13, etc.) permet alors de découvrir ses
particularités et de décrire sa structure assez
précisément.
a) Composantes principales - représentation des
variables
De même que les variables initiales sont
associées aux axes canoniques de, de nouvelles variables appelées composantes principales sont
associées aux axes principaux: la composante principale est le vecteur de qui donne les coordonnées des individus sur l'axe principal muni du vecteur unitaire .
Les composantes principales sont naturellement des
combinaisons linéaires des variables initiales, on montre qu'elles sont
centrées et non corrélées.
L'examen des corrélations entre les variables initiales
et les composantes principales permet d'interpréter ces dernières
et les axes principaux correspondants.
Inertie
Un individu i du nuage (supposé muni des poids
uniformes = 1) a une inertie I(i) :
I(i) = O = O
Si est la projection de i sur l'axe principal , l'inertie de i suivant cet axe est: (i) = O
L'inertie de i se décompose en la somme de ses inerties
suivant les différents axes principaux (perpendiculaires):
I(i)=
L'inertie totale suivant l'axe , est:
Et l'inertie totale du nuage est :
I= =
Les directions principales d'allongement du nuage sont en fait
les directions perpendiculaires successives d'inertie maximum du nuage.
Taux d'inertie
Il s'agit des inerties successives etc. suivant les axes principaux etc. du nuage. Leurs valeurs relatives traduisent l'importance de
l'allongement suivant ces directions successives. On édite les taux
relatifs etc., ainsi que les taux relatifs cumulés
Lorsque ces derniers approchent 100%, on considère que
l'on a assez d'axes principaux pour représenter convenablement le
nuage.
Contributions des axes aux individus (COR)
Il s'agit des ratios tels que:
COR(k, i) = qui mesure la qualité de la représentation de l'individu
i sur l'axe principal
On a:
Il n'est licite de commenter la position de l'individu i sur
le plan principal kh que si le ratio:
n'est pas trop faible.
La considération de ces ratios, qui sont des cosinus
carrés, n'est pertinente que pour les points pas trop proches de
l'origine. Pour ceux-ci, c'est plus leur position, centrale, que la direction
dans laquelle se manifeste leur faible éloignement, qui les
caractérise.
Contributions des individus aux axes (CTR)
Il s'agit des ratios tels que :
CTR(i, k) = qui mesure la part prise par l'individu i dans la détermination
de l'axe principal
On a:
Contributions des axes aux variables (COR)
Il s'agit des coefficients de corrélation au
carré tels que:
COR(k, j) = entre la variable initiale et la composante principale . Elles permettent comme on l'a vu de dégager la signification
des axes.
On a :
Ces quantités sont les carrés de celles
figurées dans le cercle des corrélations utilisé pour
représenter graphiquement les variables.
Contributions des variables aux axes (CTR)
Il s'agit des ratios tels que:
CTR(j, k) = corr2(ck, x.j) / S corr2(ck, x.i)
On a: = 1
L'observation des premiers plans principaux ne permet aucune
conclusion, et peut même être source de contresens, si elle ne
s'accompagne pas de l'examen des quantités précédentes. Il
faut donc toujours les faire éditer par le logiciel utilisé et
les consulter.
7.3 Analyse des résultats d'une ACP
Analyser les résultats d'une ACP, c'est répondre
à trois questions :
1. Les données sont-elles factorisables ?
2. Combien de facteurs retenir ?
3. Comment interpréter les résultats ?
8. Analyse factorielle des correspondances
multiples
L'analyse des correspondances multiples (ACM) est une
technique de description de données qualitatives : on
considère ici n individus décrits par p variables X1, X2, .... Xp
à m1, m2,...,mp catégories. Cette méthode est
particulièrement bien adaptée à l'exploration
d'enquête où les questions sont à réponses
multiples.
Sur le plan formel il s'agit d'une application de l'analyse
des correspondances au tableau disjonctif complet des m1 + m2 +...+mp
indicatrices des catégories. Cette méthode peut être
considérée comme l'équivalent de l'analyse en composantes
principales pour les données qualitatives.
Codage des individus
Les données peuvent être rassemblées dans
un tableau de type Individus × variables. Les lignes représentent
les individus, les colonnes représentent les variables : à
l'intersection de la ligne i et de la colonne j, se trouve la valeur
xij de l'individu i pour la variable j. Naturellement, les valeurs
xij sont des codifications qui ne possèdent pas de
propriétés numériques. Si la variable j est la couleur des
yeux des individus, cette couleur peut être codifiée ainsi :
bleu = 1, blanc = 2. Il est clair que la moyenne entre bleu et blanc n'a pas de
sens numériques.
Une autre façon de présenter ces mêmes
données est de construire un tableau Disjonctif Complet (voir tableau
2.1). Dans ce tableau, les lignes représentent les individus et les
colonnes représentent les modalités des variables : à
l'intersection de la ligne i et de la colonne j on trouve xij qui
vaut 1 ou 0 selon que l'individu i possède la modalité j ou non.
L'origine de la terminologie Tableau Disjonctif Complet est la suivante :
l'ensemble des valeurs xij d'un même individu, pour les
modalités d'une même variable, comporte la valeur 1 une fois
(complet) et une fois seulement (disjonctif).
Tableau 2.1 : tableau disjonctif
complet
Il existe d'autres formes de représentation des
données : l'hyper tableau de contingence et le tableau de Burt
(tableau 2.2). Le tableau de Burt est construit en multipliant le tableau
disjonctif complet avec sa transposé T'T.
On appelle Analyse Factorielle des Correspondances Multiples
(ACM) des variables (X1, ..., Xp) relativement à l'échantillon
considéré l'AFC réalisée soit sur la matrice X
appelée tableau disjonctif complet, soit sur la matrice de Burt B (A.
Baccini et P. Besse) ( Springer, 359-368 (1996)
Tableau 2.2 : tableau de Burt
Analyse factorielle de correspondances
appliquée au Tableau Disjonctif Complet
L'analyse factorielle de correspondances (AFC) est
conçue pour traiter des tableaux de fréquences issues d'un
tableau de contingence. En revanche, si on applique les principes de l'AFC et
la métrique de khi-deux à un TDC, on aboutira aux mêmes
axes factoriels (voir Gilbert SAPORTA pour la démonstration,
Probabilité, Analyse de données et statistique 2006). Mais, dans
ce cas, ces calculs doivent être réinterprétés en
fonction de la nature particulière du tableau. Ces calculs, munis de
cette nouvelle interprétation, constituent une méthode à
part entière ; d'où l'introduction du vocale Analyse des
correspondances multiples. L'AFC d'un TDC n'est qu'une façon pratique de
réaliser les calculs, d'ailleurs incomplète puisqu'elle ignore la
notion de variables et donc ne fournit aucun résultat les concernant.
Cela étant nous suivrons cette démarche historique et commode
pour présenter l'Analyse des correspondances multiples.
Nuage des individus
Un individu est représenté par les
modalités qu'il possède. Pour calculer la distance entre deux
individus on utilise la métrique de khi-deux. Plus
précisément, la distance entre les individus i et i'
s'écrit :
Les coordonnées des points lignes (les composantes
principales) s'obtiennent en diagonalisant le produit suivant :
Avec T : le tableau disjonctif complet, D-1 la
transposée matrice des effectifs marginaux des modalités et K le
nombre des variables. Les vecteurs propres du produit seront les composantes
principales des individus.
Nuage des modalités
La modalité k est représentée par le
profil de la colonne k. les nombres du TDC ne peuvent prendre que les valeurs 0
ou 1, le profil de la colonne k ne contient à son tour que deux valeurs
possibles : 0 ou 1. La distance entre deux modalités k et h est
définie par :
Les coordonnées des variables sont les vecteurs propres
du produit suivant
Remarque : dans ce travail nous nous sommes
intéressés directement aux composantes principales pour obtenir
directement les coordonnées factorielles des profils lignes et
colonnes. Les ouvrages d'analyse des données donnent aussi les formules
pour trouver les facteurs. En analysant les facteurs et les composantes
principales on constate une parfaite symétrie entre les résultats
de deux profils. Cette symétrie conduit alors à des
représentations simultanées des deux profils sur un même
plan.
Relation des transitions
Les coordonnées des profils lignes et les
coordonnées des profils colonnes sont reliées par des formules
simples dont le premier intérêt est d'éviter de
réaliser deux diagonalisations. On diagonalisera la matrice la plus
petite.
Avec ? ?? la á nième
coordonnée des variables, Fá la á
nième coordonnée des individus et ëá
nième la á nième valeur propre. Il faut noter
que les deux diagonalisations donnent les mêmes valeurs propres.
Pratique de L'analyse factorielle des correspondances
multiples
L'interprétation des résultats d'une analyse
factorielle des correspondances multiples se fait comme une analyse factorielle
des correspondances et comme en analyse en composantes principales. On prendra
garde ici au fait que les pourcentages d'inertie n'ont qu'un
intérêt restreint. La sélection et l'interprétation
des axes factorielles se fait essentiellement à l'aide des contributions
des variables actives et des valeurs-tests associées aux variables
supplémentaires.
9. Classification Automatique
L'objectif de la classification est le suivant : on dispose de
données non étiquetées. On souhaite les regrouper par
données ressemblantes. Cette manière de définir
intuitivement l'objectif de la classification cache la difficulté de
formaliser la notion de ressemblance entre deux données. Au-delà
des algorithmes existant, une bonne partie de l'art à acquérir
consiste ici à imaginer cette formalisation. Ainsi, soit un ensemble X
de N données décrites chacune par leurs P attributs. La
classification consiste à créer une partition ou une
décomposition de cet ensemble en groupes telle que :
Critère 1 : les données appartenant au
même groupe se ressemblent ;
Critère 2 : les données appartenant
à deux groupes différents soient peu ressemblantes.
Hartiga (Référence ???) est un des premiers
à discuter différents choix possibles du nombre de classes. Au
fil des années, plusieurs statistiques ont été
proposées afin de décider le nombre de classes à choisir
et peuvent être utilisées comme règle d'arrêt dans le
cadre des méthodes hiérarchiques. Elles utilisent
généralement les sommes des carrés inter - groupes, ainsi
que les sommes des carrés intra - groupes, notées respectivement
par B et W pour une partition P en k
classes {c1....Ck}:
Où , j = 1, ..., k, est le centre de gravité de la classe Cj
et g le centre de gravité de l'ensemble des objets. nj
représente le poids de la classe Cj
Où , j = 1, ..., k, est le centre de gravité de la classe Cj
On peut également exprimer ces mesures à l'aide
des notions d'inertie d'un groupe.
Soit P, une partition en k classe {C1... Ck} alors
on obtient :
Où , j = 1, ..., k, est le centre de gravité de l'ensemble des
points de Cj avec g = avec
#Cj représentant le nombre de points dans Cj.
D'après le théorème de Koeng - Huygens, l'inertie totale T
ne dépend pas de la partition choisie et est exprimée par T = W +
B et vaut T= (xi, g). L'inertie intra- classe W est un critère
classique d'évaluation d'une partition, mesurant
l'homogénéité des classes de la partition. Par
conséquent, il suffit de trouver une partition qui minimise
W(Pk). De manière équivalente, on cherchera à
maximise B(Pk) l'inertie interclasse qui mesure la séparation
des classes. Dans ce cas, une partition vérifie les principes de
cohésion interne et d'isolation externe
10. Construction de l'ICP
Usuellement, l'analyse de la pauvreté
multidimensionnelle est fondée sur une méthodologie de
construction d'un Indice Composite de Pauvreté (ICP). Dans le chapitre
précédent nous avons présenté les trois approches
de construction d'un tel indicateur. Dans le cadre de notre étude nous
avons portés notre choix sur l'approche d'inertie les méthodes
factorielles.
La construction de notre indicateur se fera en trois
étapes. Nous réaliserons une première ACM dite
exploratoire sur les variables qui seront choisies. Cette ACM aura pour but de
faciliter la sélection des variables qui sont en mesure de faire une
discrimination des individus selon le caractère étudié. Le
critère utilisé pour sectionner les variables est la consistance
ordinale sur le premier axe (COPA). Et enfin nous réaliserons l'ACP sur
les dix premiers facteurs de la dernière ACM.
La COPA consiste dans ce contexte, pour tout indicateur
partiel (ou variable), à vérifier si sa structure ordinale en
terme de bien être est respectée par la structure
ordinale des coordonnées de ses modalités sur le premier axe
factoriel (ici l'ICP). Autrement dit, une variable vérifie la COPA si
l'ordre de sa structure ordinale respecte l'ordre des scores factoriels de ses
modalités, selon l'ICP (Touhami et Fouzia) (Novembre 7-9 2009).
Certaines variables peuvent retrouver la COPA suite à
un regroupement de leurs modalités (avec le risque de perdre
une partie de l'information). Dans notre analyse nous n'avons pas
appliqué la COPA parce qu'il sembre forfaitaire, nous avons effectuer
une Analyse en Composantes Principales sur les axes de l'ACM et Le premier
facteur de l'ACP sera considéré comme indicateur de
pauvreté.
Justification du choix de l'ACM pour la construction
de l'ICP
La logique de l'ACM est la suivante : une modalité
a un poids d'autant plus grand qu'elle est plus rare. Ainsi, dit, l'ACM
attribue des poids plus importants à des modalités rares. Cette
logique permet une meilleure identification des populations pauvres.
10.1 La détermination du seuil de
pauvreté multidimensionnelle
Avec l'indicateur composite de pauvreté Ci
calculé il est possible de calculer les indices de pauvreté
multidimensionnelle une fois qu'il a été déterminé
un seuil de pauvreté multidimensionnelle. Le seuil permet de constituer
de classe homogène (selon le niveau de bien être) de la population
analysé.
Pour construire un seuil de multidimensionnelle, nous allons
appliquer la classification automatique sur les axes de notre ACP obtenus en
vue de scinder la population en deux classes homogènes des pauvres et
non pauvres pour en déduire le seuil multidimensionnel.
Le seuil peut être déduit en utilisant la formule
suivante
Seuil ICP= (max Cip+min
Cri)/2
Ou :
Max Cip est la valeur maximale de l'ICP
dans la classe pauvre
Min Cip est la valeur minimale de l'ICP
dans la classe non pauvre
Pour chaque ménage de la population Kinoise une valeur
de l'ICP a été déduite. Cette valeur peut être
négative c'est-à-dire le cas des ménages les plus pauvres
selon cette approche). Sur ce nous construisons un nouvel ICP2 en faisant une
simple translation de l'ICP de base en ajoutant la valeur la plus faible
négative prise en valeur absolue.
PRESENTATION DES DONNEES ET CALCULS DES INDICES
MULTIDIMENSIONNELS
Présentation des dimensions et des variables
utilisées
Pour ce travail, nous avons extrait le sous fichier de
l'enquête 123 relatif à la ville de Kinshasa. En fait, deux sous
fichiers sont consultés : le premier contient les informations
liées aux dépenses sur les personnes, Le second est relatif aux
ménages et contient les différents aspects en liaison directe
avec les conditions générales d'habitat des ménages en
particulier. Pour répondre aux objectifs de ce travail, et comme nous ne
considérons que le niveau ménage, nous avons exploité les
données issues du deuxième sous fichier.
Les principales dimensions que nous retenons pour approcher le
bien-être des ménages au niveau de notre approche sont : certaines
caractéristiques de l'habitat, quelques éléments de base
du logement, certains éléments de confort à la disposition
du ménage. Chacune des dimensions retenues regroupe en fait un ensemble
d'indicateurs. La justification du choix des différentes dimensions est
donnée à l'occasion de leur description. Les chiffres et
résultats présentés ci-dessous découlent de notre
exploitation directe du sous fichier de 123 au niveau de Kinshasa.
· L'habitat
L'explosion démographique au niveau de la ville de
Kinshasa en général, a rendu le coût du logement le plus
élevés en République Démocratique du Congo. Ce
phénomène a rendu l'accès à un habitat salubre et
de qualité moyenne difficile pour les ménages les plus
démunis. L'habitat est ainsi un vu comme facteur net de discrimination
et doit de ce fait, être considéré parmi les dimensions de
pauvreté ou de bien-être. Plusieurs indicateurs sont en
général définis pour intégrer la dimension habitat
dans une approche non monétaire de la pauvreté :
Ø Type Habitat,
Ø Matériaux des Murs ;
Ø Nature de sol ;
Ø Nature de toiture ;
Ø Statut d'occupation
D'après les données d'enquête 123 de 2005,
la structure de l'habitat dans la ville de Kinshasa se présente comme
suit :
1. Type d'habitat : Caractérise par une
prédominance des maisons de concession habitées près de
78,38% des ménages de la ville de Kinshasa. 5 % habitent des maisons en
pièces sans dépendances, 4,69% habitent des villas et 4% habitent
des appartements, 6% des Kinois habitent dans des maisons en bandes et 2%
habitent dans les studios. Ces derniers seraient des ménages à
considérer comme les plus pauvres selon ce critère.
2. Matériaux des Murs : Caractérisé
par une dominance des maisons construites avec du bloc ciment, 2,17% sont en
béton armés, 6,46% de maisons kinoises sont en briques cuites,
5,4% en briques adobes, 1% en mur pisé, 2% en bois ou planches et 0,1%
sont faites à l'aide des végétaux ou nattes. Le 1% sont
construites selon l'enquête par les matériaux non
prévues ;
3. Nature de sol : Caractérisée par une
forte apparition de plus de 76,7% du sol en planche/ciment, le sol en carrelage
occupe 1,24% dans la ville de Kinshasa, 10,54% sont en terre battue et 0,13%
sont en bois ;
4. Nature de toiture : elle est
caractérisée par 78,11% des toitures avec du tôles
galvanisées, 8,7% avec des eternits, 1,91% en tuiles, 7,79% sont faites
avec des tôles de récupération, 0,45% en Ardoise, 2,46%
à l'aide des dalles en béton et 0,26% avec la chaume ;
5. Statut d'occupation : cet indicateur est dominé
par plus de 47,75% des résidents propriétaires, 35 ;8% sont
des locataires, 3,03% sont logés par l'employeur, 2,5% logés
gratuitement par un tiers, 0,3% sont logés dans les concessions
familiales et près de 10,44% sont dans les locations ventes ;
Assainissement
Un certain niveau ou une certaine qualité de vie et
l'assurance d'une sécurité sanitaire sont
généralement conditionnés par un cadre de vie assaini et
amélioré. Ce cadre étant l'assainissement qui est
étroitement lié à l'habitat. C'est en quelque sorte la
partie infrastructure de ce dernier. Les indicateurs retenus à ce niveau
dans le cadre de ce travail sont :
a. Approvisionnement en eau
b. Aisance ;
c. Evacuation ordures
En rapport avec les données de 123, nous constatons des
statistiques suivantes :
1. Approvisionnement en eau : cette variable est
caractérisée par une prédominance d'environ 41,33% des
foyers qui ont des robinets extérieurs, 11,99% des ménages ont
des robinets intérieurs, 2,13% des ménages font recours au forage
pour s'approvisionner en eau, 31,37% utilisent les robinets d'un autre
ménage, 3,03% des ménages kinois ont des puits
protégés et 1,4% ont des puits non protégés,3,09%
utilisent des sources aménagées, 4,28% utilisent des sources non
aménagées, 0,18% des kinois selon l'échantillon utilisent
les cours d'eau et seulement 0,09% font usage de borne fontaines.
2. Aisance : cet indicateur qui est lié à
l'habitat et qui le montre le minimum de condition sanitaire nous
révèle qu'il ya plus de 42,13% des ménages kinois
utilisent un trou dans la parcelle comme toilette, 10,24% des ménages
ont des toilettes intérieures privées chasse eau, 13,90% en ont
en externe privée chasse eau, 17,35% des foyers utilisent des toilettes
communes des ménages, 10,59% ont des latrines aménagées
privées et 4,87% ont des latrines aménagées publiques et
nous avons plus de 0,79% des ménages kinois qui manquent des
toilettes.
3. Evacuation ordures : L'utilisation
inconsidérée des ressources et l'élimination des
déchets dans l'environnement contribuent à la dégradation
du milieu. Cette dégradation a des implications sur la santé
humaine, l'économie, la production alimentaire, le tourisme, la flore
et la faune. Nous ne verrons notre qualité de vie s'améliorer que
si nous donnons à l'environnement, que tous nous partageons, les soins
qui lui sont dû, c'est-à-dire en exploitant les ressources de
façon judicieuse et en prévenant le gaspillage inutile. Nous
remarquons concernant l'évacuation des déchets qu'au moins 20,63%
des ménages font des dépotoirs sauvages de leurs déchets,
22,71% utilisent l'enfouissement, 16,73% ont des services publics ou
privés, 13,18% des ménages font l'incinération de leurs
déchets, 8,32% des ménages utilisent des voies publiques pour
évacuer leurs déchets, 6,44% font usage des cours d'eau et 9,14%
les utilisent comme fumier.
Energie
Que ce soit sur le plan environnemental ou sur le plan
économique, les économies d'énergie électrique sont
une priorité pour l'homme moderne, car il en sera à terme, le
premier bénéficiaire. Elle consiste à fournir le
même résultat dans les domaines du chauffage, de
l'éclairage, de l'électro ménager.
Dans nos logements, nous consommons une part importante de
l'énergie électrique produite, pour nous chauffer, nous laver,
nous nourrir, nous distraire, nous éclairer, etc. Mais cette
énergie coûte cher et actuellement l'essentiel de sa production
n'est pas sans effet sur notre environnement. Les économies
d'énergie électrique dans l'habitat, permettent
d'économiser les énergies non renouvelables. Economiser
l'électricité, n'est pas un choix, mais bien une urgente
nécessité. Les indicateurs retenus dans cette dimension pour
évaluer le degré de pauvreté sont les suivants :
a. Eclairage
b. Energie cuisine
Par rapport aux données de cette enquête, nous
observons des statistiques suivantes :
1. Eclairage : pour cet indicateur les ménages
kinois qui utilisent l'électricité comme source
d'éclairage représente 65,03%, 32,16% utilisent du pétrole
plus la lampe tempête, 1 ,3% utilisent la lampe Coleman, 0,36% font
recours aux groupes électrogènes.
2. Energie cuisine : plus de 44,64% des ménages
interrogés utilisent de l'électricité pour leur cuisine,
1,82% font recours au gaz, 39,55% utilisent du pétrole et environ 0,89%
font usage de feu de bois
Education
L'influence que peut exercer l'éducation des hommes sur
leur productivité et sur la croissance économique avait
été soulignée par les économistes classiques, et
notamment par Adam Smith. Aujourd'hui, le rôle de l'éducation est
glorifié par les institutions internationales. C'est d'ailleurs, le
deuxième point des objectifs du millénaire pour le
développement (OMD). L'éducation constitue donc l'une des
dimensions les plus importantes de l'analyse de la pauvreté. Elle peut
cependant être appréhendée par plusieurs indicateurs,
chacun caractérisant un aspect particulier de la mobilisation de cet
actif. Dans le cadre de cette étude sur la pauvreté, le variable
retenue pour caractériser l'éducation est le diplôme le
plus élevé du chef de ménage interrogé ;
21,21% ont des certificats de l'école primaire, 7,34% ont des brevets du
secondaire, 3,78% des chefs de ménages sont des d4, 11,38% sont des
diplômés d'Etat, 3,61% ont un diplôme de graduat, 1,65% des
ménages interrogés sont des licenciés et seulement 0,086%
ont une thèse
Calculs des Indices Multidimensionnels
Notions
Pour conduire une ACM, on suppose que l'on dispose de N
individus (ménages de la ville de Kinshasa dans notre cas)
décrits par p variables qualitatives notées X1, X2, ......, Xp.
Si les variables ne sont pas qualitatives à la base (continues ou
discrètes avec plusieurs modalités) elles sont alors «
recodifiées » de façon appropriée en des variables
catégorielles (classes) avant l'analyse. On désignera alors par
X le tableau des données obtenues à partir des observations de
ces p variables sur l'ensemble des N individus. C'est donc une matrice de N
lignes et P colonnes. Le tableau (ou la matrice) X est donc la base de
données de l'ACM à conduire.
Soit Q l'ensemble des P variables considérées
(Card Q = P). Pour chacune des P variables de l'ensemble Q (p =
1, ..., P) on considère l'ensemble Jp de toutes les modalités
possibles associées à la variable (qualitative) p. On note
ensuite par J l'ensemble union des modalités de toutes les variables.
À partir du tableau des données de base X, on définit un
nouveau tableau avec des caractéristiques particulières. Ainsi,
pour tout individu
i?N (i = 1, ..., N) et pour toute variable p?P (p = 1, ...,
P) on pose : Kj = 1 si i a la modalité j de la variable p, et Kj = 0
sinon. Le tableau qui découle de ce processus, de terme
général Kij (i ?N, j ?Jp) est appelé Tableau Disjonctif
Complet (TDC) associé au tableau X. sur ce tableau que nous que nous
réaliserons notre analyse.
Calculs
On sait que la contribution de la modalité j est autant
plus grande que sa fréquence d'apparition est faible. Sur le plan
pratique, ceci implique que les modalités à faible effectifs
risquent d'avoir trop d'importance dans la définition des axes
factoriels. Ainsi nous avons effectué une première ACM en
analysant les résultats, les modalités à faible
fréquence ont été éliminées. En plus les
variables retenues ont un pouvoir discriminant important, car le pouvoir
discriminant montrer la dispersion des modalités dans une dimension ou
dans un axe
L'Analyse Multiples des Correspondances effectuée
donne les axes factoriels et les projections de chaque variable sur les axes
factoriels. Les résultats de cette analyse nous informent sur les
valeurs propres, le taux d'inertie, les corrélations entre les variables
initiales et les axes, la représentation des modalités sur les
axes. Etc.....
Les valeurs propres permettent de rendre compte de
l'importance relative de chaque dimension dans la part d'information
statistique pris en compte par la solution.
Le taux d'inertie est le rapport entre la
valeur propre avec la somme totale des valeurs propres, cette quantité
constitue une mesure de la part de variabilité globale prise en compte
par cet axe ou la part d'information contenue dans cet axe. Le tableau suivant
donne les 5 premiers axes factoriels, les valeurs propres correspondances ainsi
que le taux d'inertie lié à une valeur propre.
Axes
|
Le coef. alpha de Cronbach
|
Valeur Propre
|
Taux d'inertie
|
1
|
,840
|
0,33
|
,362
|
2
|
,706
|
0,217
|
,236
|
3
|
,477
|
0,14
|
,148
|
4
|
,439
|
0,13
|
,140
|
5
|
,373
|
0,11
|
,127
|
Analyse et Interprétation des
résultats
Le coefficient d'Alpha de Cronbach
Le coefficient alpha de Cronbach, parfois appelé
simplement coefficient, est une
statistique
utilisée notamment en
psychométrie
pour mesurer la cohérence interne (ou la fiabilité) des questions
posées lors d'un test (les réponses aux questions portant sur le
même sujet devant être corrélées). Sa valeur
s'établit entre 0 et 1, étant considérée comme
"acceptable" à partir de 0,7. Il permet donc l'estimation de la
fidélité
du score à un
test.
Présenté par
Lee Cronbach en 1951
Dans le cadre de notre travail, le coefficient alpha de
Cronbach sera utilisé comme indicateur de nos échelles de mesure.
Il s'agit en effet d'une méthode éprouvée et
utilisée dans la plupart des travaux de recherche actuels (Evrard et
al., 1997) malgré ses limites (Peterson, 1994 ; Thiétart,
1999) et l'existence d'indices concurrents ( ex : rhô de
Joreskog ; Joreskog, 1971 ; Osburn, 2000). Ce coefficient est une
estimation de la variance du score total de l'échelle due à tous
les facteurs communs propres aux items de l'échelle testée. Il
permet de vérifier si les énoncés d'une échelle de
mesure ou d'un indicateur partagent des notions communes, c'est à dire
si chaque item présente une cohérence avec l'ensemble des autres
énoncés de l'échelle. En pratique, l'alpha de Cronbach est
un nombre inférieur à 1 qui doit être le plus
élevé possible. Ainsi, plus alpha se rapproche de 1, plus les
items ou les indicateurs sont corrélés entre eux et plus
l'échelle a une cohérence interne. Si le score d'alpha est
satisfaisant, alors les items ou les indicateurs sont cohérents entre
eux et peuvent être additionnés pour former un score global
puisqu'ils sont admis à mesurer un même phénomène. .
Donc selon le tableau ci-dessus, seuls les deux premiers axes nous donnent un
coefficient supérieur à 0,7, c'est-à-dire
une cohérence interne des modalités d'un indicateur qui peuvent
être agrégés pour en former un seul.
Les deux axes nous donnent une quantité d'information
d'environ 60%, et le premier axe contient 36,2% d'informatique cet axe sera
considéré comme notre Indicateur Composite de la
pauvreté(ICP)
Mesure de Discrimination
|
Dimension
|
Variables
|
1
|
2
|
Type habitat
|
,484
|
,241
|
Matériaux des murs
|
,288
|
,299
|
Nature de sol
|
,407
|
,391
|
Nature de toiture
|
,414
|
,248
|
Statut d'occupation
|
,282
|
,224
|
Energie cuisine
|
,480
|
,258
|
Eclairage
|
,363
|
,140
|
Approvisionnement en eau
|
,621
|
,463
|
Aisance
|
,656
|
,430
|
Evacuation ordures
|
,252
|
,120
|
Situation matrimoniale
|
,007
|
,002
|
Diplôme le plus élève obtenu
|
,086
|
,017
|
|
|
|
Le tableau suivant donne les mesures de discriminations des
indicateurs sur les axes, nous remarquons que la variable Aisance discrimine le
mieux les ménages sur le premier axe , suivi de l'approvisionnement en
Eau et le type d'habitat, cela confirme même les statistiques que nous
avons fait au début, l a situation matrimoniale et le niveau du
diplôme n'ont pas un grand pouvoir discriminatif. D'une façon
générale, les indicateurs considérés ont un pouvoir
discriminatif important sur le premier axe que dans les autres axes.
Ainsi, les deux dimensions retenues permettent de prendre en
compte 60% du taux d'inertie totale à travers une représentation
graphique plane interprétable en termes de distances entre observations,
ce taux est utilisé pour exprimer ou apprécier la qualité
de la représentation des modalités ou des individus sur le plan
1X2.
Projections des modalités sur le plan 1x2
Nous remarquons une situation de pauvreté dans le
troisième et deuxième quadrant, une situation de pauvreté
moyenne dans le premier quadrant et de non pauvreté dans le
quatrième. Cela montre que la première dimension explique en
quelque sorte le bien-être. plus une modalité a une valeur
très élevée plus elle exprime une situation de non
pauvreté. Les modalités se retrouvant concentrées au
centre posent un problème de codification effectué et le poids
par rapports aux effectifs n'est pas équitable à chaque
modalité
Recherche du seuil de la pauvreté
multidimensionnelle
Pour avoir le seuil multidimensionnel, nous appliquons la
technique de classification automatique des centres mobiles sur notre ICP et
également la régression linéaire simple en vue de
segmenter ou de scinder notre échantillon des ménages en deux
groupes homogènes, voici le résultat de l'algorithme
exécuté sous SPSS
|
|
Effectif
|
Groupe
|
1
|
2306
|
2
|
10405
|
Total individus
|
12711
|
Données Manquantes
|
,000
|
Calcul du seuil multidimensionnel
Le seuil sera déduit à l'aide de la formule
décrite ci-dessus, après calcul notre seuil trouvé a une
valeur de
3,51%. Une fois ce seuil est trouvé, nous pouvons
maintenant calculer les indices de pauvreté en se servant de la formule
de FGT
Où, N est le nombre de ménages dans l'espace
géographique considéré, z le seuil de pauvreté
multidimensionnelle associé sur l'axe ICP2 et á ?0 est un
coefficient d'aversion à la pauvreté multidimensionnelle pouvant
prendre l'une des valeurs 0, 1 ou 2 et q le nombre de ménages ayant un
ICP2 inférieur à z si á=0 on aura FGT0 ou P0 (la part de
la population dont la consommation est en dessous de la ligne de
pauvreté), á=1 on aura FGT1 (indice de profondeur de la
pauvreté) et á=2 P2 (mesure la sévérité de
la pauvreté).
D'autres indices tels que la sévérité et
la profondeur peuvent être calculé, et une décomposition
spatiale par commune de la pauvreté
CONCLUSION ET
RECOMMANDATION
Dans le cadre de cette étude, nous avons
élaboré analyse de la pauvreté multidimensionnelle non
monétaire de la ville de Kinshasa.
Comme nos analyses les indiquent, Comme le montrent d'autres
études du même type mais avec des méthodes
différentes, nos résultats confirment que la pauvreté,
mesurée de façon autre que monétaire, semble beaucoup plus
intense et étendue dans cette ville. Elle toucherait plus de
ménages et de personnes que le laisserait entendre une approche
monétaire basée sur la dépense ou la consommation par
exemple.
Sur la base des résultats obtenus, nous montrons
l'importance de l'approche multidimensionnelle de la pauvreté dans la
prise en comptes de plusieurs indicateurs du bien être. Basée sur
la seule approche monétaire, toute politique de lutte contre la
pauvreté risquerait de ne pas être efficace, par exemple la grande
part de consommation des ménages kinois ne dépend pas des
revenus.
L'incidence de la pauvreté multidimensionnelle par
rapport au seuil obtenu en classifiant de manière automatique est
environ de 82%.
Les résultats de la pauvreté issue de l'approche
monétaire sont moins explicatifs que ceux de l'analyse non
monétaire du fait qu'il considère qu'un seul indicateur.
L'analyse multidimensionnelle nous montre que les ménages kinois ne sont
pas affectés par la même forme de pauvreté. Les
ménages sont plus pauvres en 68% par le manque de bon endroit pour
s'approvisionner en eau potable, 64% manque d'électricité
permanente et qui doit recourir soit au gaz, pétrole ou bois pour faire
la cuisine. Dans 54% de ménages pauvres le diplôme le plus
élevé est inferieur au graduat, plus de 62% des ménages
n'ont pas des bonnes toilettes. Notre analyse montre que c'est la variable
Aisance qui discrimine le mieux les ménages. Une situation
d'extrême pauvreté est décrite par les modalités
suivantes : approvisionnement en eau chez les voisins, pétrole
comme source d'énergie, cuisine et éclairage, pas des toilettes
ou un trou dans la parcelle, habitation en bois ou planches, nature du sol en
terre battue.
Nous formulons des recommandations aux organismes luttant
pour la réduction de la pauvreté d'apporter les efforts sur
l'éducation car plus le chef de ménage a un niveau d'étude
élevé, moins le ménage est trop pauvre,
amélioration des sources d'eaux potables et mettre en place une
politique pour l'évacuation des ordures, de revoir l'énergie
électrique car ces secteurs décrivent une forme de
pauvreté dont plus de la moitié de la population kinoise
souffre.
En ce qui concerne les données qui nous ont permis
d'effectuer cette étude, nous recommandons que l'enquête soit
élaborée ou menée dans le cadre des analyses de
pauvreté multidimensionnelle, d'éviter une grande
différence par rapport au nombre de modalités des variables, que
la répartition des enquêteurs soit équilibrée dans
toutes les communes.
Comme perspective, nous souhaitons effectuer une analyse
multidimensionnelle multi indicateurs pour pallier aux failles de l'approche
d'ICP et faire le ciblage des politiques à l'aide du modèle MIMIC
pour identifier des groupes des pauvres et l'influence de chaque indicateur
à la composition de la pauvreté en suite étendre cette
étude sur le plan national.
BIBLIOGRAPHIE
1. AMBAPOUR S: Pauvreté multidimensionnelle au
Congo, Bureau d'application des méthodes Statistique et Informatique.
2. Baccini Aet P. Besse : Exploration statistique,
Institut National des Sciences Appliquées de Toulouse.
3. BOSCO J, Salimata F et Bocar F : Pauvreté
multidimensionnelle au Sénégal, Cahier de recherche PMMA
2005-05.
4. NINGAYE Paul : Le ciblage de la multi pauvreté
par les scores dimensionnels Avec application aux données camerounaises
Mars 2010.
5. DAGNELI P : Méthode Statistique volume 1 et
volume 2 Economica, 1995.
6. Escoffier B et Jerome Pagès : Analyses
factorielles simples multiples, Dunod, 4 éd., 2008.
7. Francis NDOM : construction d'un indicateur de la
qualité de la dépense publique du système camerounais,
mémoire de master.
8. Lachaud J-P: Dépenses des ménages,
développement humain et pauvreté au Burkina Faso :
complément ou substitution ?
9. Lalanne C : Introduction aux statistiques et à
l'utilisation du logiciel R.
10. Moummi A: Analyse de la pauvreté en
République Démocratique du Congo, Working Papers Series N°
112, African Development Bank.
11. Paradis E : R pour débutant.
12. PREUX P: Cours de Fouilles de données,
Université de Lille3.
13. SAPORTA G : Probabilités, Statistiques et
analyse de données, Technip, Paris 2006.
14. Touhami Abdelkhalek et F. Ejjanoui : Approche
Multidimensionnelle de la Pauvreté: Présentation Théorique
et Application Au Cas de la Ville de Marrakech, Institut national de
statistique et d'économie appliquée.
|