FACULTE DES SCIENCES
Département de Mathématiques
et
Informatique
B.P. 190 KINSHASA XI
MESURE ET ANALYSE MULTIVARIEE DE LA PAUVRETE Une
approche par l'analyse en composantes principales Cas de la vile de
Kinshasa
OTSHUDIAKOY OTSHUDI JOHN
Mémoire présenté en vue de
l'obtention de grade de Licencié en Sciences, Groupe
Mathématiques, Option: Math. Appliquées
Directeur: Prof. Dr. MANYA NDJADI
Leonard
Année Académique :
2008-2009
EPIGRAPHIE
«La pauvreté est le plus grand des
maux et le pire de crime»
Georges Bernard
II
DEDICACE
Je dédie la présente oeuvre à
mon père UTSHUDI OM'OKOKO Albert dont je serai reconnaissant toute ma
vie
III
AVANT-PROPOS
Au terme de ce travail, je voudrais adresser mes
très sincères remerciements au Professeur Léonard MANYA
NDJADI, mon directeur de mémoire, pour l'encadrement sans égal
dont j'ai bénéficié de sa part.
Dans cette même analogie, je tiens à
remercier le Professeur Muhindo Guy, sa collaboration a été
très utile et enrichissante.
Je témoigne ma gratitude aux professeurs
MUBENGA PASCAL, MBUYI MUKENDI Eugene pour leurs bons conseils qui m'ont
grandement stimulé pour terminer ces études.
Mes sentiments de gratitudes s'adressent
également à tout le corps professoral et académique du
département de mathématiques et Informatique pour leur
encadrement tant moral qu'intellectuel.
Ma reconnaissance à Maitres MUKENDI KENZO,
ALPHA MAMBU, Me. JP et SERGE KAHUTA pour m'avoir assisté moralement tant
que financièrement.
Je voudrais également témoigner de ma
reconnaissance à mes parents. Que ce travail soit le résultat de
leurs prières.
Mes sincères remerciements à ma
grand-mère EFUTU ainsi qu'à mes oncles, tantes, frères,
soeurs, cousins et cousines.
Un spécial remerciement à l'honorable
SHE OKITUNDU et à mon parrain Dieu donné MULAMBA.
De mon profond du coeur je rends grâce au
très haut, le créateur de l'univers pour tant des bienfaits
envers moi.
IV
INTRODUCTION
Il est globalement accepté que la
pauvreté est l'un des plus grands problèmes auxquels font face
les diverses sociétés du monde actuel. Ses conséquences
diffèrent selon la région du monde que l'on traite, allant de
l'exclusion sociale dans les pays riches jusqu'à la malnutrition et la
mort dans les pays les plus pauvres. Ces problèmes sont des vraies
maladies pour une société, raison pour laquelle tous les
gouvernements qui ont un souci pour le sort des citoyens du pays appartenant
à cette catégorie des personnes ont déclaré leur
intention de lutter contre ce fléau.
Le problème de l'élimination de la
pauvreté est une question pertinente, diverses mesures pour la combattre
ayant été prises avec des résultats différents. Ces
mesures varient selon l'importance donnée par la
société.
Parmi toutes les politiques possibles en
matière de lutte contre la pauvreté, un bon gouvernement se doit
de choisir celle qui donne les meilleurs résultats, c'est à dire
celle qui réduit le plus la pauvreté. Cependant, ce choix
s'avère loin d'être acquis, une des causes pour cela étant
le fait qu'il est très difficile de mesurer la pauvreté d'une
société de façon adéquate, et en conséquence
de déterminer quelles politiques impliquent une réduction plus
importante de celle-ci.
La mesure de la pauvreté est donc d'une
importance capitale puisque c'est grâce à elle que
l'évaluation des politiques de lutte contre la pauvreté peut
être réalisée.
I. PROBLÉMATIQUE
Spécifier une mesure de pauvreté n'est
pas un exercice aisé et donc ne serait être une question simple.
En effet, plusieurs approches conceptuelles et méthodologiques tentent
de répondre à cette difficulté pour apporter des
réponses du genre : Quel indicateur de bien être
retenir pour identifier les personnes pauvres? Qui est réellement pauvre
et pourquoi? Comment peut-on synthétiser les informations concernant les
pauvres dans une mesure de pauvreté?
C'est ainsi qu'il parait nécessaire de
présenter l'approche multi-variée de la pauvreté pour
tenter d'apporter une réponse à cette
problématique.
L'approche des besoins sociaux de base qui s'apparente
à cette définition et souvent utilisée par les organismes
internationaux a été développée comme une
réponse à la nécessité de reconnaître que la
pauvreté revêt un caractère multidimensionnel.
II. MÉTHODOLOGIE DE RECHERCHE
Étant donné l'objectif de cette
étude, nous présentons la méthodologie de la
pauvreté multidimensionnelle par l'Analyse en composantes principales
(ACP) en utilisant le logiciel SPSS comme outil informatique. Par ailleurs,
nous utiliserons les renseignements sur les ménages issus d'une
enquête réalisée en 2005 par l'Institut National de la
Statistique.
La mesure de la pauvreté multidimensionnelle
implique habituellement la construction des indices de privation qui
incorporent l'information fournie par plusieurs indicateurs de
privation.
III. DÉLIMITATION DU SUJET
Pour bien mener nos investigations avec assez
d'efficacité; le présent travail est limité sur les
aspects suivants :
- La disponibilité de l'information dans la
base des données de l'Institut National de la Statistique;
- Les limites en ressources, en temps et
multiplicité des dimensions, nous ont obligé à faire une
sélection des variables définissant le minimum du bien être
au sein de ménage Congolais, et kinois en particulier;
- Notre étude a comme champ spatial la ville de
Kinshasa, Capitale de la République Démocratique du Congo, et son
champ temporel est l'année 2005.
IV. PLAN SOMMAIRE
Notre sujet de mémoire comporte trois chapitres
dont le premier porte sur l'introduction à l'analyse des
données, le second est axé sur la
mesure et analyse multi-variée de la pauvreté, le
troisième concerne la présentation des
résultats, et enfin une conclusion et suggestions
politiques clôture ce travail.
Chapitre I : UNE INTRODUCTION A L'ANALYSE DES
DONNEES
L'analyse des données est un sous domaine des
statistiques qui se préoccupe de la description de données
conjointes. On cherche par ces méthodes à donner les liens
pouvant exister entre les différentes données et à en
tirer une information statistique qui permet de décrire de façon
plus succincte les principales informations contenues dans ces données.
On peut également chercher à classer les données en
différents sous groupes plus homogènes.
Le but de ces méthodes est de synthétiser
les grands tableaux pour en fournir une présentation
simplifiée.
.
I.0 Les Tableaux des données
Les données sont les mesures effectuées
sur n unité (xi1,xi2,
· · ·xip). Les p variables qui
représentent ces mesures sont {v1, v2, ..., vj , ...,vp}.
Le tableau des données brutes à partir
duquel on va faire l'analyse est noté X et a la forme suivante
:
[x11 x12 · · · x1p X = x21
x22 · · · x2p xn1 xn2
· · · xnp
Chaque unité xi peut être
représentée par le vecteur
xi = (xi1,xi2, · · ·
xip), xi E Rp
De façon analogue, on peut représenter
chaque variable par un vecteur de R~ dont les composantes sont les valeurs de
la variable pour les n unités :
11 '2j
~~ = ...
V.,~
Pour avoir une image de l'ensemble des unités,
on se place dans un espace affine en choisissant comme origine un vecteur
particulier de R , par exemple le vecteur dont toutes les coordonnées
sont nulles. Alors, chaque unité sera représentée par un
point dans cet espace. L'ensemble des points qui représentent les
unités est appelé traditionnellement «nuage des
individus».
En faisant de même dans Ri', chaque
variable pourra être représentée par un point de l'espace
affine correspondant.
L'ensemble des points qui représentent les
variables est appelé «nuage des variables».
I.0.1 Les différents types des données
multidimensionnelles
a. on appelle données multidimensionnelles,
l'ensemble des valeurs d'un certain nombre des variables statistiques sur un
individu d'une population donnée.
8
b. Tableaux individu X caractères
quantitatifs
Ce type de tableau est l'un le plus simple et le plus
répandu. En général xj(i) est un nombre réel
représentant la mesure de
la variable xj sur l'individu i.
Exemple : la répartition des candidats X, Y et Z
dans 4 provinces de la RDC
|
Kinshasa
|
Bandundu
|
Bas Congo Katanga
|
X
|
2500
|
1250
|
1000
|
1800
|
Y
|
3000
|
1000
|
2500
|
2800
|
Z
|
1000
|
600
|
100
|
700
|
Si i = X et xj=Kinshasa;xj(i) = 2500
c. Tableaux logiques
Si l'on définit, pour les variables
quantitatives, une répartition en classe, l'ensemble des
résultats de l'observation peut être présenté sous
la forme d'un tableau logique composé de 0 et de 1. On présente
de façon analogue les tableaux x des caractères
qualitatifs.
d. Tableaux de contingence
prenant les valeurs sur un ensemble I, de n
modalités i, et l'autre sur un ensemble J, de p
modalités j, le tableau de contingence K (ou tableau
croisé), associé à ces données est le tableau
de dimensions n × p et de terme général k1 ; dont k1 le
nombre d'individus présentant simultanément la
modalité i pour le premier caractère, et j
pour le second.
d1. Tableau des fréquences
&'(
Les fréquences sont calculés par :%J = ~ .
. Tableau des fréquences lignes : flLJ = *'(
*'.
Tableau des fréquences colonnes fcLJ = *'(
*. (
e. Tableaux de proximité
Considérons un ensemble I d'objets, on dispose
d'une mesure de ressemblance ou de dissemblance entre tous les
éléments de I pris deux a deux.
i ? I,i' ?
I;d(i,i') = 0
I.1 les principales méthodes de l'analyse des
données
Globalement ces méthodes sont classées
en
méthode d'analyse factorielle et méthode
des classifications. Les premières méthodes occupent une place
primordiale et sont particulièrement intéressantes parce qu'elles
permettent de représentation graphique.
Ces méthodes permettent notamment de manipuler
et de synthétiser l'information provenant de tableaux de données
de grande taille.
Pour cela, il est très important de bien
estimer les corrélations entre les variables que l'on étudie. On
a alors souvent recours à la matrice des
corrélations.
Dans le cadre de ce travail, nous allons nous
limité à deux de ces méthodes : L'analyse
en composantes principales (ACP) et l'analyse
factorielle des correspondants (AFC).
I.1.1 Méthode de l'Analyse en Composantes
Principales (ACP).
L'ACP est une Analyse Factorielle de la famille de
l'Analyse des données et de la Statistique Multi-variée, qui
consiste à transformer des variables liées entre elles (dites
"corrélées" en statistique) en nouvelles variables
indépendantes les unes des autres (donc "non corrélées").
Ces nouvelles variables sont nommées "composantes principales". Elle
permet au praticien de réduire l'information en un nombre de composantes
plus limité que le nombre
11
initial de variables.
L'ACP prend sa source dans un article de Karl Pearson
publié en 1901. Le père du Test du ÷2 y prolonge
ses travaux dans le domaine de la régression et des corrélations
entre plusieurs variables. Pearson utilise ces corrélations non plus
pour expliquer une variable à partir des autres (comme en
régression), mais pour décrire et résumer l'information
contenue dans ces variables.
Les champs d'application sont aujourd'hui multiples,
allant de la biologie à la recherche économique et sociale, et
plus récemment le traitement d'images.
I.1.1.a. Choix de la distance entre individus
Soit un tableau à double entrée des
individus i, i? I = 01, ... , p} et des variables numériques j,4 ? 5 =
01, ... k} avec généralement chaque ligne i est un vecteur
définie dans Rc ; on évalue ensuite la ressemblance
entre individus en calculant la distance euclidienne entre points pris deux
à deux, la distance euclidienne entre les individus
~~ = (~~ ~,~~ 2,... ,x ) et e3 =
(x3~,x32, ..., x3
) est définie par :
d2(e1,e3) = (x11 - x<
1)2 + (x8 2 - x<2)2 + ? +
(x8 - x< ?)2
p
d2(e1,e3) = (x~ & -
x3&)2
k=1
ressemblent.
La corrélation entre les variables k et les
variables h, k ? K, h ? K.
Le coefficient de corrélation entre la
variable
k et Ia variable h est:
1 , @ (x~& - Xk)(XL,, -
x,,)
(crkcrh)
t?l
r(k,h) =
Plus r(k, h) est élevé, plus la liaison
entre ces deux variables est forte ;
Si r(k,h) > 0, alors la liaison est de même
sens, si r(k,h) < 0, la liaison est de sens opposé.
L'ACP consiste à établir un état de
la ressemblance entre les individus et un état de liaison entre les
variables.
I.1.2 Inertie, Nuage et centre de gravitéNotons
l'inertie par IN tell que :
Désignons par g le centre de gravité des
nuages
n
O =
1
! @ xi
t=1
L'inertie totale du nuage est définie par
:
d2(g,X~)
,N = @ 1
!
i=1
On recherche des sous-espaces représentant au
mieux ce nuage de point en respectant 2 critères : le
critère de proximité et la
fidélité des distances.
C'est le sous-espace passant par g qui optimise ces deux
critères :
Soit H le sous-espace passant par g, on distingue deux
types d'inertie :
· L'inertie expliquée
n
'exp(H) = @ 2 1 d (g, ~S)
i=1
L'inertie résiduelle autour de H
n
'exp(H) = @ 2 1 d (xi, ~S)
i=1
Inertie totale = inertie expliquée + inertie
résiduelle
A. Espace des variables
Changement d'origine : g = 0 (centrage des variables)
La recherche des sous-espaces Hk se fait de proche en proche pour k=1 à
p :
La détermination de H1 revient à
chercher une droite passant par l'origine qui s'ajuste le mieux au nuage de
points-individus (maximisant l'inertie expliquée).
Pour trouver cette droite, il faut déterminer un
vecteur unitaire u1 porté par cette droite avec d(0,u1)=1.
Une fois u1 déterminé, on peut
démontrer que le sous-espace H2 s'ajustant au mieux au nuage de points
contient nécessairement u1.
Pour déterminer le sous-espace H2, on recherche
u2 tel que u2 perpendiculaire à u1 et tel que la droite portée
par u2, passant par 0, ait une inertie maximale.
les vecteurs u1,u2,...,up peuvent s'obtenir à
partir de
la matrice d'inertie C (covariance ou corrélation)
entre les variables du tableau.
Cette matrice est telle qu'il existe p vecteurs et p
constantes ë qui vérifient l'équation matricielle suivante :
C.v = ëv
Les p vecteurs v sont les vecteurs propres et les
constantes associées sont les valeurs propres.
Ces vecteurs sont orthogonaux deux à deux et
unitaires (de longueur égale à 1). Ils peuvent être
rangés par ordre décroissant des valeurs propres associées
: le premier vecteur propre v1 est associé à la valeur propre la
plus élevé ë1.
Les droites engendrées par ces vecteurs propres
sont appelées respectivement le 1er, 2ème, et
pième axe principal d'inertie du nuage.
L'inertie expliquée par H1, le premier axe
Principal engendré par v1 est égale à :
I(H1)= ë1
L'inertie expliquée par H2, le plan
engendré par v1 et v2 est égale à : I(H2)= ë1+
ë2
Les valeurs propres de C représentent donc les
parts d'inertie
expliquée par chacun des axes principaux du nuage
des individus.
Dans un espace euclidien E de dimension finie n
considérons, le point M',i ? I;i =
1,2,..., n affectés chacune d'une masse mL.
Soit N = f(ML,mj/i = 1,2, ...,n), N est un
ensemble des couples appelé nuage des points.
Soit P un autre point situé dans le même
espace E. On définit l'inertie du point ML par rapport
à P notée
Ip(ML,mL) =
mLd2(ML,P)?i ? I
L'inertie totale du nuage N comme étant la
somme pondérée des carrés des distances des individus au
centre de gravité G.
I~(N) = >(mL d2(ML,
G)/i ? I)
Si les points ML sont sur un axe 0x, soit
xL les abscisses respectifs, le centre de gravité ou
barycentre de ML tel que i ? I est noté :
x(G) = >fmLxL/i ? I)/@0mL/i ? I) y(G) =
@fUL^L/~ ? I)/@0mL/i ? I) Le centre de gravité est :
(x(G),y(G))
1.1.3 La variance
Considérons le système des points munis de
masses
Soit N = f(ML,mj/i = 1,2, ...,n) porté
par une droite, chaque
point M' est identifié à son
abscissexL.
Si le centre de gravité n'est pas à l'
origine on aura donc la variance du nuage N est :
VAR(N) = >fmj(xt -
X(G))2/>mj/i ? l) VAR(N) = I~(N)/mtotai
I.1.4 Projection Orthogonale de nuage sur un espace F
Soit un sous ensemble de R , %~ la projection orthogonale
de e, sur F , on va chercher F tel que :
n
@?e - %~?2
i=1
soit minimal ce qui revient d'après le
théorème de Pythagore à maximiser
n
@?%~ - g?2
i=1
Car
?eL - g?2 = ?eL - %~?2 + ?%~ -
g?2
La recherche d'axes portant le maximum d'inertie
équivaut à la construction de nouvelles variables (auxquelles
sont associés ces axes) de variance maximale.
En d'autres termes, on effectue un changement de
repère dans R de façon à se placer dans un nouveau
système de représentation où le premier axe apporte le
plus possible de l'inertie totale du nuage, le deuxième axe le plus
possible de
l'inertie non prise en compte par le premier axe, et
ainsi de suite.
On appelle axes principaux d'inertie les axes de
direction des vecteurs propres de V normés à 1.
Il y en a p.
Le premier axe est celui associé à la plus
grande valeur propre ë1.
On le note u1.
Le deuxième axe est celui associé à
la deuxième valeur propre ë2, on le note u2.
Composantes principales
A chaque axe est associée une variable
appelée
composante principale.
La composante c1 est le vecteur renfermant les
cordonnées des projections des individus sur l'axe 1.
La composante c2 est le vecteur renfermant les
cordonnées des projections des individus sur l'axe 2.
Pour obtenir ces coordonnées, on écrit que
chaque composante principale est une combinaison linéaire des variables
initiales
exemple : C1 = u1x1 +
u2x2 + ? + u x
I.2 L'analyse factorielle des correspondances,
L' analyse factorielle des correspondances (en sigle
AFC)est une méthode statistique d'analyse des données mise au
point par Jean-Paul Benzecri à l'Université Pierre-et-MarieCurie
à Paris (ISUP et Laboratoire de statistique
multidimensionnelle).
La technique de l'AFC est essentiellement
utilisée pour de grands tableaux de données toutes comparables
entre elles (si possible exprimées toutes dans la même
unité, comme une monnaie, une dimension, une fréquence ou toute
autre grandeur mesurable). L'AFC sert à déterminer et à
hiérarchiser toutes les dépendances entre les lignes et les
colonnes du tableau.
Le principe de ces méthodes est de partir sans
a priori sur les données et de les décrire en analysant la
hiérarchisation de l'information présente dans les
données. Pour ce faire, les analyses factorielles étudient
l'inertie du nuage de points ayant pour coordonnées les valeurs
présentes sur les lignes du tableau de données.
La "morphologie du nuage" et la répartition des
points sur chacun de ces axes d'inertie permettent alors, de rendre lisible et
hiérarchisée l'information contenue dans le tableau.
Mathématiquement, après avoir centré et réduit le
tableau de données et que l'on a affecté d'un système de
masse (par exemple, les sommes marginales de chaque ligne), on calcule la
matrice d'inertie associée et on la diagonalise (la répartition
de l'information selon les différents axes est représentée
par l'histogramme des valeurs propres). On effectue alors un changement de base
selon ses vecteurs propres, c'est-à-dire selon les axes principaux
d'inertie du nuage de points. On projette alors les points figurant chaque
ligne sur les nouveaux axes. L'ensemble de l'information est conservée,
mais celle-ci est maintenant hiérarchisée, axe d'inertie par axe
d'inertie. L'histogramme des valeurs propres permet de voir le type de
répartition de l'information entre les différents axes et
l'étendue en dimension de celle-ci.
Le premier axe d'inertie oppose les points,
c'est-à-dire les lignes du tableau ayant les plus grandes distances ou
"différences". La première valeur propre d'inertie,
(associée à ce premier axe) mesure la quantité
d'information présente le long de cet axe, c'est-à-dire dans
cette opposition.
Plusieurs méthodes d'analyse des
correspondances existent, qui diffèrent par le type de
représentation de l'information, c'est-à-dire de métrique,
ou de système de masse qu'elles utilisent.
Le but de l'AFC est de mettre en évidence les
relations de dépendance ou d'indépendance de deux
modalités étudiés et mesurer à l'aide du
x2 ; d'une part la ressemblance entre profils lignes et d'autre part
la ressemblance entre profilscolonnes.
Le x2 permet de mesurer l'intensité de
la liaison entre les deux nuages de variables.
I.2.1 Distance entre les profils, Métrique du x2
Chaque ligne du tableau des fréquences lignes
peut être vue comme la liste des coordonnées d'un point dans un
espace à q dimensions. On obtient ainsi le nuage des individuslignes. On
définit de même le nuage des individus-colonnes à partir du
tableau des fréquences colonnes. Comme en ACP, on s'intéresse
alors aux directions de "plus grande dispersion" de chacun de ces nuages de
points. Mais, pour mesurer la "distance" entre deux individus, on utilise la
Métrique du x2.
La distance du x2 entre la ligne i et la ligne
i' est ainsi définie par :
(flpI -
f1p'I)2
I
dX2(L1, L1') = q.
I
La ressemblance entre le profil colonne j et le profil
colonne 1 est mesuré par :
dx2(PCJ, PC~9 = >.1
1
|
1
(%1
|
- %l
)2
|
f f~
|
%~
|
Chapitre II : MESURE ET ANALYSE MULTI-VARIEE DE LA
PAUVRETE
II.1 Introduction
La pauvreté est l'un des plus grands
problèmes auxquels font face les diverses sociétés du
monde actuel. Ses conséquences diffèrent selon la région
du monde que l'on traite, allant de l'exclusion sociale dans les pays riches
jusqu'à la malnutrition et la mort dans les pays les plus pauvres. Ces
problèmes sont des vraies maladies pour une société,
raison pour laquelle tous les gouvernements qui ont un souci pour le sort des
individus du pays de cette catégorie ont déclaré leur
intention de lutter contre ce fléau.
II.1.2 Définition
Le programme des Nations Unis pour le
Développement (PNUD) définit la pauvreté comme une
privation du bien être ou d'accès aux services sociaux de base
(Éducation, Santé, Emploi,...).
La pauvreté est généralement
définie comme une privation d'un minimum des commodités
permettant à un individu, un ménage ou une population de vivre
dans des conditions décentes. La pauvreté est un
phénomène
multidimensionnel et ne peut se résumer à
son aspect monétaire.
II.2 choix des indicateurs de bien être
Le rapport du PNUD 2007 affirmait que le manque de
revenu ne fournit qu'une vue partielle des multiples facteurs agissant sur le
bien être des individus. Une nouvelle mesure de la pauvreté
prenant en compte d'autres indicateurs tels que l'espérance de vie, la
santé, l'alimentation, l'éducation ...serait le mieux
indiqué. C'est ainsi qu'un indice de pauvreté a été
élaborer par Anand et Sen en 1997 (Sami BIBI, 2002). Cet indice
appelé IPH se met sous la forme suivante :
IPH =
(w1IPH~è + w2IPH2
è +
w3IPH3 è), Avec w1 + w2
+ w3 = 1 et è = 1
IPH1 renseigne sur renseigne sur la privation
de vivre longtemps. Il s'agit du pourcentage des individus ayant une
espérance de vie inférieure à 40 ans ;
IPH2 lié à l'éducation,
donne le pourcentage de la population adulte illettrée ;
IPH3 est lui-même un indicateur
composite représentant la moyenne arithmétique de trois autres
indicateurs à savoir le pourcentage de la population ayant accès
au service de santé (IPH31), à l'eau
potable (IPH32), et le pourcentage des enfants
âgés de moins de 5 ans souffrant de malnutrition
(IPH33).
Notre étude s'intéressera à
l'accès aux besoins sociaux de base et la possession des biens de
confort.
II.2.1 Critères de choix des indicateurs de bien
être
L'indicateur doit être appliqué sur une
grande partie de l'échantillon,
L'indicateur doit pouvoir contenir l'information
pertinente sur l'offre ou l'accès au service (quantité ou
qualité).
II.3 Mesure de la pauvreté
multidimensionnelle
Une mesure de la pauvreté multidimensionnelle
est un indice qui synthétise l'ensemble des informations disponibles
concernant une population pauvre. Cet indice se fonde sur une distribution d'un
ou plusieurs indicateurs de bien-être individuel et d'un seuil de
pauvreté relatif à chacun des indicateurs
sélectionnés.
II.3.1 Les indicateurs et Seuil relatif selon les besoins
sociaux de base
Comme cela a été indiqué plus
haut, ce qui a motivé le choix des indicateurs et le choix de la
méthodologie de calcul des seuils c'est à la fois la
disponibilité des données issues l'enquête de 2005
auprès des ménages et les normes retenues par cette enquête
comme minimum de bien-être. Afin d'assurer une meilleure
compréhension des variables retenues dans cette étude, il est
opportun d'expliciter le contenu des indicateurs qui ont été
attachés à ces variables.
A. Dimension éducation
Dans cette dimension, l'indicateur retenu est
l'absence de fréquentation d'un établissement scolaire par un ou
plusieurs enfants âgés de 6 à 18 ans dans un
ménage.
B. Dimension santé
Dans le domaine de la santé, il a
été considéré qu'une personne en est privée
lorsqu'il a souffert d'un mal quelconque au cours des 4 dernières
semaines et n'a pas consulté un service de santé. Comme services
de santé, on a considéré un cabinet médical,
hôpital privé ou public, centre de santé
intégré avec médecin, dentiste ou pharmacie.
C. Dimension EmploiLe chômage est
appréhendé chez les personnes âgées de
18
à 55 ans qui n'ont pas travaillé et qui
ont cherché du travail au cours des quatre dernières semaines
précédant l'enquête ;
D. Dimension eau
L'indicateur pour cette dimension combine :
l'accès à l'eau à boire (à une distance de moins de
5 minutes de marche) ;
Source d'eau potable définie pour les
ménages utilisant le robinet de la REGIDESO dans le
logement.
E. L'information
Les ménages privés de l'information sont
celles qui ne possède ni TV ni Radio.
H. Énergie
Un ménage sera privé d'énergie si le
combustible principal pour faire la cuisine est le feu de bois ou des
braises.
G. Habitat
Pour cette variable, le ménage est jugé
par la nature des matériaux de murs, un ménage avec
matériaux de murs en planche, bois ou natte sera considéré
pauvre.
J. Éducation
Pas d'individus âgés de 6 à 18 non
scolarisé. Dans le ménage est privé du service de
l'éducation.
II.3.2 Biens de confort et d'équipement
Privation d'un frigo ou congélateur, Privation d'un
matelas/lit,
Privation de chaises/ fauteuils,
Privation d'une cuisinière ou réchaud,
Privation lit/Matelas
Privation de table à manger
Privation des magnétos,
Privation de Toilette,
Privation de réchaud ou cuisinière
Étant donné l'objectif de cette
étude, nous présentons la méthodologie sur la mesure de la
pauvreté multidimensionnelle par l'analyse en composantes
principales.
La mesure de la pauvreté multidimensionnelle
implique habituellement la construction des indices de privation qui
incorporent l'information fournie par plusieurs indicateurs de
privation.
II.4. Résultats attendus
Les résultats attendus de cette étude
sont d'une part identifier les individus pauvres dans les différentes
dimensions et les groupes prioritaires et, d'autre part présenter les
contours d'une politique efficace de lutte contre la
pauvreté.
II.5 Sources des données
Les données qui font l'objet d'analyse dans
cette étude sont issues des bases de données de l'enquête
congolaise auprès des ménages (2005).
Chapitre III : PRESENTATION DES RESULTATS
Compte tenu de la disponibilité des
informations sur les ménages dont les données ont
été recueillies par l'INS, nous n'avons retenu que les
ménages dont le répondant aux questionnaires fut le chef de
ménage; ce qui nous donne un échantillon de 2081 ménages.
L'ACP appliquée à ces 2081 ménages et tenant des variables
retenues donne les résultats ci-après.
Variance totale expliquée
Compo sante
|
Valeurs propres initiales
|
Extraction Sommes des carrés des facteurs retenus
|
Total
|
% de la variance
|
% cumulés
|
Total
|
% de la variance
|
% cumulés
|
1
|
15,849
|
93,228
|
93,228
|
15,849
|
93,228
|
93,228
|
2
|
,883
|
5,192
|
98,420
|
|
|
|
3
|
,235
|
1,381
|
99,800
|
|
|
|
4
|
,034
|
,200
|
100,000
|
|
|
|
5
|
7,404E-16
|
4,355E-15
|
100,000
|
|
|
|
6
|
4,211E-16
|
2,477E-15
|
100,000
|
|
|
|
7
|
3,127E-16
|
1,840E-15
|
100,000
|
|
|
|
8
|
2,136E-16
|
1,256E-15
|
100,000
|
|
|
|
9
|
8,872E-17
|
5,219E-16
|
100,000
|
|
|
|
10
|
1,322E-17
|
7,775E-17
|
100,000
|
|
|
|
11
|
-2,303E-17
|
-1,355E-16
|
100,000
|
|
|
|
12
|
-5,807E-17
|
-3,416E-16
|
100,000
|
|
|
|
13
|
-2,154E-16
|
-1,267E-15
|
100,000
|
|
|
|
14
|
-2,797E-16
|
-1,645E-15
|
100,000
|
|
|
|
15
|
-3,776E-16
|
-2,221E-15
|
100,000
|
|
|
|
16
|
-4,551E-16
|
-2,677E-15
|
100,000
|
|
|
|
17
|
-2,109E-15
|
-1,241E-14
|
100,000
|
|
|
|
Variance totale expliquée
Compo sante
|
Valeurs propres initiales
|
Extraction Sommes des carrés des facteurs retenus
|
Total
|
% de la variance
|
% cumulés
|
Total
|
% de la variance
|
% cumulés
|
1
|
15,849
|
93,228
|
93,228
|
15,849
|
93,228
|
93,228
|
2
|
,883
|
5,192
|
98,420
|
|
|
|
3
|
,235
|
1,381
|
99,800
|
|
|
|
4
|
,034
|
,200
|
100,000
|
|
|
|
5
|
7,404E-16
|
4,355E-15
|
100,000
|
|
|
|
6
|
4,211E-16
|
2,477E-15
|
100,000
|
|
|
|
7
|
3,127E-16
|
1,840E-15
|
100,000
|
|
|
|
8
|
2,136E-16
|
1,256E-15
|
100,000
|
|
|
|
9
|
8,872E-17
|
5,219E-16
|
100,000
|
|
|
|
10
|
1,322E-17
|
7,775E-17
|
100,000
|
|
|
|
11
|
-2,303E-17
|
-1,355E-16
|
100,000
|
|
|
|
12
|
-5,807E-17
|
-3,416E-16
|
100,000
|
|
|
|
13
|
-2,154E-16
|
-1,267E-15
|
100,000
|
|
|
|
14
|
-2,797E-16
|
-1,645E-15
|
100,000
|
|
|
|
15
|
-3,776E-16
|
-2,221E-15
|
100,000
|
|
|
|
16
|
-4,551E-16
|
-2,677E-15
|
100,000
|
|
|
|
Méthode d'extraction : Analyse en composantes
principales.
Matrice des composantes
|
Composante
|
1
|
FAUTEILLE
|
,999
|
EAU
|
,999
|
INFO
|
,997
|
EMPLOI
|
,997
|
TABL
|
,997
|
LIT
|
,996
|
RECHAUDCONG
|
,995
|
TEL
|
,994
|
FRIGCONG
|
,992
|
ELEC
|
,984
|
MAGNE
|
,979
|
VENTILAT
|
,970
|
TOILET
|
,961
|
MATM
|
,942
|
MATLA
|
,912
|
ASSAIN
|
,867
|
SANTE
|
,808
|
Méthode d'extraction : Analyse en composantes
principales.
III.1 Interprétation
Il résulte de l'analyse en composantes
principales qu'il y a une forte corrélation entre les différentes
privations dont souffrent les ménages. (Voir matrice de
corrélation).
L'ACP montre que composante1
représente
l'ensemble des variables en 93%.(voir tableau des
variances total expliquées).
Il s'en suit que l'ampleur des privations au sein des
ménages se résume sur l'accès à l'eau potable,
Emploi et de biens de confort tel que les chaises fauteuils; Nos indices
synthétiques.
III.2 Analyse de l'incidence de la pauvreté
III.2.1 Tableau de privations (indices
synthétiques)
|
eau
|
emploi fauteuils
|
Aucun
|
48%
|
36%
|
70%
|
primaire
|
94%
|
33%
|
66%
|
non formel
|
37%
|
27%
|
48%
|
secondaire
|
32%
|
22%
|
53%
|
universitaire
|
24%
|
15%
|
23%
|
On a le graphique suivant :
80 70 60 50 40 30 20 10 0
|
|
|
|
|
|
|
eau emploi fauteils
|
|
Aucun primaire non formel sécondaire universitaire
De par le tableau de distribution des ménages
selon le niveau du chef de ménage; l'on a que 997/2081 soit 47% de
ménages sont privés d'accès à l'eau potable, et
1044 sur 2081 soit 50% de ménages sont privés de bien de confort
tel que les chaises fauteuils, 24% soit 501 chef de ménage manque
d'emploi. Tenant compte de distribution des ménages selon les niveaux
d'étude du chef de ménage il est noté que :
48% de chef de ménage d'aucun niveau souffre de
la privation en eau potable, 36% manque d'emploi, 70% manque des chaises
fauteuils.
62% de chef de ménage de niveau d'étude
primaire sont privés d'eau potable, 33% n'ont pas d'emploi, 66% manque
des chaises fauteuils.
40%, de chef de ménage du niveau non formel sont
privés d'eau, 27% manquent d'emploi, 48% n'ont pas des
fauteuils.
52% de niveau secondaire sont privés d'eau, 22%
sont privés d'emploi, 53% n'ont pas des fauteuils.
24% de niveau universitaire sont privés d'eau, 15%
manquent d'emploi, 23% manquent des fauteuils.
Il ressort que les chefs de ménages avec un
faible niveau sont les plus concernés par des privations en eau potable,
Emploi, chaise fauteuils. Voir le graphique ci haut.
Il set à remarquer que la privation en eau est
fortement liée aux autres privations (voir la matrice de
corrélation).
Il en résulte de l'analyse que 648, soit 31% de
ménages sont privés simultanément de l'eau et des biens de
confort tel que les chaises fauteuils.
CONCLUSION ET SUGGESTIONS POLITIQUES
Une approche de privation multidimensionnelle implique
aussi que le terme de pauvreté n'est pas seulement
considéré dans un sens monétaire mais aussi dans des
autres aspects du bien être.
Dans les dimensions d'éducation, santé,
eau et assainissement et enclavement on a défini le bien ou mal
être d'un individu dans le sens de l'accès aux services de base.
L'analyse des combinaisons de multiples privations nous a montré que la
plupart des ménages sont simultanément privés dans les
dimensions que nous avons considérées.
Un des objectifs de cette étude étant la
formulation des suggestions politiques appropriées pour la lutte contre
la pauvreté en République Démocratique du
Congo.
L'analyse de cette problématique par la matrice
des composantes principales indique que l'accès à l'eau, emploi
constituent des privations majeures dans la ville de Kinshasa. En plus, notre
étude a montré une corrélation entre la privation dans la
dimension d'eau et les autres besoins sociaux de base; ce qui nécessite
une attention particulière aux autres privations. Comme l'État
joue un rôle principal dans l'offre de ses services de base on ne peut
que constater que l'amélioration de la situation dans ces dimensions
dépendra largement, mais pas exclusivement, à l'initiative prises
par cet acteur.
Les résultats de notre analyse suggèrent
que l'accès aux services de base mérite une attention
particulière dans la formulation d'une stratégie de
développement.
Étant donné que la privation en eau est
corrélée à l'habitat il convient que nous
suggérions au gouvernement de promouvoir :
1. l'exonération des matériaux de
construction,
2. la mise en oeuvre effective d'institution d'appui
à la promotion de fourniture en eau et
électricité.
3. La création des emplois; et que le revenu
de ceci puisse subvenir aux besoins sociaux de base car la privation en eau est
corrélée à l'emploi.
Tel fut le but de notre travail, ce travail
présente une méthodologie pour trouver les indices
synthétiques à partir de plusieurs indicateurs de privations;
nous avons aussi les différentes corrélations entre les
différentes privations.
Les ménages pauvres se caractérisent par
la privation en eau potable, le manque d'emploi pour le chef de ménage,
manque des chaises fauteuils.
BIBLIOGRAPHIE
[1]. Cours d'analyse des
données, L1 Mathématiques. Prof Eugene
Mbuyi (2007-2008),
[2]. Cours de Statistique descriptive G2
Math, Prof Manya Ndjadi Leonard (2006-2007)
Pierre Delgado, Mathématiques
Appliquées, 2eme Edition
[3].Rapport mondial(2007) Programme nations Unis pour le
développent, PNUD,
[4]. Jean François Durand,
Élément d'analyse factoriel,
Université Montpellier II.
TABLE DES MATIERES
INTRODUCTION 1
PROBLEMATIQUE 2
METHODOLOGIE 3
DELIMITATION DU TRAVAIL 4
PLAN SOMMAIRE . 5
Chapitre I : INTRODUCTION A L'ANALYSE DES DONNÉES
6
I.0 Tableau des données 6
I.0.1 différent types de tableaux 7
I.1 les principales méthodes de l'analyse des
données
10
I.1.1 L'analyse en composantes principale 10
I.1.1a distance entre les individus 11
I.1.2 Inertie, nuage des points 12
I.1.3 la variance 15
I.14 projection orthogonal sur un espace F 16
I.2 Analyse factoriel des correspondants 17
I.2.1 Distance entre les profils, Métrique du
khi-deux 19
Chapitre II : MESURE ET ANALYSE MULTI-VARIEE DE LA
PAUVRETE 20
II.1
introduction 20
II.2 Choix des indicateurs de bien entre 21
II.2.1 critères des choix 21
II.3 Mesure de la pauvreté .22 II.3.1 Indicateur
et seuils relatif de la pauvreté 22
II.4 Résultats attendus 24
II.5 Source des données ...25
Chapitre III : PRESENTATION DES RESULTATS 26
III.1 Interprétation
...31
III.2 Analyse de l'incidence de la pauvreté
32
CONCLUSION ET SUGGESTIONS POLITIQUES 34
BIBLIOGRAPHIE 36
|