II-2-2 : Détermination du coefficient de
corrélation
Le coefficient de corrélation a pour objet de mesurer
l'intensité de la liaison entre les deux variables X et Y
.
A : Définitions et méthode de
calcul de la corrélation
Il s'agit ici de voir si une variation de la politique de
protection sociale entraîne une variation dans le même sens de la
productivité du travail des individus, en d'autres termes, s'il existe
une liaison forte entre les deux variables.
45
Pour ce faire, on considère simultanément deux
caractères numériques X représentant une mesure
de protection sociale et Y représentant une mesure de
productivité du travail des individus, définis sur une même
population finie û = {w 1, . . .
.wk } .
On appelle covariance du couple (X,
Y) et on note S2 (X, Y) la
moyenne du produit Z = [X - M(X)][Y
- M(Y) ], soit :
S X Y M X M X Y M Y
2 ( , ) = [ ( - ( ))( - ( ))] . Elle est positive
lorsque Z prend, « dans l'ensemble » des valeurs positives,
c'est-à-dire lorsqu'une grande valeur de X (i.e. X
> M(X)) a tendance à entraîner une
grande valeur de Y (i.e. Y > M(Y)). La
covariance est donc positive lorsque X et Y ont tendance
à varier dans le même sens, elle est négative dans le sens
contraire. La détermination du coefficient de corrélation permet
de mieux affiner les analyses.
Soit p le coefficient de corrélation, on a
respectivement l'écart-type de X et celui de Y .
|
S XY
2 ( )
p = . Où o X et o
Y représentent o o
x Y
|
|
· Si les variables X et Y sont
indépendantes, le coefficient de corrélation est
égal à 0. En effet, lorsque les deux variables
sont indépendantes : ( ) 0
S 2 XY =
S XY
2 ( )
d'où p = =0
oo
x Y
· Le coefficient de corrélation est compris entre
-1 et +1 c'est-à-dire -1=p=+1.
· Si les deux variables X et Y sont
liées par une relation fonctionnelle, le coefficient de
corrélation est égal à -1 ou +1.
· Entre ces deux extrêmes, absence de
corrélation et liaison fonctionnelle, le coefficient de
corrélation constitue une mesure de la plus ou moins grande
dépendance entre deux variables statistiques. Sa valeur absolue est
d'autant plus proche de l'unité que cette dépendance est forte.
Le coefficient de corrélation est positif en cas de liaison directe,
négatif en cas de liaison inverse.
B : Présentation des résultats et
interprétations
A l'aide du logiciel de calcul Microsoft Excel 2003, on a pu
calculer le coefficient de corrélation et la covariance des deux
variables X et Y .
46
Justification du choix de calcul du coefficient de
corrélation
Les données sur la productivité du travail
(Y ) et les prestations sociales reçues ( X )
proviennent de l'Institut National de la Statistique et couvre la
période 1994-2002. Le choix de cette période est dû
à la reprise économique amorcée en 1994 et à la
disponibilité des données.
Par ailleurs, dans un cas comme celui-ci, où les
observations sont individualisées (une par an), il n'aurait pas
été possible de calculer le rapport de corrélation qui
nécessite le regroupement en classes des observations : celles-ci ne
sont pas suffisamment nombreuses.
Le tableau ci-dessous présente la corrélation
entre les prestations sociales et la productivité du travail au
Cameroun, ainsi que le coefficient de corrélation des deux variables.
Tableau 2.2 : Corrélation entre
prestations sociales et productivité du travail
coefficient (X,Y)
|
de
|
corrélation
|
Covariance (X,Y)
|
0,8588917
|
|
|
27181086,5
|
|
Source : Calculs de l'auteur
On constate que la covariance est positive et forte car ( , )
=
S 2 X Y 2718086,5
Ce qui signifie qu'une forte variation de la protection
sociale dans une firme ou dans le pays entraîne une forte variation de la
productivité du travail dans l'économie. Le coefficient de
corrélation ñ = 0,8588917 est
très proche de l'unité, ce qui signifie qu'il y
a approximativement liaison fonctionnelle directe entre les deux variables.
Ceci justifie bien les prédictions théoriques d'une liaison forte
entre la productivité des individus et leur degré de couverture
sociale.
|