![]() |
Analyse statistique de demandes et d'offres d'emploi enregistrées par un service de l'état. Cas de l'Office National de l'Emploi / direction provinciale du Nord-Kivu en RDC de 2007 à 2009( Télécharger le fichier original )par Augustin MUNYARUYENZI NIKUZE Institut supérieur de statistique et de nouvelles technologies de Goma (ISSNT-Goma) - Graduat en statistique 2009 |
CHAPITRE II. THEORIES SUR LES METHODES STATISTIQUES UTILISEESII.1. CORRELATION LINEAIRE SIMPLEEn 1895, KARL PEARSON considère Auguste BRAVAIS (1811-1863) comme le père de la corrélation. Le 9 février 1877, Francis GALTON fait un exposé dans lequel il exprime le désir de construire un coefficient de réversion « r » qui indique la réduction de variabilité de la famille. Peu après, cette réversion se mutera en régression et plus tard en 1888, elle devient un nombre qui est notre coefficient de corrélation « r »24(*). Cette analyse va nous permettre de mesurer le degré de liaison entre les deux variables. Ici, il y a symétrie, c'est-à-dire les deux variables sont sur le même pied d'égalité. N'importe quelle variable peut être mise en ordonnée ou en abscisse. Calculer le coefficient de corrélation entre 2 variables revient à chercher la liaison qui existe entre les variables à l'aide d'une droite. On parle alors d'un ajustement linéaire25(*). II.1.1.L'estimation du coefficient de corrélation26(*)Lorsqu'une variable Y est en corrélation avec une variable X, deux problèmes se posent : - Etablir la forme de la liaison statistique existant entre Y et X, c'est-à-dire la détermination de la courbe de régression de Y en X ; - Mesurer l'intensité de la liaison par indice approprié. a)Calcul du coefficient de corrélation linéaire Posons Le coefficient de corrélation linéaire
noté Le coefficient de corrélation linéaire est donné par les formules suivantes : NB : r n'a pas d'unité. Le coefficient de corrélation donné par les expressions précédentes est appelé coefficient de corrélation de Bravais-Pearson. b)Corrélation et causalité On dit qu'il y a corrélation entre les variables observées sur les éléments d'une même population lorsque les variations de 2 variables se produisent dans le même sens (corrélation positive) ou lorsque les variations sont de sens contraire (corrélation négative). Elles sont non corrélées lorsqu'il n'y a aucune relation entre les valeurs de l'une des variables et les valeurs de l'autre. Interprétation : a) r=+1, on dit qu'il y a une parfaite corrélation positive. b) 0.75= r 1, on dit qu'il y a une très forte corrélation positive entre X et Y. c) 0,5= r 0,75, il y a une relation modérée à bonne forte corrélation positive. 0,25 r 0,5, il y a un certain degré de relation. d) 0r 0.5 ; il y a une faible corrélation positive. e) r=0, il n'y a aucune corrélation entre X et Y. f) -0,5 r0, il y a une faible corrélation négative. g) -1 r =0.75, il y a une très forte corrélation négative. h) r = -1, il y a une parfaite corrélation négative. Pour mieux interpréter un coefficient de corrélation on a l'habitude de prendre comme indicateur le carré du coefficient r2 appelé coefficient de détermination. Ce coefficient mesure la part de la variance totale qui est expliquée par la régression (c'est à dire c'est la proportion de la variation de Y qui est attribuable à la variation de X). NB : Un premier test de signification du coefficient de corrélation est donné par le coefficient d'amélioration. Il est défini par Il y a présomption de corrélation si A>50%
autrement dit si le coefficient de corrélation est en valeur absolu * 24 SALUMU MULENDA, Op. cit. * 25 KIMANUKA, C., Op. cit. * 26 KIMANUKA, C., Idem. |
|