II.1.2.Intervalle de confiance
du coefficient de corrélation
Comme le coefficient de corrélation d'un
échantillon ne représente pas totalement la corrélation de
l'ensemble de la population, il est nécessaire de déterminer la
sécurité de l'estimation fournie par le calcul de l'intervalle de
confiance.
a)Cas d'un très grand échantillon
(n=50)
La distribution d'échantillonnage de r est
considérée comme presque normale autour de la valeur de r avec
une erreur standard lorsque l'échantillon est très grand.
Les limites de l'IC sont donc au seuil ?.
b)Cas d'un échantillon d'effectif
n<50
Ici, la distribution d'échantillonnage de r n'est
plus presque normale. On construit alors un paramètre qui lui est distribué normalement avec une erreur standard indépendante à r. La table utilisée ici est la
table de Z de Fisher ou score Z.
Quand on connaît , on peut déterminer l'IC . On transforme ensuite les valeurs de r à l'aide de la formule
suivante : qui est l'inverse de .
Les limites de confiance de Z sont :
et
On reconvertie en et en d'où
et
II.1.3.Test de signification du
coefficient de corrélation linéaire
Le coefficient de corrélation r à partir d'un
échantillon de taille n donne une estimation ponctuelle du coefficient
de corrélation ñ de la population.
Dans ce point, nous nous proposons de juger si la valeur du
coefficient de corrélation linéaire est suffisamment importante
pour conclure qu'il existe une corrélation significative entre 2
variables.
a)Test de corrélation nulle pour des
échantillons importants (n=50)
Si n est assez grand, la distribution d'échantillonnage
de r suit une loi presque normale de moyenne r et d'écart-type , c'est à dire .
Pour une population où r=0 et n=50, la distribution
d'échantillonnage de r suit une loi presque .
L'hypothèse nulle que l'on soumet au test est de la
manière suivante :
Règle de décision
La valeur expérimentale de r est significativement
différente de 0 (rejette H0) si
NB : Ce test est utilisé si :
- La taille de l'échantillon est grande (n=50)
- Lorsque r calculé est petit ()
b)Test de corrélation nulle pour des petits
échantillons
Les valeurs de r qui ont une probabilité ?
donnée d'être atteintes ou dépassées dans un
échantillon tiré d'un ensemble avec association nulle.
Soit rcal=la corrélation calculée
à partir de n couples des points d'un échantillon
rth=la valeur critique lue dans la table de Fisher
au seuil de signification ? et au nombre de degrés de liberté
n-2.
Règle de décision
Il s'agit de tester :
, on rejette H0 si
c)Autre test de signification du coefficient de
corrélation
Si les distributions des variables X et Y en étude sont
normales, on peut tester la signification de toute corrélation r en
faisant appel à la variable T de Student.
Avant de conclure, il est recommandé de tester si la
valeur calculée du coefficient de corrélation est
significativement différente de zéro. Pour ce faire, on doit
calculer un t- théorique par la formule :
La valeur de t calculé sera comparée à la
valeur donnée dans la table de t- de Student à n-2 degrés
de liberté.
Les règles de décision sont
:
|