Les effets du commerce informel sur la vie socio-économique des ménages. Cas des vendeuses du quartier Ndoshopar Rachel ASIFIWE YVETTE Institut Supérieur de Statistique et des Nouvelles Technologies (ISSNT/Goma) - Graduat en statistique 2016 |
II.2 TABLEAU DE CONTINGENCEUn tableau de contingence donne la répartition d'une population statistique suivant deux caractères qualitatifs éclatés chacun en modalités exhaustives et exclusives les uns des autres. Un tableau de contingence se présente de la manière suivante : Tableau n°5 : Tableau de contingence
Source : notes de cours de statistiques appliquée Avec le nombre d'individus possédant la modalité i du caractère 1 et la modalité j du caractère 2 II.3 TEST D'INDEPENDANCELe test d'indépendance sert à tester la vraisemblance d'une absence de liaison, dans une population à partir de l'échantillon. Il renseigne sur la force de l'évidence et non sur la force de l'association. La difficulté est qu'un nombre unique ne peut représenter les différentes facettes des liaisons entre 2 variables. Ces tests ont pour but de contrôler l'indépendance stochastique de deux ou plusieurs critères de classification. Ils permettent également d'effectuer des comparaisons des pourcentages ou des proportions. Dans le cas d'une recherche d'indépendance entre la variable ligne et la variable colonne d'un tableau de contingence, on compare la distribution statistique observée dans l'échantillon à une distribution théorique. Cette distribution théorique est celle que l'on doit avoir si les 2 variables sont indépendantes, c'est-à-dire sous l'hypothèse Ho. On veut savoir si les écarts entre ces deux distributions sont imputables aux fluctuations d'échantillonnage, ou si au contraire, les écarts sont trop importants pour que l'on puisse accepter l'hypothèse Ho. Pour le lecteur sceptique, citons une remarque de D.SCHWARZ : "On notera qu'un très élevé permet de rejeter avec une grande sécurité l'hypothèse d'indépendance, mais ne prouve pas que la liaison soit très forte, car lorsqu'il existe une liaison, la valeur de augmente avec l'effectif de l'échantillon. Le ne mesure pas l'intensité de la liaison, intensité qu'il est d'ailleurs difficile de définir." On fait appel au test de khi deux ( ) pour tester l'indépendance des deux caractères regroupes dans un tableau de contingence ou dans un tableau de fréquences. Condition de validité ü Le test du peut s'appliquer sur tous les types des variables nominales, variables ordinales, variables d'intervalle ou de ratio. Cependant pour les 3 derniers types, il existe d'autres indicateurs ou mesures d'associations mieux adaptées. ü Les effectifs théoriques dans toutes les cases doivent être au moins égaux à 5 pour que le test de soit valide. Cette règle fait à peu près l'unanimité des théoriciens de la statistique. Si cette règle n'est pas vérifiée, on applique le test exact de Fisher ü Pour appliquer le test de , on fait la supposition que les proportions marginales dans la population totale sont les mêmes que celles observées sur l'échantillon. ü Le test de ne s'applique que dans un cadre d'inférence. C'est-à-dire lorsque l'on veut étendre les résultats observés a la population. Si l'échantillon recouvre toute la population, faire un test de n'a pas de sens. ü Le test de est sensible à la taille de l'échantillon. Le étant une mesure de l'écart existant entre les fréquences observées et les fréquences théoriques et il est donné par la statistique suivante : · Fréquences observées et fréquences théoriques Les résultats de l'échantillonnage ne concordent pas toujours avec les résultats théoriques que laisse prévoir le calcul de probabilité. Nous appelons fréquences observées, les différentes proportions obtenues dans l'échantillon , tandis que les fréquences théoriques sont des proportions que laisse prévoir le calcul de probabilité : Étant donné par le produit de total ligne et total colonne sur le total général. · Test de khi deux ou test de Pearson Pour un tableau de contingence (k ), on détermine d'abord le nombre de degré de liberté (ddl). 1. ddl= (k-1)(h-1), avec k nombre de lignes et h nombres de colonnes. 2. La règle de décision : une hypothèse souvent considérée consiste à supposer que les deux caractères étudiés sont indépendants entre eux, c'est-à-dire qu'il n'existe pas des relations entre les caractères étudiés. Si, nous acceptons l'hypothèse nulle selon laquelle les caractéristiques considérées sont indépendantes. Pour tester l'indépendance de deux caractères regroupés dans un tableau de contingence (k, h), l'expression simple est : Avec : i : indice de sommation du premier caractère ; j : indice de sommation du deuxième caractère ; : Nombre d'observations pour les deux caractères correspondants à la ligne i et à la colonne j k : nombre des lignes ; h : nombre des colonnes ; M.j : totaux marginaux des observations du second caractère appartenant à la colonne j ; Ni. : Totaux marginaux des observations du premier caractère appartenant à la ligne i n : effectif total de l'échantillon. · Coefficient de contingence Ce coefficient mesure le degré de dépendance et de corrélation des caractères étudiés dans le tableau de contingence. Son expression est : C= Par convention, on dira que la relation entre X et Y est 14(*): Ø Parfaite si la valeur de C=1 ; Ø Très forte si C ; Ø D'intensité moyenne si C se situe entre 0,5 et 0,8 ; Ø Faible si C se situe entre 0 et 0,2 ; Ø Nulle, si C=0. Attitude à adopter vis-à-vis des petits effectifs Si le nombre de degré de liberté est supérieur à 1 ; on procède par voir s'il ya possibilité de fusionner les catégories. Lorsque les effectifs théoriques des certaines catégories sont inférieures à 5, on fusionne avec une ou deux catégories voisines afin d'obtenir une catégorie ayant un nombre d'effectifs supérieur ou égal à 5. On ne peut pas fusionner les catégories si le nombre des catégories ou l'effectif est inférieur à 5 ne dépassant pas 20% de l'ensemble des catégories, et si aucun effectif n'est inférieur à 2. Ainsi, on applique le test de . * 14Josiane CONFAIS (UPMC-ISUP), la procédure des fréquences des tests d'indépendances et mesures Sd'association dans un tableau de contingence. |
|