I.2 THEORIES STATISTIQUES UTILISEES
A. Théorie de l'échantillonnage
La théorie de l'échantillonnage est
l'étude de la liaison existant entre une population et un
échantillon de cette population. Son importance est fondamentale pour
estimer les quantités qui caractérisent une population
c'est-à-dire les paramètres de la population, (moyenne, variance,
fréquence, etc...,) que l'on appelle souvent statistique de
l'échantillon ou tout simplement statistique. Il s'agit ici d'un
problème d'estimation.
La théorie d'échantillonnage permet
également de savoir si les différences observées entre
deux échantillons sont dues au hasard ou si elles sont réellement
significatives.
11
12
On rencontrera de telles questions par exemple en testant un
nouveau sérum pour le traitement d'une maladie ou bien en cherchant s'il
y a un procédé de fabrication meilleur qu'un autre.
Pour résoudre ces problèmes, on se servira
nécessairement de tests des significations ou des tests
d'hypothèses dont l'importance est grande dans la théorie de la
décision.
D'une façon générale, on appelle
inférence statistique l'étude de conclusions que l'on peut tirer
à partir d'un échantillon d'une population et du degré
d'exactitude de ces conclusions8.
B. Théorie statistique de
l'estimation
Le point précédent a montré comment la
théorie de l'échantillonnage permettra d'obtenir de l'information
à partir d'échantillons tires au hasard dans une population.
Du point de vue pratique, il est souvent plus important de
pouvoir obtenir des informations à partir d'échantillons. Dans
une population, lorsqu'on estime un paramètre par un nombre, on dit que
c'est une estimation ponctuelle de ce paramètre. Mais dans notre travail
nous allons utiliser l'estimation par intervalle de confiance qui consiste
à déterminer deux nombres en lesquels le paramètre doit se
trouver.
C. Théorie statistique de la
décision
Dans pratique, on est souvent appelé à prendre
des décisions diverses au sujet d'une population, comme c'est le cas de
notre travail, à partir des informations que donne un
échantillon. De telles décisions sont appelées
décisions statistiques.
D. hypothèses statistiques
Pour arriver à une décision statistique il est
commode de faire des hypothèses sur la population
considérée. De telles hypothèses peuvent être vraies
ou fausses ce sont des hypothèses statistiques .Ce sont
généralement des affirmations relatives à la distribution
de probabilité de la population. En pratique on formule une
hypothèse statistique dans le seul but de la rejeter ou de l'accepter
selon les résultats obtenus. Dans notre travail, si nous voulons
décider d'opter pour telle ou telle autre voie, on supposera au
départ, qu'il n'y a pas de différence entre les quantités
importées Sur les deux voies ou du moins que les
8 CT Jimmy MALAMBA, Cours de Statistique
appliquée II, ISS Lubumbashi, 2015-2016 inédit, G3 Stat/Jour.
différences observées sont simplement dues aux
fluctuations d'échantillonnages. Une telle hypothèse est une
hypothèse qui est nulle, on la désigne par H0 ; par contre une
hypothèse qui est contraire à l'hypothèse nulle est dite
alternative et notée H1 9.
I.3 METHODE D'ANALISE DE LA VARIANCE A.
GENERALITE
L'analyse de la variance (terme souvent abrégé
par le terme anglais ANOVA : analysis of variance) est un test statistique
permettant de vérifier que plusieurs échantillons sont issus
d'une même population.
a. Principe
L'analyse de la variance permet d'étudier le
comportement d'une variable qualitative à expliquer en fonction d'une ou
de plusieurs variables nominales catégorielles. Lorsque l'on souhaite
étudier le comportement de plusieurs variables à expliquer en
même temps, on utilisera une analyse de la variance multiple (MANOVA). Si
un model contient des variables explicatives catégorielles et continues
et que l'on souhaite étudier les lois liant les variables explicatives
continues avec la variable à expliquer en fonction de chaque
modalité des variables catégorielles, on utilisera alors une
analyse de la covariance (ANCOVA).
b. Modèle
La première étape d'une analyse de la variance
consiste à écrire le modèle théorique en fonction
de la problématique à étudier. Il est souvent possible
d'écrire plusieurs modèles pour un même problème, en
fonction des éléments que l'on souhaite intégrer dans
l'étude.
Le modèle générale s'écrit :
Avec tjk la variable à expliquer,
une constante, f ( ) une relation entre les variables explicatives et e
l'erreur de mesure. On pose l'hypothèse fondamentale que l'erreur suit
une loi normale : e = N(O,
a2).
c. Variables explicatives
9 CT Jimmy MALAMBA, Cours de Statistique
appliquée II, ISS Lubumbashi, 2015-2016 inédit, G3 Stat/Jour.
13
On distingue deux types des variables catégorielles :
avec ou sans effet aléatoire. Pour une variable à effet fixe,
pour chaque mobilité, il existe une valeur fixe correspondante Elles
s'écrivent dans le modèle théorique avec une lettre
majuscule10 :
Avec A0 = A pour i=0, Al = A pour i=1,
etc... dans le cas d'une variable à effet aléatoire, la variable
est issue d'une loi supposé normale qui s'ajoute à la valeur
fixe. Elles s'écrivent dans le modèle théorique avec une
lettre grecque minuscule :
Avec al=ua + ea et ea - N(0,
a2). Un modèle basé seulement sur des variables
explicatives à effets fixes et effets aléatoires et appelé
modèle mixte.
d. Hypothèses fondamentales
La forme générale de l'analyse de la variance
repose sur le test de Fisher et donc sur la normalité des distributions
et l'indépendance des échantillons.
> Normalité de la distribution : On suppose sous
l'hypothèse nulle, que les échantillons sont issus d'une
même population et suivent une loi normale. Il est donc nécessaire
de vérifier, la normalité des distributions et
l'homoscedasticité (homogénéité des variances, par
des tests de Batlett ou de Leven par exemple). Dans le cas contraire, on pourra
utiliser les variantes non paramétriques de l'analyse de la variance.
> Indépendance des échantillons : On suppose
que chaque échantillon analysé est Independent des autres
échantillons. En pratique, c'est la problématique qui permet de
supposer que les échantillons sont indépendants.
|