B/ Les test préalables
Nous allons utiliser le test paramétrique
économétrique de Wald. Il nous permet de tester la nullité
de tous les coefficients sauf la constante. Les hypothèses de ce test
sont donc : H0 : Les coefficients sont tous égal à 0
H1 : Au moins un des coefficients est différent de 0
TABLEAU 10: TEST DE WALD
Les variables explicatives
|
HTA
|
DIABETE
|
CARDIAQ
|
Educ
|
0
|
0
|
0
|
Age
|
0
|
0
|
0
|
Tabac
|
0
|
0
|
0
|
Sport
|
0
|
0
|
0
|
Diabète
|
0
|
0
|
0
|
Cardiaque
|
0
|
0
|
0
|
Chi-2 (6)
|
3477.19
|
2157.03
|
1501.84
|
Prob > chi-2
|
0.0000
|
0.0000
|
0.0000
|
21 Nous utilisons la variable quantitative « nombre de
paquets fumés » au lieu de la variable dichotomique codée 1
pour les fumeurs et 0 pour les non fumeurs.
29
Nous obtenons un chi-2 (6) des trois modèles
supérieur à chi-2 lu sur la table (11.07), nous rejetons H0 (Prob
> chi2 = 0.000). Les coefficients de nos 6 variables explicatives ne sont
pas tous nuls. Si nous appliquons le test à nos variables une à
une nous obtenons les résultats suivants :
- Pour le modèle dont la variable à expliquer
est la survenance de la maladie HTA, nous remarquons que quasiment tous les
coefficients des variables sont significativement différents de 0
à 5%. Sauf pour « Educ » et « Sport » qui ne sont
pas significatives.
- Concernant la variable à expliquer le DIABETE, nous
obtenons le même résultat sauf pour le coefficient de la
variable « Educ ». Au niveau de ce modèle, le coefficient de
cette variable devient significativement différent de 0 à 5%.
- Pour le modèle où la variable à
expliquer est la survenance des maladies cardiaques, nous avons plutôt
la variable « Tabac » et « Sport » qui ne sont pas
significatives.
Nous allons effectuer un test de spécification. Ce test
permet d'appréhender le pouvoir explicatif du modèle en calculant
les discordances et les concordances entre les valeurs estimées et
observées. Les résultats tirés du tableau de contingence
sont les suivants :
TABLEAU 11: TABLEAU DE CONTINGENCE
Logistic model for HTA
|
True
|
Total
|
Logistic model for DIABETE
|
True
|
Total
|
Logistic model for CARDIAQ
|
True
|
Total
|
Classified
|
D
|
--D
|
Classified
|
D
|
--D
|
Classified
|
D
|
--D
|
+
|
213
|
252
|
465
|
+
|
11
|
47
|
58
|
+
|
1
|
2
|
3
|
-
|
2598
|
40561
|
43159
|
-
|
1740
|
41826
|
43566
|
-
|
1109
|
42512
|
43621
|
Total
|
2811
|
40813
|
43624
|
Total
|
1751
|
41873
|
43624
|
Total
|
1110
|
42514
|
43624
|
Positive predictive value
|
45.81%
|
Positive predictive value
|
18.97%
|
Positive predictive value
|
33.33%
|
Correctly classified
|
93.47%
|
Correctly classified
|
95.90%
|
Correctly classified
|
97.45%
|
Le tableau ci-dessus nous permet de tester la qualité
d'ajustement des modèles et le degré de prédiction. Pour
chaque modèle nous allons interpréter les résultats
obtenus dans le tableau de contingence.
- Pour les personnes qui ont eu l'HTA 213 ont
été bien prédis sur 465. Nous obtenons 45.81% comme valeur
positive prédite. Pour les non exposés à l'HTA 40 561 ont
été bien prédits sur 43 159. Le seuil de prédiction
de notre modèle est égal à 93.47%.
- Concernant les individus qui sont exposés au DIABETE,
11 ont été bien prédis sur 58, la valeur prédite
positive est alors de 18.97%. Le seuil de prédiction du deuxième
modèle est égal à 95.9%.
30
- 97.45% est le taux de prédiction du troisième
modèle. Ainsi que la valeur positive prédite n'est que de 33.33%
(Une personne a été bien prédite sur les trois
exposés contre 42 512 des non exposés aux maladies cardiaques sur
les 43 621).
Les taux de la valeur prédite positive des trois
modèles ne sont pas négligeables. Ils représentent des
seuils très corrects de notre échantillon.
|