Tableau 2 : Table de
prédictions et des résultats attendus
Dependent Variable: AV
|
Method: ML - Binary Logit
|
Date: 08/22/06 Time: 21:28
|
Sample: 1 8762
|
Included observations: 8762
|
Prediction Evaluation (success cutoff C = 0.5)
|
|
Estimated Equation
|
Constant Probability
|
|
Dep=0
|
Dep=1
|
Total
|
Dep=0
|
Dep=1
|
Total
|
P(Dep=1)<=C
|
8622
|
140
|
8762
|
8622
|
140
|
8762
|
P(Dep=1)>C
|
0
|
0
|
0
|
0
|
0
|
0
|
Total
|
8622
|
140
|
8762
|
8622
|
140
|
8762
|
Correct
|
8622
|
0
|
8622
|
8622
|
0
|
8622
|
% Correct
|
100.00
|
0.00
|
98.40
|
100.00
|
0.00
|
98.40
|
% Incorrect
|
0.00
|
100.00
|
1.60
|
0.00
|
100.00
|
1.60
|
Total Gain*
|
0.00
|
0.00
|
0.00
|
|
|
|
Percent Gain**
|
NA
|
0.00
|
0.00
|
|
|
|
|
Estimated Equation
|
Constant Probability
|
|
Dep=0
|
Dep=1
|
Total
|
Dep=0
|
Dep=1
|
Total
|
E(# of Dep=0)
|
8489.33
|
132.67
|
8622.00
|
8484.24
|
137.76
|
8622.00
|
E(# of Dep=1)
|
132.67
|
7.33
|
140.00
|
137.76
|
2.24
|
140.00
|
Total
|
8622.00
|
140.00
|
8762.00
|
8622.00
|
140.00
|
8762.00
|
Correct
|
8489.33
|
7.33
|
8496.66
|
8484.24
|
2.24
|
8486.47
|
% Correct
|
98.46
|
5.24
|
96.97
|
98.40
|
1.60
|
96.86
|
% Incorrect
|
1.54
|
94.76
|
3.03
|
1.60
|
98.40
|
3.14
|
Total Gain*
|
0.06
|
3.64
|
0.12
|
|
|
|
Percent Gain**
|
3.70
|
3.70
|
3.70
|
|
|
|
Les observations sont classifiées selon qu'elles ont
une probabilité prédite qui se situe en deçà ou
au-delà de cutoff de 0,5
Les parties supérieures de ce tableau donnent une
classification des observations basée sur la valeur du cutoff
donné c'est-à-dire 0,5
Dans la partie gauche du tableau, la classification est
donnée en utilisant la probabilité prédite P barre et les
observations sont classifiées comme ayant des probabilités
prédites supérieure ou inférieure à la valeur
cutoff.
Dans la partie droite, les observations sont
classifiées en utilisant la probabilité prédite obtenue
d'une estimation d'un modèle ne contenant que l'intercepte C.
L'observation correcte est obtenue quand la
probabilité prédite est inférieure ou égale au
cutoff et l'observé-y=0 ou quand la probabilité prédite
est plus supérieure au cutoff et l'observé-y=1.(4)
Ainsi pour cette application, 8622 des observations y=0 sont
sont correctement classifiées par le modèle estimé soit
100% et 0 % des observations y=1
Globalement le modèle estimé prédit
correctement 98,40 % des observations.
Les parties inférieures du tableau contiennent les
prédictions analogues basées sur le calcul des valeurs
anticipées selon les mêmes spécifications que dans la
partie supérieure i.e. à gauche avec l'équation
estimée et à droite une équation estimée qu'avec la
constante. Le modèle classifie correctement 96,97 % des observations
contre 96,86 % pour le modèle à constante soit une performance de
3,70 %
Tableau 3 : Test de la précision de
l'ajustement(Mesure de la bonté du modèle)
Dependent Variable: AV
|
Method: ML - Binary Logit
|
Date: 08/22/06 Time: 21:28
|
Sample: 1 8762
|
Included observations: 8762
|
Andrews and Hosmer-Lemeshow Goodness-of-Fit Tests
|
Grouping based upon predicted risk (randomize ties)
|
|
Quantile of Risk
|
Dep=0
|
Dep=1
|
Total
|
H-L
|
|
Low
|
High
|
Actual
|
Expect
|
Actual
|
Expect
|
Obs
|
Value
|
1
|
0.0013
|
0.0035
|
871
|
873.404
|
5
|
2.59635
|
876
|
2.23187
|
2
|
0.0035
|
0.0045
|
869
|
872.601
|
7
|
3.39922
|
876
|
3.82914
|
3
|
0.0045
|
0.0052
|
868
|
871.815
|
8
|
4.18536
|
876
|
3.49344
|
4
|
0.0052
|
0.0068
|
872
|
870.931
|
4
|
5.06946
|
876
|
0.22693
|
5
|
0.0068
|
0.0089
|
870
|
870.393
|
7
|
6.60748
|
877
|
0.02350
|
6
|
0.0089
|
0.0122
|
873
|
865.806
|
3
|
10.1944
|
876
|
5.13701
|
7
|
0.0122
|
0.0148
|
867
|
863.941
|
9
|
12.0586
|
876
|
0.78662
|
8
|
0.0148
|
0.0192
|
867
|
860.961
|
9
|
15.0385
|
876
|
2.46704
|
9
|
0.0192
|
0.0251
|
856
|
856.920
|
20
|
19.0802
|
876
|
0.04533
|
10
|
0.0251
|
0.2617
|
809
|
815.230
|
68
|
61.7705
|
877
|
0.67585
|
|
|
Total
|
8622
|
8622.00
|
140
|
140.000
|
8762
|
18.9167
|
H-L Statistic:
|
18.9167
|
|
|
Prob[Chi-Sq(8 df)]:
|
0.0153
|
Andrews Statistic:
|
44.5422
|
|
|
Prob[Chi-Sq(10 df)]:
|
0.0000
|
Ce tableau reprend 2 tests de bonté du modèle,
qui se distribue selon le khi-carrée de Pearson. Ils permettent de
comparer les valeurs attendues qui conviennent (Fitted expected values) aux
valeurs actu1elles par groupe. Si la différence est importante, le
modèle est rejeté comme ne convenant pas suffisamment aux
données (As providing an insufficient fit to the data).
La colonne Quantile of risk décrit les valeurs
inférieure et supérieure de probabilité prédite
pour chaque décile. Il donne aussi le nombre actuel et le nombre attendu
(expected) des observations dans chaque groupe et la contribution de chaque
groupe dans la statistique Hosmer-Lemershow (H-L). Une valeur importante
indique une large différence entre la valeur actuelle et la valeur
prédite pour ce décile.
Les statistiques Khi-carrée sont aussi
rapportées
|