3.3.3. ETAPE 3: MODÈLE
ÉCONOMÉTRIQUE, RÉSULTATS DE L'ÉTUDE ET TEST
Selon le modèle établi dans la
précédente étape et mod-élisépar une
régression linéaire multiple dans Stata l'équation est la
suivante:
Score2 hat = â0 +â2âge +
â2femme + â3sport + â4polvert +
â5etudiant + â6transportcommun +
â7culturelle + â8association +
â9idf1
Score2 hat = 17,71 + 0,39*âge + 6,33*femme + 5,12*sport
+ 14,83*polvert + 5,18*etudiant - 3,38*transportcommun + 5,15*culturelle +
4,16*asso-ciation - 2,66*idf1
Interprétation: le modèle prédit qu'en
moyenne avec toutes les autres variables fixées ;
- Chaque année supplémentaire apporte un gain
de 0,39 point.
- Que les femmes ont 6,33 points en plus par rapport aux
hommes.
- Que les personnes pratiquant du sport n'ont 5,12 points en
plus que les non sportifs.
- Que les personnes favorables à une politique
centrée sur l'écologie ont 14,83 points en plus.
- Que les étudiants ont 5,18 points en plus.
- Que les personnes prenant les transports en commun ont 3,38
points en moins.
- Que les personnes pratiquant des activités
culturelles ont 5,15 points en plus.
- Que les personnes faisant partie d'association ont 4,16
points en plus.
- Que les personnes habitant en IDF ont 2,66 points en moins
que ceux habitant ailleurs.
Ce modèle est théorique et on y voit bien
certaines limites et potentiels biais. Par exemple l'interprétation de
la constante serait valable pour une personne ayant zéro année.
Ce qui n'est pas forcément cohérent. De plus on relève une
valeur étonnante, celle des transports en commun. On peut penser de
premier abord que prendre les transports en commun est une action plutôt
écologique mais ici le coefficient est négatif. Cela provient
potentiellement de la composition de notre échantillon majoritairement
francilien oùl'utilisation des transports en commun est très
courante et découle d'autres facteurs (les embouteillages, la desserte
en transports, etc.)
On va essayer à l'aide de tests de déterminer la
signi-ficativitéstatistique de ces différents coefficients.
Test
Nous allons effectuer pour chaque coefficient un test de
Student qui ici s'établit avec 253-1-1= 251 degrés de
libertéce qui est supérieur à 120 donc on peut dire que t
suit une loi normale N(0,1).
Avec comme hypothèses :
- H0: /3i = 0 - H1: /3i =6 0
Les valeurs de t pour chaque coefficient seront disponibles en
annexes mais nous allons nous intéresser à quelques-unes de
celles-ci. Seuls deux coefficients ne sont pas significatifs statistiquement au
seuil de 10% (transportcommun et idf). Ce n'est d'ailleurs pas étonnant
puisque comme vu précédemment elles découlent
potentiellement d'un biais dûà la composition de notre
échantillon. Cependant il est intéressant de voir que l'âge
avec un t = 3,34 ainsi que femme avec un t = 3,21 sont très significatif
au seuil de 1%. Et plus logiquement polvert avec un t = 7,22 aussi.
Pour juger de la significativitéglobale de la
régression nous allons procéder à un test de Fisher
à 9 contraintes simultanées avec comme hypothèses:
- H0: /31 = 0, /32 = 0 ,..., /38 = 0, /39 = 0 - H1: /31 =6 0
ou /32 =6 0 ou ... ou /39 =6 0
|