I - Rappel des instruments statistiques d'analyse
L'économétrie est un outil utilisé par
les économistes pour confirmer ou infirmer les théories à
travers les tests d'hypothèse, c'est-à-dire à travers une
formalisation d'un phénomène sous forme d'équation avec
des grandeurs économiques comme des variables. La démarche
économétrique amène à établir clairement et
à estimer les relations. L'intuition peut conduire à l'ignorance
de certaines liaisons importantes ou à une mauvaise utilisation de
celles-ci. Il est nécessaire pour tout économiste d'utiliser une
démarche fiable lui permettant d'avoir des résultats non
biaisés. Dans notre cas nous allons présenter les
régressions simples et multiple et la méthode des moindres
carrés ordinaires.
1) Régression simple et régression
multiple
Supposons un échantillon aux éléments du
quel on associe deux caractères Xi et Yi, on
obtient une statistique à deux dimensions avec une variable à
expliquer et une variable explicative. On aura un nuage des points dans un
espace à dimensions deux. Ainsi, redresser ou ajuster ce nuage des
points revient à déterminer une droite d'équation
linéaire comme celle-ci : Yi = a0 +
a1Xi
La régression simple est l'estimation faite à
l'aide d'un modèle le plus simple c'est-à-dire une variable
endogène est expliquée par une seule variable exogène. La
régression simple ou modèle linéaire simple peut
être spécifié de plusieurs façons. Ainsi on
a :
- Le modèle en séries temporelles, dans lequel
les variables représentent des phénomènes observés
par intervalle de temps régulier.
- Le modèle en coupes instantanées, pour ce
modèle les données sont observées au même instant et
concerne les valeurs prises par les variables pour plusieurs individus.
- Le modèle en données de panel, dit encore
modèle à données croisées, ici les variables
représentent les variables prises par un échantillon d'individu
à intervalle régulier.
- Le modèle en données de cohorte, pour ce
modèle, l'échantillon est constant c'est-à-dire les
individus utilisés sont les mêmes d'une période à
l'autre.
La régression simple tient compte de l'existence de
l'erreur. Ainsi, elle prend en considération trois sortes
d'erreur : les événements imprévisibles ; les
effets d'un nombre important de variables omises et l'erreur de mesure sur la
variable endogène.
Le modèle linéaire simple se base sur six
hypothèses permettant l'estimation de ses paramètres :
H1 : la variable exogène est
observée sans erreur c'est-à-dire qu'elle est non
aléatoire.
H2 : le modèle est linéaire en
la variable exogène ou n'importe quelle transformation de celle-ci.
H3 : la variable exogène est
indépendante en terme d'erreur.
H4 :l'espérance mathématique de
l'erreur est nulle.
H5 : la variance de l'erreur est constante et
finie.
H6 : les erreurs sont indépendantes.
La régression multiple ou encore le modèle
linéaire général est la généralisation du
modèle linéaire simple. Comme il est difficile
d'appréhender un phénomène économique ou social par
une seule variable, ce modèle prend en compte plusieurs variables
explicatives.
Soit le modèle suivant :
Yt = a0 + a1 X1t
+ a2 X2t + .............. + ak Xkt
+ åt avec
Yt = la variable à expliquer à la
date t
X1t = la variable explicative 1 à la date
t
X2t = la variable explicative 2 à la date
t
Xkt = la variable explicative k à la date
t
a0 = terme constant
a1, a2, ........., aK = les
paramètres du modèle
åt = le terme de l'erreur
t = 1, 2, ................, n n = nombre
d'observation
k = nombre des variables explicatives
Pour ce modèle, on distingue deux types
d'hypothèse : les hypothèses stochastiques liées
à l'erreur et les hypothèses structurelles relatives aux
variables.
- Les hypothèses stochastiques
H1 : les valeurs des variables exogènes
sont observées sans erreurs
H2 : l'espérance mathématique du
terme de l'erreur est nulle E (åt) = 0
H3 : la variance de l'erreur est constante
c'est-à-dire E (åt²) =
äå²
H4 : les erreurs sont non
corrélées E (åi, åj) = 0
H5 : les termes d'erreur sont
indépendants des variables explicatives c'est-à-dire cov
(Xit, åt) = 0
- Les hypothèses structurelles
H6 : absence de colinéarité
entre les variables explicatives. Cela implique que la matrice (X'X)
est régulière et que la matrice inverse
(X'X)-1 existe.
H7 : la matrice (X'X)/n tend vers
une matrice singulière lorsque n tend vers l'infini.
H8 : le nombre d'observation est
supérieur au nombre des variables exogènes, terme constant
inclut.
Les variables exogènes sont considérées
comme les données du modèle. Du fait de leur
exogéneité, elles sont indépendantes des erreurs et
peuvent être considérées comme des variables certaines. En
revanche, la variable à expliquer est une variable aléatoire.
2) La méthode des moindres carrés
ordinaires
Soit l'équation de régression
suivante :Yt = a0 + a1 Xt,
défini la droite qui approche au mieux les points d'un nuage des points
dans un repère. La méthode des moindres carrés ordinaires
permet de trouver les valeurs des coefficients de l'équation de cette
droite c'est-à-dire a0 et a1. Pour y parvenir, il
faut minimiser la somme des carrés des erreurs de l'équation de
régression.
L'estimation des coefficients a0 et a1
est obtenu en minimisant la distance (åt) au carré
entre chaque observation et la droite d'équation Yt =
a0 + a1 Xt d'où le nom d'estimateur des
moindres carrés ordinaires. Cette minimisation revient à
réaliser les conditions de premier ordre et de second ordre dans le
processus de dérivation de l'équation. Une fois les
paramètres de l'équation estimés, plusieurs tests peuvent
être faits. Avant d'exposer ces tests, il est nécessaire
d'analyser d'abord les données à utiliser.
|