SECTION 2 : LES SOURCES DES DONNEES ET
LA DETERMINATION DE LA
METHODE D'ESTIMATION
A) Sources des données et
échantillon
L'indisponibilité des données est un
problème qui limite généralement le nombre de variables
pouvant expliquer correctement un phénomène économique. Ce
problème reste encore accentué dans les pays au sud du Sahara par
rapport aux pays développés ; ceci est une explication de la
littérature peu abondante sur les IDE dans ces pays (notamment en
Afrique subsaharien). Dans le cadre de notre étude, les données
utilisées proviennent d'un ensemble de publication de la banque mondiale
(WORLD DEELOPPEMENT INDICATORS, Global Economie prospect, global developpement
finance, 2005) regroupée dans un CD-ROM de la banque mondiale(2005) et
d'un ensemble de publications du FMI. A cause du problème de limitation
de données, l'échantillon que nous avons pu construire a une
taille de 36 observations datant de 1970 à 2006. Ces données sont
ensuite compilées dans Excel, et analysées en utilisant le
logiciel Econometric Views (Eviews 3.0). Une fois les données
recueillies, il convient maintenant de les traitées.
B) Traitement des données
Les variables économiques et financières
étant rarement des réalisations de processus stationnaire, et que
la non stationnarité à des conséquences fondamentales sur
le plan économétrique, il conviendra alors pour nous de
procéder aux tests de stationnarité des différentes
séries à étudier.
Pour cela, plusieurs méthodes de détection sont
possibles on a entre autre la méthode graphique (graphique de la
série et de la fonction d'autocorrection) et les tests de
stationnarités spécifiques (les tests de racine unitaires). En ce
qui concerne notre travail, nous nous intéresserons uniquement ici au
test de stationnarité spécifiques car les graphes ne fournissent
qu'une indication quant à la stationnarité ou non d'une
série. Une fois, les tests de stationnarité effectués, il
restera alors le problème du choix de la méthode d'estimation.
Si les tests indiquent une non stationnarité pour
toutes les séries et qu'en les différenciant une fois, elles
deviennent stationnaires, les techniques de co-intégration seront
appliquées. Dans le cas contraire, il sera procédé
à l'estimation par la méthode des MCO usuelle.
a) Les tests de stationnarité.
Avant de procéder à l'estimation du
modèle, il convient de s'assurer de la stationnarité des
séries observées, car lorsque les variables ne sont pas
stationnaires, l'estimation des coefficients par la méthode des moindres
carrés ordinaires (MCO) et les tests usuels des t-Students et f-Fisher
ne sont pas valides. Ceci dit, les coefficients estimés
ne convergeront pas vers leur vraie valeur. On dira ainsi que les
régressions sont fallacieuses.
Les méthodes graphiques de détection de la
stationnarité ou non des séries n'étant pas fiables, nous
utilisons des tests plus rigoureux: les tests de racine
unitaire.
Une question reste posée quant à la nature du
modèle à estimer compte tenu de la stationnarité ou non
des séries. Les différents tests nous permettront alors de faire
le choix du modèle approprié9 pour l'estimation de
notre équation d'attractivité.
Avant de présenter les résultats des tests de
stationnarité, nous présentons le cadre méthodologique
dans lequel ils sont effectués.
9 Nous faisons ici allusion au modèle total ou
modèle avec constante et avec tendance, le modèle fixe ou
modèle avec constante et sans tendance et le modèle
aléatoire ou modèle sans constante ni tendance
- Le cadre méthodologique des tests de racine
unitaire.
Parmi les tests de racine unitaire existants, nous utilisons
le test de Dickey Fuller augmenté, élaboré en 1979 et en
1981 par Dickey et Fuller. Ces tests sont les plus utilisés en raison de
leur simplicité, mais souffrent également d'un certain nombre de
critiques
Rappelons que le test de de Dickey Fuller augmenté
(ADF) considère trois modèles à la base pour une
série Xt, t = 1. ..,T (T étant le nombre total d'observations).
Nous avons ainsi le modèle sans constance ni tendance
déterministe que nous notons (1), modèle avec constance sans
tendance déterministe (2) et le modèle avec constance et tendance
déterministe noté (3).
Nous commençons par tester 1 'hypothèse nulle
Ho: de non stationnarité
contre l'hypothèse alternative
H1: de stationnarité
En se référant aux valeurs tablées par
Fuller en 1976 et Dickey et Fuller en 1979
et 1981. Il est à noter que le test de Dickey Fuller
augmenté se fait de façon
séquentielle en trois grandes étapes en allant du
modèle (3) au modèle (1). A
chaque fois, on commencera par tester la
significativité de la tendance du modèle (3) en se
référant aux tables de Dickey-Fuller. Si la tendance n'est pas
significative, on passe au modèle (2), et si plutôt la tendance
est significative alors on teste l'hypothèse nulle de racine unitaire
selon les modalités présentées précédemment.
S'il apparaît que la série est non stationnaire il faut la
différencier et recommencer la procédure de test sur la
série en différence première. Dans ce cas, la
procédure de test s'arrête et l'on peut travailler directement sur
la série Xt.
A l'étape 2 où on estime le modèle (2),
on commence par tester la significativité de la constante. Si la
tendance n'est pas significative, on passe au modèle (1) de
l'étape 3. Si par contre la constante est significative, on teste
également 1 'hypothèse nulle de racine unitaire et on
procède de la même façon qu'à la première
étape.
A l'étape 3, on teste directement l'hypothèse nulle
de racine unitaire.
Tout comme dans le cas du test ADF, trois modèles sont
aussi distingués dans le du test DF: le modèle sans constante ni
tendance déterministe (1 '); le modèle avec constante sans
tendance déterministe (2') et le modèle avec tendance
déterministe et
constante (3'). La mise en oeuvre du test DF est similaire
à celle du test de ADF, les statistiques du test sont aussi les
mêmes et seules les tables statistiques diffèrent.
Les résultats des différents tests de
stationnarité (au seuil de 5%) sont consignés dans le tableau ci
après.
Tableau4 : résultat des tests de
stationnarité sur les variables
VARIABLE
|
ADF en niveau
|
ADF en différence première
|
ADF CV
|
ADF CV
|
LANAL
|
3,7942
|
-1,9507*
|
-3,9955
|
-1,9507
|
LCR
|
-0,3062
|
-1,9507*
|
-3,6437
|
-1,9507
|
LDEN
|
1,0974
|
-1,9507*
|
-6,1625
|
-1,9507
|
LIDE
|
1,2202
|
-1,9583*
|
-3,6539
|
-1,9614
|
LOUV
|
2,6112
|
-1,9507*
|
-6,7557
|
-1,9507
|
LPNBHBT
|
2,1236
|
-1,9507*
|
-3,5164
|
-1,9507
|
LPOP
|
4,4944
|
-1,9507*
|
-3,7809
|
-1,9507
|
DS
|
-2.0737
|
-3.5426
|
-4.0000
|
-1.9510
|
Source : construction de l'auteur à partir des
résultats de Eview ( * ) Non stationnarité de la variable
Il ressort de ce tableau que toutes les séries sont non
stationnaires en niveau. Nous les savons ainsi rendus stationnaires en
différence première, notons tous de même que ces
séries sont toutes stationnaire avec le modèle (1)
c'est-à-dire, le modèle sans tendance ni constante.
Les tests de stationnarité que nous venons de faire
rassurent que toutes les séries utilisées sont bel et bien
stationnaire en différence première donc intégré
d'ordre un, ce qui nous amène alors à utiliser la méthode
d'estimation en deux étapes proposée par Engle et Granger.
Une question fondamentale reste posée : celle de savoir
si l'estimation de la relation de long terme conduit automatiquement à
l'estimation de la dynamique de court terme. Le test de racine unitaire sur le
résidu estimé nous permettra de confirmer ou non la relation de
co-intégration avant de passée à l'estimation du
modèle à correction d'erreur.
Dans la suite, il s'agira tout simplement de présenter
les cadres méthodologiques de l'estimation de la relation de long terme
et de l'estimation du modèle à correction, d'erreur.
b) Les tests de co-intégrations
Le point de départ de la théorie de la
co-intégration réside dans le fait que de nombreuses
séries macro-économiques et financières sont non
stationnaires. Or, si l'on applique les méthodes habituelles
d'estimation, deux principaux problèmes surgissent: le problème
des régressions fallacieuses ou spirious regressions mis en avant par
Granger et Newbold (1974) et le problème de la non validité de
certaines lois asymptotiques. Par exemple, les statistiques des tests de
Dickey-Fuller ne suivent plus une loi habituelle.
La théorie de la co-intégration permet ainsi
d'étudier des séries non stationnaires et dont une combinaison
linéaire est stationnaire. Elle permet ainsi de spécifier des
relations stables à long terme tout en analysant conjointement la
dynamique de court terme des variables considérées que nous
verrons dans la deuxième partie de cette section.
1) Le cadre méthodologique de l'estimation de la
relation de long terme.
Le cadre méthodologique de l'estimation de la relation de
long terme est celui proposé par Engle et Granger (voir en Annexe A0 le
test de Granger).
Selon Engle et Granger, deux séries non stationnaires
sont co-intégrées lorsque, leur combinaison linéaire suit
un sentier d'équilibre sans jamais s'éloigner pendant longtemps
de sa moyenne même si elles présentent des évolutions
divergentes. Autrement dit, qu'il existe une évolution stable à
long terme entre ces séries. La relation à estimer prend la forme
suivante:
Vt = â'Ft + Zt (5)
Où Vt est la variable expliquée, â' le
vecteur des coefficients des variables explicatives, Ft le vecteur des
variables explicatives et Zt le terme d'erreur. Zt peut s'écrire comme
une combinaison linéaire â'Ft normalisée par rapport
à Vt et peut prendre la forme suivante:
Zt= Vt- â'Ft (6)
La relation (6) n'est ainsi valable que si Ft et Vt sont
co-intégrées, c'est-à-dire que Zt stationnaire.
Engle et Granger (1987), Engle et Y00 (1987) proposent de
déterminer les relations de co-intégration existant dans un
système par une méthode en deux étapes.
Dans une première étape, on régresse par
les MCO les variables en niveau et l'on regarde si le résidu de cette
régression est stationnaire dans une seconde étape. Ceci dit,
pour le test de relation de co-intégration entre processus
intégrés d'ordre 1, on estime par les MCO une régression
statique de long terme entre les niveaux des variables et puis on applique les
tests de racine unité sur le résidu estimé
2) Les limites de l'estimation par la méthode de
Engle et Granger.
Bien que la méthode d'Engle et Granger fournît un
certain nombre de tests faciles à mettre en oeuvre, elle ne permet
néanmoins pas de distinguer plusieurs vecteurs de co-intégration.
Ceci pose alors un problème lorsqu'on veut étudier
simultanément N variables, avec (N > 2).
Afin de pallier cette difficulté, Johansen en 1988 a
proposé de tester directement dans le cadre d'un VAR en niveau les
relations de co-intégration. Cette approche permet par la méthode
de maximum de vraisemblance, d'obtenir tous les vecteurs de
co-intégration contrairement à l'approche d'Engle-Granger qui ne
tient compte que d'une seule relation de co-intégration, dans un cadre
multivarié. Et de ce fait, elle apparaît plus attrayante lorsqu'on
veut tester la co-intégration dans un système de plusieurs
variables.
L'approche de Johansen est basée sur deux tests sur les
valeurs propres du système à N variables. Le premier est
appelé statistique de la trace et teste qu'il existe
au moins r vecteurs de co-intégration dans un
système comportant N > r variables et le second dénommé
statistique de la valeur propre maximale qui teste qu'il existe exactement r
vecteurs de co-intégration contre l'alternative de r+1 vecteurs. Les
valeurs critiques de ces deux statistiques ont été
tabulées notamment par Johansen (1988) et Johansen et Juselius
(1990).
c) L'estimation de la relation de court terme: le
modèle à correction d'erreur.
En général, les modèles à
correction d'erreur permettent de modéliser les ajustements qui
conduisent à une situation d'équilibre de long terme. Ce sont en
fait des modèles dynamiques qui intègrent à la fois les
évolutions de court terme et de long terme des variables. Avant de
procéder à l'estimation du modèle à correction
d'erreur proprement dite au chapitre suivant, présentons tout d'abord
son cadre méthodologique.
1) Le cadre méthodologique de l'estimation du
modèle à correction d'erreur.
Le modèle à correction d'erreur décrit un
processus d'ajustement et combine deux types de variables: les variables en
différence première qui représentent les fluctuations de
court terme et des variables en niveau représentées par Zt.
combinaison linéaire stationnaire des variables non stationnaires, qui
assure la prise en compte du long terme. Soit donc la forme du
modèle:
p p P
AVt = y AZt-l + ?f31jAF1t-j +? f32jAF2t-j +...+
.?f3njAFnt-j + d(L).iyt (7)
J=O J=O J=O
OÙ : uyt est un vecteur bruit blanc, Zt = Vt - f3 'Ft est
le résidu de la relation de cointégration entre Vt et
FT, d est un vecteur polynôme fini en L.
Le modèle permet ainsi d'intégrer les fluctuations
de court terme représentées par les variables en
différence première autour de l'équilibre de long tenue
donné par la
relation de co-intégration où le coefficient y (y
< 0) appelé élasticité d'ajustement représente
la force de rappel vers la cible de long terme.
L'estimation de la relation (7) se fait par les moindres
carrés ordinaires. Les tests usuels de type fisher ou student sont
utilisés pour définir la significativité des
paramètres caractérisant la dynamique de court terme et ceci du
fait que toutes les variables du modèle sont intégrées
d'ordre zéro ou 1(0).
2) Les conditions d'estimation du modèle à
correction d'erreur.
Engle et Granger en proposant une méthode d'estimation
en deux étapes, enseignent qu'elle n'est valable que pour les
séries co-intégrées d'ordre (1,1). Ainsi, au cours de la
première étape de la méthode d'estimation, il est
important de vérifier que les séries sont bien
co-intégrées, c'est à dire que les résidus de la
relation de long terme sont bien stationnaires. En conséquence, si le
résidu n'est pas stationnaire, la relation de long terme est une
régression fallacieuse, il n'existe donc pas de relation de
cointégration entre les variable
|