B/ La méthode
d'estimation
Certains avantages peuvent être avancés pour
l'utilisation des données de panel par rapport aux données en
coupe ou chronologiques [Hsiao (2003)]. Les données de panel
présentent généralement moins de
multicollinéarité que des données en coupe ou des
données chronologiques et permettent des estimations plus
précises des paramètres. La complexité des comportements
des individus étudiés est souvent mieux décrite. Les
problèmes soulevés par la non-stationnarité des
séries chronologiques et les erreurs d'estimations sont
réduits.
(3)
Il existe plusieurs méthodes d'estimation. Le choix de
la méthode dépend des hypothèses que l'on effectue sur les
paramètres et sur les perturbations. Lorsque l'on considère un
échantillon de données de panel, la toute première chose
qu'il convient de vérifier est la spécification homogène
ou hétérogène du processus générateur de
données. Sur le plan économétrique, cela revient à
tester l'égalité des coefficients du modèle
étudié dans la dimension individuelle. Sur le plan
économique, les tests de spécification reviennent à
déterminer si l'on est en droit de supposer que le modèle
théorique étudié est parfaitement identique pour tous les
pays, ou au contraire s'il existe des spécificités propres
à chaque pays. Soit le modèle :
L'hétérogénéité, ou effet
individuel, correspond à où contient un terme constant et un ensemble de variables
spécifiques aux individus. Trois méthodes d'estimation peuvent
être envisagées selon le caractère de :
- une estimation par les moindres carrés ordinaires
lorsque ne contient qu'un terme constant;
- une estimation avec effets fixes lorsque est non observé, mais corrélé avec ;
- une estimation avec effets aléatoires lorsque
l'hétérogénéité individuelle non
observée est supposée non corrélée avec les
paramètres.
Le choix entre les différentes estimations s'appuie sur
trois tests statistiques :
- la statistique F ou statistique de Fischer qui permet de
comparer une estimation avec ou sans effets fixes ;
- le multiplicateur de Lagrange (LM) proposé par Breush
et Pagan (1980) teste la pertinence des effets aléatoires contre les
effets fixes, la statistique LM suit un chi-deux à un degré de
liberté ;
- le test de spécification de Hausman (H) (1978) permet
de comparer l'estimation avec effets aléatoires à celle par les
moindres carrés ordinaires, la statistique H suit un chi-deux à
K-1 degrés de liberté.
Mais nous allons ici nous concentrer sur un autre type de
modèle linéaire: les modèles avec un mélange
d'effet (Mixed Effect) hiérarchisé ou à multi niveaux
(Mixed effect and hierarchical multilevel model) autrement dit le modèle
avec coefficient fixe et aléatoire, proposé par Hsiao (1989). A
la différence des autres modèles, le modèle avec
Mélange d'effet permet d'éviter les différents tests de
spécification (effet fixe, effet aléatoire, test d'Haussman), qui
de façon générale rendent long la spécification des
modèles avec panel et surtout ne fournissent pas des estimateurs assez
fiables et robustes. Le modèle à effet mélangé est
le plus souvent présenté comme solution statistique au traitement
d'une information qui est emboitée en plusieurs niveaux d'observation.
Il apporte un début de réponse statistique à la
combinaison, dans le même modèle, d'observations faites au niveau
micro comme macro, concernant l'individu en même temps que le groupe
social ou l'institution qui l'accueille et l'influence (Delaunay D., 2006).
Dès lors nous disposons ainsi des bases méthodologiques d'une
analyse contextuelle. De façon générale, les exemples
classiques sont empruntés aux sciences de l'agriculture et aux sciences
de l'éducation. En effet celle-ci essaie d'expliquer les performances de
l'élève à une date ou période donnée comme
une fonction cumulative des facteurs relevant de l'élève lui
même, de la famille, de l'école et de la communauté (Diagne
A. , Kafando I., Ounteni M., 2006).
Baltagi, Song, and Jung (2001) estime une fonction de
production de type COBB DOUGLAS qui mesure l'impact du capital public sur la
productivité du secteur privé dans des Etats américains au
nombre de 48 et regroupé en 9 régions de 1970 à 1986. Ils
utilisent la méthode d'estimation des effets mixtes et à
multiniveau. Le niveau 1 sera représenté par l'Etat et le niveau
2 par la région. Les résultats montrent que le capital public est
significatif et positif.
Pour l'estimation de notre modèle de croissance, les
performances économiques (PIB) sont regroupées par année
et les années par pays de l'UEMOA. Dès lors une observation sur
le pays est attribuée à chaque année de la période
de l'étude. Dans ces conditions l'utilisation de la méthode de
régression multiple classique risque de fournir des résultats
biaisés (Steven W. Bryk et Raudenbush, 2002). Un modèle
linéaire à effet mixte et de croissance sera utilisé car
il a pour vertu de modéliser explicitement le problème des
niveaux (Level). En outre, ce modèle présente les estimations
linéaires non biaisées des paramètres. Ils sont
spécialement conçus pour palier les limites des MCO et MCG.
Notre modèle de croissance comportera dès lors
deux niveaux. Le niveau 1 (Level 1) sera le temps (année) qui est
utilisé pour estimer la différence entre les PIB obtenus par
chaque pays (intra individu), quant au niveau 2 (Level 2), nous permet de
comparer les différences entre les pays (inter individu) dans les
résultats de performance économique (PIB). Les paramètres
associés à ces deux niveaux sont aléatoires, on parle de
Random effect (effet aléatoire). La structure générale du
modèle se présente ainsi (Bryk et Raudenbush, 1992 ;
Goldstein, 1995): soit :
(4)
Dans cette équation, et représentent respectivement une variable expliquée et une
variable explicative, caractérisant l'individu du groupe j. représente la constante (valeur de y quand x est nul), est la pente de la droite de régression de y sur x, et représente une erreur aléatoire associée à
chaque individu i du groupe j de moyenne nulle et de variance .
(5)
Le modèle à effet mixte s'écrira donc
alors :
Oý les constantes et les pentes se voient attribuer un
indice j qui indique qu'elles peuvent varier d'un groupe ou niveau, à
l'autre. Les coefficients, constante et pente, sont donc maintenant rendus
aléatoires, ce qui signifie que leurs valeurs sont supposées
distribuées selon une fonction de probabilité (Kreft et De leeuw,
1998). Cette nature aléatoire des coefficients apparaît plus
clairement quand on les décompose en niveau. On peut alors
écrire :
Oý représente la constante moyenne pour tous les groupes ou
niveau : la pente moyenne pour tous les niveaux : représente l'écart de chaque niveau à la constante
( c'est-à-dire une variable aléatoire de moyenne nulle et de
variance ) ; représente l'écart de chaque groupe ou niveau à la
relation moyenne( c'est-à-dire une variable aléatoire de moyenne
nulle et de variance ). On peut estimer un paramètre supplémentaire, la
covariance entre les constantes et les pentes, .
En intégrant dans une même équation on
obtient :
|