3.2.2.2 Extension aux données de panel
Le modèle présenté ci-dessus
étudie un ensemble de variables temporelles pour un seul individu. Qu'en
est-t-il d'une spécification des données de panel comme dans le
cas de notre étude? Nikolaos Zirogiannis et Yorghos Tripodis [54]
proposent une généralisation du modèle d'analyse
factorielle dynamique pour répondre à cette interrogation. Il
utilisent ensuite les résultats pour le calcul d'un indice
synthétique annuel de performances pour la comparaison des
collectivités locales par rapport aux performances dans le secteur de
hydraulique.
Dans le cadre de cette extension, on considère
Yij,t comme l'ensemble des données
disponibles sur chacun des i = 1, ... , N observations et pour chacune
des j = 1, ... , J variables. t = 1, ... , T
représente toujours le temps. Nous adoptons les notations suivantes
:
(i) Yij est une matrice
(T x 1) des observations pour i et j
fixés;
(ii) Yt est une matrice (NJ x
1) des observations pour t fixé. Le modèle
s'écrit sous la forme suivante :
Yt = A ·
Ft + ít
ít ^-> ./V(0,D)
(3.12)
Ft = B ·
Ft-1 + çt
çt ^-> ./V(0, Q)
(3.13)
Dans cette approche, A est la matrice (NJ x
J) des paramètres ; B, une matrice (N x
N) des auto-corrélations des facteurs. Dans cette
représentation de type espace-état, la relation 3.12 est
l'équation de mesure et la relation 3.13 est l'équation
d'état (ou de transition). Par hypothèse, on pose
E(Ft ·
ít) = E(Ft ·
çt) = E(ít
· çt) = 0 (3.14)
L'estimation de ce modèle est plus délicate
à cause de la grande taille de la matrice des données
Yt. Les paramètres à estimer
étant les matrices A, B, D et Q, la
vraisemblance du modèle se met
Brice Baem BAGOA, Elève Ingénieur des
Travaux Statistiques Page 31
3.2. Elaboration de l'ISP
sous la forme
L(A,B,D,Q,Y1,...,YT) =
YT f (Y1) ·
fY (Yt, A, B, D,
Q|It-1) (3.15)
t=2
où It-1
est la ó-algèbre des valeurs passées
(Y1,...,Yt-1). Les auteurs de cette
extension de l'analyse factorielle dynamique aux données de panel ont
introduit un algorithme d'estimation du modèle défini par les
équations 3.12 et 3.13. Celui-ci nommé Two-Cycle Conditional
Expectation-Maximization (2CCEM) algorithm procède à une
estimation par deux cycles d'itérations, le premier cycle consistant
à estimer les paramètres A et D et le second
permettant d'estimer les matrices B et Q. Les détails
sur l'algorithme 2CCEM peuvent être consultés dans [54].
3.2.2.3 Construction de l'ISP par AFD
Une fois l'estimation des paramètres achevée,
les facteurs Ft peuvent être bien
déterminés. L'indicateur sectoriel de performances est donc
l'espérance de ces facteurs communs, conditionnellement à
l'information disponible à la date t - 1.
ISP(t) = E(Ft|It)
(3.16)
Pour chaque secteur, il convient de bien choisir les variables
qui entrent dans la constitution de l'indice, autrement dit les variables de la
matrice Y . Pour notre étude, nous calculons l'ISP pour les
régions. Selon les besoins de l'USPITE, nous retenons les secteurs de
l'agriculture et de l'éducation (ISPA et ISPE) . Le tableau 3.2
résume les variables sélectionnées pour chacun de ces
secteurs selon la disponibilité et la pertinence. Pour finir,
l'indicateur obtenu sera normalisé de sorte à ce qu'il soit
compris entre 0 et 1 :
ISP(t)i -
ISP(t)min
ISP (t)norm =
(3.17) ISP(t)max -
ISP(t)min
Notons que cette normalisation est susceptible d'introduire
des fluctuations importantes d'une année à l'autre pour une
même région. L'ISP doit donc être interprété
en terme de note relative d'une région par rapport aux autres et non en
terme absolu.
L'application de l'AFD exige que les séries en
entrée soient stationnaires. Au cas contraire une autre approche devra
être adoptée.
|