b.4. Technique de Box et
Jenkins
Cette méthode est une technique d'extrapolation par
référence à une loi de reproduction du
phénomène étudié. L'information permettant de
mettre en évidence le processus est contenue dans la série
chronologique elle-même, sans apport externe, d'où le nom de
prévision endogène. Il s'agit donc de trouver la méthode
de prévision optimale qui emploie directement l'information contenue
dans la série. Pour atteindre cet objectif, il faut modéliser la
série chronologique en employant une classe de modèles
probabilistes suffisamment vaste. Ceci nous amène à
réintroduire les processus aléatoires, en nous limitant à
une classe de processus aléatoires stationnaires appelés les
processus ARMA et les cas particuliers appelés processus
autorégressifs et processus moyenne mobile. La méthode de Box et
Jenkins sera appliquée aux séries intégrées
(après différenciation) d'où le nom des modèles
ARIMA [3] [7].
i. Typologie des
modèles
Dans cette partie nous sommes intéressés
à définir trois types de modèles : modèle AR,
modèle MA et modèle ARMA.
· Modèle AR
(Auto Régressif)
Dans le processus autorégressif d'ordre p,
l'observation présente yt est générée
par une moyenne pondérée des observations passées
jusqu'à la p-ième période sous la forme suivante:
AR (1) = yt = Ô1 yt-1+ åt
AR (2) = yt = Ô1 yt-1+ Ô2 yt-2+ åt
.
.
.
AR (p) = yt = Ô1 yt-1+ Ô2 yt-2+...+ Ôp yt-p+
åt = (Ô1 B+ Ô2 B²+...+ Ôp Bp) yt + åt
Où : Ô1, Ô2, ..., Ôp :
paramètres à estimer positifs ou négatifs ;
åt : aléa gaussien et L'opérateur de retard
(« Lag ») B, tel que Bp yt =
yt-p
Le modèle de type AR apparaît comme un processus
où l'information présente est fonction des observations
passées et d'un terme aléatoire [6].
· Modèle MA (Moyenne
Mobile)
Dans le processus de moyenne mobile d'ordre q, chaque
observation yt est générée par une moyenne
pondérée d'aléas jusqu'à la q-ième
période dans le passé.
MA (1) = yt = åt - è1 åt-1
MA (2) = yt = åt - è1 åt-1 - è2
åt-2
.
.
.
MA (q) = yt = åt - è1 åt-1 - è2
åt-2 - .... - èq åt-q
Avec è1, è2,..., èq :
paramètres pouvant être positifs ou négatifs, et,
åt : aléa gaussien.
Dans ce processus, tout comme dans le modèle AR, les
aléas sont supposés être engendrés par un processus
de type `bruit blanc'. Tout terme åt est supposé
être une variable aléatoire gaussienne, de moyenne 0, de variance
ó², et de covariance Cov (åt,
åt')=0 pour t t'.
Nous pouvons interpréter le modèle MA comme
étant représentatif d'une série chronologique fluctuant
autour de sa moyenne de manière aléatoire, d'où le terme
de moyenne mobile car celle-ci, en lissant la série, « gomme
le bruit » crée par l'aléa.
· Modèle ARMA
Les modèles ARMA sont représentatifs d'un
processus généré par une combinaison des valeurs
passées et des erreurs passées.
ARMA (p, q) = yt = Ô1 yt-1 +
Ô2 yt-2+...+ Ôp yt-p + åt - è1
åt-1 - è2 åt-2 - .... - èq åt-q
ARMA (0, 1) = MA (1)
ARMA (2, 0) = AR (2)
ii. Conditions
d'utilisation
Les modèles AR, MA, ARMA ne sont représentatifs
que de chroniques stationnaires en moyenne (c'est-à-dire hors tendance)
et corrigées des variations saisonnières [3]. Au
cas où la chronique n'a pas été rendue stationnaire, un
modèle de type ARIMA (p, d, q) où d est le degré de la
courbe de tendance ou encore le degré d'intégration de la
série, permet d'intégrer dans le processus des
phénomènes de tendance. Il suffit alors pour une tendance
linéaire de passer aux différences premières (d = 1), pour
une tendance quadratique de passer aux différences secondes (d = 2),
etc.
Par exemple si yt est affectée d'une tendance
linéaire :
yt = a + b t
xt = yt - yt-1
xt = (a + b t) - (a + b (t-1)) = b :
xt est constant.
iii. Interprétation
d'un corrélogramme
Un corrélogramme est la représentation graphique
de la fonction d'autocorrélation, qui est un concept lié à
celui de corrélation [3]: il s'agit non pas d'un
calcul entre deux chroniques différentes mais entre la série et
elle-même à différents décalages dans le temps
permettant de déceler des liaisons internes à la série.
La principale difficulté revient à choisir le
modèle théorique qui correspond le mieux au profil de la
chronique. Deux optiques sont envisagées, soit le programme informatique
sélectionne lui-même celui qui semble d'un point de vue
statistique le mieux correspondre, soit l'utilisateur sélectionne selon
sa propre expérience le modèle adéquat.
Dans ce dernier cas, il peut être utile de donner la
forme des corrélogrammes correspondant aux modèles AR, MA, ARMA
et de prendre quelques exemples de corrélogrammes théoriques.
iv. Méthodologie de
Box et Jenkins
L'analyse de Box et Jenkins ne peut être
appliquée que si la série est rendue stationnaire. La fonction
d'autocorrélation est utile pour décider si une série est
stationnaire ou non. Au cas où elle est stationnaire, la fonction
d'autocorrélation décroît rapidement vers 0, sinon, la
fonction d'autocorrélation décroît vers 0 très
lentement.
La logique de Box et Jenkins se base sur la procédure
itérative. Cette procédure se décompose en trois
phases : collecte et analyse des données, identification,
estimation où l'on choisit le modèle adéquat
décrivant la nature des corrélations entre les données
disponibles dans le but d'émettre des prévisions [3]
[7].
· Collecte et analyse
des données
Box et Jenkins commencent par l'analyse des séries
temporelles ou chronique (série originales des données) afin de
la stationnariser. La représentation graphique de la série
originale permet de mettre en évidence la tendance de la série
dans le temps et de déterminer sa composante saisonnière, si elle
existe. Afin de stationnariser une série, Box et Jenkins proposent
d'utiliser la méthode des différences finies.
· Identification du
modèle
Box et Jenkins ont développé une
véritable méthodologie de recherche systématique d'un
modèle adéquat en fonction de l'étude des
corrélogrammes empiriques. Si ce dernier décroît d'une
manière ralentit vers 0, on peut dire qu'il s'agit d'un processus AR.
L'ordre du processus est déterminé à partir du
corrélogramme partiel. L'abscisse du dernier point qui se trouve
à l'extérieur des 2 bornes du corrélogramme partiel
correspond à l'ordre du processus. Si le corrélogramme
décroît d'une manière brusque vers 0, on peut penser qu'il
s'agit d'un processus MA. A l'inverse du processus AR (p) pour lequel
l'autocorrélation s'annule graduellement, la fonction
d'autocorrélation d'un processus MA (q) s'annule après le retard
q.
·
Estimation
Une fois le processus est identifié, on passe à
l'étape suivante à savoir l'estimation.
Généralement, elle peut être obtenue par des
procédures spéciales tel que les moindres carrés non
linéaires et /ou la méthode du Maximum de vraisemblance. Il faut
signaler qu'à ce stade, on peut avoir des indications sur
l'adéquation du modèle. Il s'agit de vérifier l'ordre du
processus et l'hypothèse selon laquelle les åt sont des bruits
blancs à partir des tests bien spécifiques.
|