2.2.2. Détermination de la distribution à
priori
Le théorème de Bayes, introduit par Thomas Bayes
et généralisé par Simon Laplace, est largement
utilisé dans de nombreuses applications en tant qu'outil puissant pour
l'inférence statistique. Conformément à la loi de Bayes,
nous avons l'équation suivante :
??(??|??) = ??(??|??) ??(??)
??(??)
Distribution à priori è x fonction de
vraisemblance y = Distribution à posteriori è ;
C?????????????? ?? ???????????? x ???????????????? ????
?????????????????????????? = C?????????????? ?? ????????????????????
Toutefois, la distribution à priori suppose une loi
définie par le modélisateur pour déterminer la
distribution à posteriori après combinaison avec l'information
disponible. L'étape la plus délicate de l'approche
bayésienne réside dans la détermination de la distribution
à priori, qui reflète l'état d'esprit des
décideurs. En effet, un mauvais choix de celle-ci peut nuire à
l'ensemble des résultats du modèle, ce qui peut ensuite
influencer les chocs du stress test. Pour cette raison, de nombreux auteurs
accordent une grande importance au choix des meilleures distributions à
priori pour obtenir de bons résultats.
Plusieurs articles de recherche ont abordé la question
des distributions à priori, ainsi que de nombreux travaux récents
sur le sujet. Parmi ces travaux, citons celui de (Waggoner & Zha, 2003),
qui suppose que la meilleure distribution à priori pour un modèle
????????(6) avec des données trimestrielles est la suivante :
??0 = 1,??1 = 0.2 ,??3 = 1,??4 = 1,??5 = 1 ???? ??6
= 1
???? : Contrôle le degré de
confiance dans les coefficients de la matrice des effets instantanés ??0
et il s'agit d'un réel appartenant à l'intervalle [0,1].
???? : Indique le niveau de confiance par
rapport à l'hypothèse proposée par Litterman, qui suppose
que chaque variable suit une marche aléatoire, c'est un réel
appartenant à [0,1].
???? : Contrôle le taux de
décroissance de la variance des données compte tenu de
l'augmentation du retard avec ??3 = 0.
???? : L'écart type autour de la
tendance déterministe avec ??4 = 0. Ce paramètre
représente la variabilité résiduelle des données
après avoir soustrait la tendance.
???? : L'écart type autour des
coefficients des variables exogènes. Si ??5 = 0, cela signifie que
l'estimation des coefficients est relativement précise. Il s'agit d'une
spécificité de la précision
58
bayésienne, donc à ne pas modifier pour limiter
les chocs à la réflexion des décideurs lors de leur
lecture des données.
???? = ?? : il s'agit des observations Dummy
pour améliorer les performances des prévisions.
???? = ?? : il s'agit de l'à priori de
la racine unitaire, ce qui permet de remettre en cause les problèmes de
la stationnarité des séries.
Ainsi, pour aboutir à la meilleure distribution
à priori, on simulera plusieurs cas des figures, selon la variation des
différents hyperparamètres, et nous choisirons l'ensemble de ces
derniers qui nous offrirons la meilleure estimation, la meilleure
prévision et la meilleure information représentative du
modèle. Pour ce faire, notre choix se basera sur les trois indicateurs
statistiques suivants :
- RMSE : la racine carrée de l'erreur quadratique moyenne
; - MAE : l'erreur absolue moyenne ;
- LogMDD : le logarithme de la densité marginale.
Par conséquent, notre procédure de choix se
déroulera comme suit :
- Nous sélectionnons la distribution qui fournit la plus
faible RMSE.
- Nous sélectionnons la distribution qui fournit la plus
faible MAE.
- Si nous obtiendrons la même distribution, alors nous
s'arrêtons.
- Si non ; nous choisirons la distribution qui a la plus grande
densité marginale.
En utilisant la commande «SZ.prior.evaluation» de
package « MSBVAR » du logiciel R, qui donne pour chaque combinaison
des hyperparamètres, les indicateurs statistiques (RMSE, MAE et
LogMDD).
En tenant compte du domaine de définition de chaque
hyperparamètres, nous ferons varier les valeurs de ces derniers,
jusqu'à l'obtention de la meilleure combinaison.
- Première simulation :
A0 = A1 = (0.1,0.2,0.3) ; A3 =
A4 = (1,2,3) ; I5 = I6 = 1
|
????
|
????
|
????
|
????
|
????
|
????
|
????
|
RMSE
|
MAE
|
logMDD
|
RMSE
|
0,3
|
0,3
|
1
|
3
|
0
|
1
|
1
|
2.362193
|
_
|
639.0717
|
MAE
|
0,3
|
0,3
|
1
|
3
|
0
|
1
|
1
|
_
|
1.265337
|
639.0717
|
Toutefois, nous remarquons que les hyperparamètres A0, A1,
A3 et A4 prend ses valeurs
possibles maximales. En d'autres termes, pour
l'hyperparamètres A0 une valeur supérieure à
0.3 pourrait nous fournir une meilleure densité à priori. Par
conséquent, nous recourons à une deuxième simulation.
59
- Deuxième simulation :
A0 = A1 = (0.3,0.4,0.5) ; A3 = (0,0.5, 1) ; A4 =
(10,20,30) ; I5 = I6 = 1
|
A??
|
A??
|
A?? A??
|
A??
|
i??
|
i??
|
RMSE
|
MAE
|
logMDD
|
RMSE
|
0,5
|
0,5
|
0 30
|
0
|
1
|
1
|
2.146183
|
_
|
559.7508
|
MAE
|
0,5
|
0,5
|
0 30
|
0
|
1
|
1
|
_
|
1.115123
|
559.7508
|
Néanmoins, la constatation que les hyperparamètres
A0, A1 et A4 atteignent leur valeur
maximale possible nous a poussés à effectuer une
troisième simulation. - Troisième simulation
:
A0 = A1 = (0.5,0.6,0.7) ; A3 = 0
; A4 = (30,60,100) ; I5 = I6 = 1
|
A??
|
A??
|
A??
|
A??
|
A??
|
i??
|
i??
|
RMSE
|
MAE
|
logMDD
|
RMSE
|
0,7
|
0,7
|
0
|
100
|
0
|
1
|
1
|
2.098788
|
_
|
501.2995
|
MAE
|
0,7
|
0,7
|
0
|
100
|
0
|
1
|
1
|
_
|
1.079721
|
501.2995
|
Cependant, il est important de noter que les
hyperparamètres A0, A1 et A4 atteignent leur valeur
maximale possible, ce qui nous a incités à
procéder à une quatrième simulation. -
Quatrième simulation :
A0 = A1 = (0.7,0.8,0.9) ; A3 = 0
; A4 = (100,200,300) ; I5 = I6 = 1
|
A??
|
A?? A??
|
A??
|
A??
|
i??
|
i??
|
RMSE
|
MAE
|
logMDD
|
RMSE
|
0,9
|
0,9 0
|
300
|
0
|
1
|
1
|
2.073019
|
_
|
463.8065
|
MAE
|
0,9
|
0,9 0
|
300
|
0
|
1
|
1
|
_
|
1.070217
|
463.8065
|
Cependant, nous avons observé que les
hyperparamètres A0, A1 et A4 atteignent leurs valeurs
maximales possibles. Par conséquent, nous avons
décidé d'effectuer une cinquième simulation.
Cinquième simulation :
A0 = A1 = (0.9, 1) ; A3 = 0 ;
A4 = (300, 400,500,600,700,800,900) ; I5 = I6 = 1
|
A?? A?? A??
|
A??
|
A??
|
i??
|
i??
|
RMSE
|
MAE
|
logMDD
|
RMSE
|
1 1 0
|
600
|
0
|
1
|
1
|
2.065220
|
_
|
449.6753
|
MAE
|
1 1 0
|
600
|
0
|
1
|
1
|
_
|
1.068554
|
449.6753
|
Cette fois, les hyperparamètres A0, A1
et A4 ont abouti à des valeurs intermédiaires ou
maximales. Par conséquent, nous arrêtons le processus de
simulation des distributions à priori. Certes, nous avons
multiplié les simulations afin de tomber sur une meilleure distribution
à priori. Mais, afin d'affirmer sur la meilleure qualité de la
distribution à priori retenue suite à la cinquième
simulation, nous comparerons tous les résultats retenus
précédemment. Nous considèrerons aussi, les
hyperparamètres de référence de l'article de Sims et Zha.
(Annexe9)
60
Tableau 8 : Les résultats des simulations pour le
choix de la distribution à priori
Simulation
|
????
|
????
|
????
|
????
|
????
|
????
|
????
|
RMSE
|
MAE
|
logMDD
|
Priori 1
|
0.3
|
0.3
|
1
|
3
|
0
|
1
|
1
|
2.362193
|
1.265337
|
639.0717
|
Priori 2
|
0.5
|
0.5
|
0
|
30
|
0
|
1
|
1
|
2.146183
|
1.115123
|
559.7508
|
Priori 3
|
0.7
|
0.7
|
0
|
100
|
0
|
1
|
1
|
2.098788
|
1.079721
|
501.2995
|
Priori 4
|
0.9
|
0.9
|
0
|
300
|
0
|
1
|
1
|
2.073019
|
1.070217
|
463.8065
|
Priori 5
|
1
|
1
|
0
|
600
|
0
|
1
|
1
|
2.065220
|
1.068554
|
449.6753
|
Priori SZ
|
1
|
0,2
|
1
|
1
|
0
|
1
|
1
|
2.110103
|
1.156807
|
256.6349
|
Source : préparer par l'auteur à l'aide de
logiciel R-CRAN
D'après le tableau ci-dessus, nous remarquons que la
combinaison qui nous offre le couple (RMSE, MAE) le plus faible est celle de la
cinquième simulation. Par conséquent nous retenons une
distribution à priori avec les hyperparamètres suivants :
??0 = 1,??1 = 1 ,??3 = 0,??4 = 600,??5 = 1 ???? ??6
= 1
|