2.2.1 Modèles généraux d'analyses
statistiques
Outre les vérifications des hypothèses
biologiques de départ, on tente d'expliquer les relations entre
variables. La compréhension du jeu de données s'acquiert
progressivement par des analyses bivariées qui permettent de mettre en
lumière les relations 2 à 2 des variables (notamment entre CAU et
variables explicatives), puis par des analyses multivariées pour estimer
les effets et interactions. Les facteurs explicatifs sont pour une
première approche supposés linéairement reliés au
CAU comme
proposépar François Limaux. On s'oriente donc
vers des modèles d'analyse linéaire, orientation
àconfirmer par des représentations graphiques et des
analyses des distributions des résidus. Ceci inclut des modèles
d'analyses de variances ou de régressions linéaires
(équation 2.11) .
Y = Xâ + E (2.11)
- Y : vecteur réponse;
- X : matrice des prédicteurs;
- â : vecteur des p + 1 paramètres;
- E : vecteur des résidus;
- E(E) = 0 et V(E) = ó2.
Les mesures faites sur un même essai partagent le
même effet aléatoire, elles sont donc corrélées.
Cette corrélation peut être induite par exemple par la nature
complexe du sol fortement variable
14
d'un essai àl'autre. Pour les prendre en compte, on a
recours àl'utilisation de modèles mixtes. De fait, chaque analyse
inclut les effets aléatoires année, essai et bloc. L'estimation
est réalisée par maximisation de la vraisemblance (ML) ou de la
vraisemblance restreinte (REML). ML est utilisée lorsqu'on souhaite
comparer des modèles emboîtés avec des structures d'effets
fixes différentes. REML propose une correction de la distribution de la
fonction de vraisemblance pour obtenir de meilleures estimations, moins
sensibles aux valeurs extrêmes (Crawley, 2007). L'écriture
matricielle des modèles d'analyses étudiés devient
l'équation 2.12.
y = Xfi + Zb + E (2.12)
- E Jf(0, a2I)
- b ~ Jf(0,W)
- E I b
y est le vecteur réponse de n
dimensions, X la matrice du modèle de dimensions
nxp pour le vecteur
des effets fixes fi de p dimensions. Z est la
matrice n x q pour le vecteur des effets aléatoires
b de
dimension q (Bates and DebRoy, 2004). Considérer
des effets aléatoires implique 5 hypothèses :
- les erreurs intra-groupes sont indépendantes,
d'espérance nulle et de variance a2 ;
- les erreurs intra-groupes sont indépendantes des effets
aléatoires;
- les effets aléatoires sont distribués selon une
loi normale de moyenne nulle et de matrice de
covariance W;
- les effets aléatoires sont indépendants dans les
différents groupes;
- la matrice de covariance ne dépend pas du groupe.
Pour vérifier ces hypothèses, différentes
méthodes peuvent être déployées, basées sur
l'observation
du résidu, des valeurs ajustées et des estimations
des effets aléatoires. Sur la base des estimations
des effets aléatoires, on quantifie la part de
variabilitéimputable àun facteur à travers une analyse
des composantes de la variance (Crawley, 2007).
|