3.2.2.4 Synthèse des ajustements
linéaires
Chaque facteur est porteur d'une information qui permet de mieux
comprendre les évolutions
du CAU.
|
À chaque étape, le modèle
sélectionnéest globalement inclus dans le modèle
sélectionné
|
à l'étape suivante. L'effet aléatoire de
l'essai apparaît continuellement comme très significatif, il est
responsable d'une grand part de variabilitéque les variables introduites
ne permettent pas d'expliquer. Une connaissance plus fine
àl'échelle de l'essai peut donc se révéler
déterminante dans la prédiction d'un CAU. Du côtédes
effets fixes, le modèle 4 semble être le plus explicatif du CAU,
notamment
à travers les variables pluviométriques et
l'INN. En revanche, la VC ne semble pas significative
àl'exception de l'interaction avec la variable
pluviométrique.
L'examen du résidu, obtenu pour chacun des
modèles proposés montre une amélioration, en augmentant la
complexitédu modèle on disperse les estimations qui se
rapprochent un peu plus des valeurs observées et le résidu se
concentre de plus en plus autour de 0 (fig. 3.17). Enfin, d'un point de vue des
prédictions permises par ce modèle si la qualitédes
ajustements s'est améliorée, il est possible que l'augmentation
du nombre de paramètres dans le modèle soit responsable d'un
sur-ajustement. On étudie donc l'évolution de la REQMP du
modèle nul jusqu'au modèle 4. La figure 3.18 montre
l'évolution du REQMP. Globalement le REQMP est mauvais, les ajustements
ne sont pas de bonne qualité, l'incertitude autour des
prédictions est grande, ces modèles ne sont donc pas d'une grande
qualitéprédictive, même s'ils apportent une
amélioration par rapport au modèle nul. On passe ainsi d'une
REQMP de 22,2 à 21,1.
Évolution du REQMP (unité de
CAU)
RMSEP (leave-one-out)
20 21 22 23 24 25
l
l
0 1 2 3 4
Modèles
Figure 3.18 - Évolution du REQMP entre le modèle
nul et le modèle 4
Le dernier modèle produit montre un effet
aléatoire de l'essai sur la moyenne de la relation et sur la pente
liée àla pluviométrie : d'un essai àl'autre, on
observe des écarts à la relation plus ou moins grands. Sur la
base de la différence de chaque essai àla relation
générale, on tente de rendre compte de l'existence de groupes
d'essais qui seraient proches du point de vue de ces écarts au
modèle global. On propose donc une classification ascendante
hiérarchique (CAH, agrégation méthode Ward) qui aboutit
àla construction de trois groupes que les variables
caractéristiques des essais décrivent (fig. 3.19). Les effets de
ces variables sont testés par un test V et mettent en avant le
rôle de la variété, de la longitude, du pH et de la CEC du
sol dans la caractérisation des groupes (annexe X). On retrouve
làdeux aspects : un aspect purement biologique et un aspect
pédologique, dépendant de l'essai. Ce sont autant de pistes
suggérées àexplorer dans un prochain travail de
modélisation, qui n'entre pas dans le cadre de l'étude de la
relation du CAU àla VC, l'INN et la pluviométrie.
Factor map Cluster Dendrogram
Dim 2 (43,85%)
-3 -2 -1 0 1 2 3
Height
0,0 0,2 0,4 0,6 0,8
11
28
20
13 1 6
27
30
26 5 3 8
25
29 9
21 7
15
16
32
34
17
31
23
12
33
24
18
19
22
14 4 2
10
cluster 1 cluster 2 cluster 3
39
-3 -2 -1 0 1 2
Dim 1 (56,15%)
Figure 3.19 - CAH sur les écarts au modèle
général du modèle 4 selon les essais 3.2.3
Modélisation non linéaire
La construction d'un modèle linéaire ne donne
pas de résultats satisfaisants. D'après les travaux de
François Limaux la VC permet d'expliquer l'évolution du CAU mais
cette relation ne se vérifie pas au regard de nos résultats sur
l'ensemble du cycle de culture. Mais comme préciséplus tôt
la relation de François Limaux est limitéà des stades pour
lesquels la VC est inférieure à 0,80 (fig. 3.15, 31). Cette
observation démontre un plafonnement de la relation, qu'il est possible
de traduire par une régression asymptotique, c'est à dire une
expression exponentielle.
Le choix de la relation se porte vers une équation
àtrois paramètres (équation 3.9). Sur cette base, on
inclut l'effet du fertilisant qui peut avoir un impact sur un ou plusieurs
paramètres du modèle. On sélectionne les paramètres
du modèle sur la base de la minimisation du BIC. Le modèle qui
minimise le plus le BIC est un modèle dont l'asymptote varie avec le
fertilisant employé. Ceci semble cohérent au regard des
résultats précédents pour lesquels la forme du fertilisant
est le facteur le plus important pour déterminer un CAU. Les
résultats sont encourageants, en incluant le seul effet de la VC et du
fertilisant employé(tab. 3.17). Les paramètres obtenus apportent
de l'information comme le montre la représentation graphique (fig.
3.21). La fonction représente bien deux phases, une phase ou la relation
entre VC et CAU semble linéaire et évolue très rapidement,
puis tend vers une asymptote pour des valeurs de VC supérieures à
0,3g MS m-2dj-1. Par
la suite on tente d'ajouter les effets linéaires de l'INN, la
pluviométrie et leur interaction. Les représentations graphiques,
et les différentes transformations des données ne permettent pas
de révéler une structure particulière des données,
on s'appuie donc sur les résultats des modèles mixtes pour
supposer la relation linéaire (fig. 3.14 page 30). Les effets sont
supposés additifs àl'expression du CAU en fonction de la VC, on
estime des paramètres initiaux à partir des premiers tours d'un
algorithme de back fitting. Parmi l'ensemble des modèles possibles, seul
un modèle incluant l'effet de la pluviométrie apporte de
l'information
(équation 3.10, tab. 3.18). Ce paramètre permet de
nuancer l'effet de la VC : en s'intéressant àl'effet
marginal de cet effet on voit qu'il peut faire varier de -5 à + 10
unités de CAU (fig. ??). Cette
information est significative au regard d'une comparaison des
sommes de carrés des écarts résiduels entre modèle
1 et modèle 2 (tab. 3.19).
CAU = Asym + (RU - Asym)
· exp- exp(lrc) V C (3.9)
CAU = Asym + (R0 - Asym) · exp- exp(lrc)
V C +â · pl (3.10)
CAU estimé
CAU observé
20 60 100 140
l
l
l
l
l
l
l
l
20 60 100 140
CAU estimé
Résidu centré réduit
-3 -1 1 2 3 4
65 75 85
l
l
l
l
l
l
l
l B
l
l
l
l
l
l
·
0,0 0,5 1,0 1,5
CAU
20 40 60 80 100 120 140
l
l
l
l
l
l
l
Kf + (R0 - Kf)e(-exp(lrc)VC)
vc
40
Figure 3.20 - Ajustement du modèle non linéaire
1. Représentation de l'effet de la VC, du résidu du modèle
et de la confrontation entre données estimées et données
observée
On détermine alors des REQMP des deux modèles
pour les comparer entre eux et s'assurer que l'ajout de la variable
pluviométrique n'est pas une surparamétrisation du modèle.
De cette manière, la REQMP descend respectivement à 20,93 et
20,60. En comparaison au dernier modèle linéaire ajusté,
avec un paramètre de moins on obtient une REQMP bien inférieure,
proche de 20.
Table 3.17 - Estimation des paramètres du modèle
non linéaire (VC)
Estimate Std. Error t value Pr(>Itl)
Asym1 87,45 1,54 56,62 0,00
Asym2 70,07 1,46 47,91 0,00
R0 60,38 5,01 12,06 0,00
lrc 2,31 0,40 5,82 0,00
Table 3.18 - Estimation des paramètres du modèle
non linéaire (VC + pl)
Estimate Std. Error t value Pr(>Itl)
Asym1 87,54 1,46 60,06 0,00
Asym2 70,26 1,43 49,11 0,00
R0 55,97 5,65 9,90 0,00
lrc 2,46 0,36 6,80 0,00
b 1,51 0,38 3,97 0,00
Effet marginal VC
0 50 100 150
CAU
- 5 0 5 10
CAU
l
l
l
l
l
l
Kf + (R0 - Kf)e(-exp(lrc)VC) + b × pl
l
l
l
l
l
l
l
l
l
l
l
l
l
l
- 3 -2 -1 0 1 2 3
Résidu centré réduit
0,0 0,5 1,0 1,5
VC
Effet marginal pl
-4 -2 0 2 4 6
CAU observé
l
l
l
l
pl (ACP)
20 60 100
60 70 80 90
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
CAU estimé
20 60 100
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
CAU estimé
41
Figure 3.21 - Ajustement du modèle non linéaire
2. Représentation des effets marginaux de la VC et de la
pluviométrie pl, du résidu du modèle et de la
confrontation entre données estimées et données
observée
42
Table 3.19 - Comparaison des modèles obtenus par
régression non linéaire après ajout de la variable
pluviométrique
Res.Df Res.Sum Sq Df Sum Sq F value Pr(>F)
1 661 340216,55
2 660 332258,15 1 7958,41 15,81 0,0001
43
4 Discussion - conclusion
L'élaboration d'un modèle explicatif du CAU
permet de mettre en évidence les effets des variables:
- le fertilisant est le facteur le plus déterminant. Il
quantifie la différence de réponse en terme de valorisation de
l'engrais entre un apport d'ammonitrate et un apport de solution azotée
à 39%. La nature de la relation du CAU aux autres variables n'est pas
modifiée quelque soit le fertilisant employé, puisque l'effet du
fertilisant n'est en interaction ni avec l'INN, ni la pluviométrie, ni
la VC. Les CAU à la récolte sont améliorés ou
pénalisés selon la matière fertilisante apportée.
Cette idée se retrouve en modélisation non linéaire du CAU
en fonction de la VC oùle seul paramètre qui dépende du
fertilisant est l'asymptote de la relation ;
- la pluviométrie : cet effet est important.
Globalement, un contexte de régime hydrique humide permet une meilleure
valorisation de l'engrais, probablement à travers une mise en solution
de l'azote améliorée;
- la VC : d'un point de vue non linéaire la relation
qui lie le CAU à la VC est de type exponentielle. La réponse
évolue rapidement pour atteindre une asymptote. L'effet de la VC semble
donc déterminant pour des VC plus faibles (entre 0 et 0,5g MS
m-2dj-1);
- l'INN : l'état de nutrition azotée de la culture
influe sur la réponse au CAU;
- la pluviométrie en interaction avec la VC et l'INN :
les effets de l'INN et de la VC dépendent de la pluviométrie.
Les modèles obtenus ne sont pas d'une grande
précision mais confirment les hypothèses agronomiques
posées. Ainsi, l'hypothèse de Limaux (1999) est
vérifiée : il existe un lien entre VC et CAU. Compte tenu de la
variabilitéentre essais nos résultats corroborent pour partie les
conclusions de Limaux (1999). Les hypothèses proposées par Le
Souder et al. (2007) sont soutenues par les travaux, appuyant l'importance de
la pluviométrie et l'influence de l'INN dans la réponse
observée à l'azote apporté. Enfin, la forme du fertilisant
conditionne effectivement le CAU comme le présente Recous et al.
(1997).
Bien que les qualités explicatives du modèle
soient avérées, le pouvoir prédictif est beaucoup plus
limité. L'incertitude du modèle se décompose
principalement dans l'erreur résiduelle (qui s'explique par la
variabilitéforte intrinsèque àl'estimation du CAU) et la
variabilitéentre essais. D'un point de vue méthodologique, la
variabilitéforte de l'estimation du CAU pose une question : comment
affiner l'estimation de cette valeur? En effet, travailler sur une valeur mieux
définie permettrait de clarifier les relations entre CAU et variables
explicatives.
Par ailleurs, une stratégie de type leave-one-out
a étéadoptée pour le calcul des REQMP. Toutefois,
étant donnéles structures de corrélations induites par
l'effet aléatoire de l'essai, les données d'un même essai
apporte une information redondante. Retirer un individu ne retranche pas toute
l'information qu'il véhicule puisque les autres individus sont encore
présents. De ce constat on peut affirmer que la procédure de
validation REQMP adoptée présente un biais puisqu'en toute
rigueur ce sont l'ensemble des données d'un essai qui devraient
être retirées dans les phases d'apprentis-sage/prédiction.
Faute de temps, la mise en oeuvre d'une nouvelle fonction pour calculer un
REQMP pour lequel le nombre de données exclues correspondrait aux
individus d'un essai n'a pas étéréalisé.
Le développement du modèle VC (Limaux, 1999) a
étéréalisésur des sols de Lorraine, et uniquement
pour des apports à épi 1 cm : par conséquent ses
résultats sont plus précis et traduisent
44
la relation pour des valeurs de VC faibles en étant
soumis àun effet aléatoire liéà l'essai
limité. Dans notre étude, les modèles établis sont
très variables selon les essais. Le territoire français est une
échelle d'étude qui induit une diversitéde réponses
trop large pour mettre un place un modèle global. Par conséquent
le résidu du modèle reste très fort. L'effet de l'essai
est déterminant dans la variabilitédes résultats, comment
expliquer ces différences entre essais? Dans le devenir de l'azote, les
pertes par organisation sont supposées constantes d'un type de sol
à l'autre et la lixiviation de l'azote est nulle pour de bonnes
conditions de fertilisation (apport inférieur à l'optimum
technique, fragmentation de l'apport), restent les pertes par voie gazeuse. Ces
pertes sont principalement liées à de la volatilisation de
l'ammoniac (NH3), conditionnée par des caractéristiques
physico chimiques du sol : CEC et pH. Ces caractéristiques ressortent
par classification ascendante hiérarchique et justifient par la suite de
proposer des facteurs explicatifs àl'échelle de l'essai (hors
cadre de l'étude qui visait à expliquer le CAU par la VC, l'INN
et la pluviométrie). De plus, une nouvelle question peut être
posée : la valorisation de l'azote est-elle variable d'un cultivar
à l'autre? Il est communément admis que la valorisation de
l'azote par les différentes variétés cultivées en
France est équivalente, rentre-t-on dans un niveau de détail qui
n'admette plus ce postulat?
En somme, le CAU apparaît comme une grandeur complexe.
VC, INN, pluviométrie et fertilisant l'influencent, mais il faut
désormais s'intéresser à l'échelle de l'essai, pour
comprendre les déterminants locaux influant les relations
établies.
45
|