4.1 Polygones de Thiessen
|
|
Présence de crépidules
|
|
|
Figure 7.6
|
|
|
On attribue à tout point appartenant au même
polygone, la valeur du site ayant ce polygone d'influence (cf. chap. I §
1.1).
La validation croisée (cf. chap. IV § 2.2) pour cette
méthode rend 81,08% de bonne réponse. 4.2 Interpolation
par la méthode des plus proches voisins
L'algorithme se base sur une décomposition de l'espace en
polygones de Delaunay (cf. chap. I § 1.1.1.2)
Ayant peu d'observations, et sachant que les crépidules
vivent en colonie, si elles sont présentes à un endroit il y a
de forte chance que l'on en trouve juste à coté. D'où
l'idée de
découper la zone d'études en une grille
régulière à maille rectangulaire de côté
mesurant 50 mètres. Elle est alors assez fine pour que chaque benne
remontée corresponde à un carreau.
Tout point de la grille appartient à un triangle de
Delaunay. La valeur du point que l'on cherche à estimer sera celle du
sommet le plus proche.
Figure 7.7
La validation croisée (cf. chap. IV § 2.2) pour cette
méthode rend 82,43% de bonne réponse. 5.3 Interpolation
suivant le nombre d'individus comptés
Les méthodes suivantes sont appelées abusivement
des méthodes d'interpolation. Elles sont plus précisément
des méthodes de lissage. Elles permettent de réaliser une
transition entre les régions à valeurs observées
différentes. Elles sont normalement utilisées lorsque les sites
d'observations sont disposés selon une grille
régulière.
Les géologues ont aussi relevé pour certaines
bennes remontées, la quantité de crépidule. Le tableau
ci-dessous donne quelques statistiques sur ces données.
Nombre de bennes
|
70
|
Médiane des crépidules comptés
|
25
|
Nombre de bennes avec crepidules
|
54
|
Maximum de crépidules dans une benne
|
87
|
Nombre de bennes avec comptage de crépidules
|
39
|
Moyenne des crépidules dans une benne
|
29
|
Minimum de crépidules dans une benne
|
4
|
Ecart type des crépidules dans une benne
|
19
|
On remarque que la moyenne est de 29 crépidules par
bennes et que 50% des bennes à présence de crépidules
remontent plus de 25 crépidules. D'un autre coté, l'amplitude de
83 crépidules est élevée. Il en découle un
écart type important.
La figure 8 présente les résultats obtenus suivant
quatre méthodes de lissage.
Figure 7.8
- L'interpolation linéaire (cf. chap. I) se base sur la
triangulation de Delaunay. Nous rappelons que l'estimateur pour un point
S inclus dans un triangle S1, S2, S3 s'écrit :
+
+
S S S
123
à
Z S
( )
S SS
1 2
Z S
( )
3
SSS
1 3
Z S
( )
2
S SS
2 3
Z S
( )
1
avec |.| désignant la surface.
- L'interpolation cubique consiste à ajuster à
l'intérieur de chaque triangle de Delaunay une surface dont
l'équation est un polynôme du troisième rang.
3 2
Ce polynôme est de la forme : ? ?
Z S Z x y
à ( ) à ( , )
= =
|
á ij x y
i j
|
i j
= =
0 0
- La méthode du plus proche voisin estime le site
S en lui affectant la valeur du site observé le plus proche.
- L'interpolation par splines ne se base pas comme les
précédentes sur une triangulation de la
à
sous la contrainte Z ( S i ) =
Z(S i ) ? i= 1... n
dS
S i + 1
zone d'études. Elle minimise ?( )2
Z S
à ' ' ( )
Si
Remarque : les méthodes cubiques et splines produisent des
surfaces à aspect très lisse alors que les méthodes
linéaires et plus proche voisin présentent des
discontinuités.
Validation croisée des quatre méthodes
présentées :
|
Linéaire
|
Plus Proche Voisin
|
Cubique
|
Spline
|
% de bonnes réponses*
|
15,78
|
29,82
|
14,03
|
12,28
|
Moyenne de l'erreur d'estimation
|
-0,58
|
-0,54
|
0,07
|
-1,07
|
Variance de l'erreur d'estimation
|
14,28
|
17,96
|
14,27
|
15,70
|
Erreur quadratique moyenne
|
200,33
|
317,49
|
199,55
|
243,51
|
Moyenne de l'erreur relative
|
-0,01
|
-0,01
|
0,001
|
-0,02
|
Coefficient de corrélation
|
0,728
|
0,661
|
0,732
|
0,723
|
*% de bonnes réponses à plus ou moins trois
crépidules près.
Le tableau ci-dessus permet de comparer les quatre
modèles à partir de critères statistiques (cf. chap. 4
§ 2.2). La moyenne de l'erreur d'estimation des quatre modèles est
proche de 0.
Cela montre qu'ils sont sans biais ( E (
Zà ( S ) ) = Z(S ) ). Par
contre ceux ne sont pas des
estimateurs robustes (variance de l'erreur d'estimation
élevée). L'avantage d'un estimateur robuste est qu'il est
insensible aux valeurs aberrantes. La moyenne de l'erreur relative,
[ Z S - Z S
à ( ) ( ) ]
100 * proche de 0, indique que les interpolations sont d'une
bonne précision.
Z S
( )
Si l'on compare les méthodes d'interpolation, la
méthode cubique rend les meilleurs résultats globaux. Mais si
l'on y regarde de plus près (figure 7.9) on s'aperçoit qu'elle
n'estime pas correctement les sites sans présence de crépidules.
Ils sont mieux estimés par la méthode du plus proche voisin
(PPV).
L'idée qui s'en suit est d'estimer les sites sans
présence de crépidules par la méthode du PPV. Les sites
restant seront estimés par la méthode cubique. Le résultat
se trouve en figure 7.10.
Figure 7.9 : Corrélation entre valeurs observées
et
Figure 7.10
5.4 Conclusion
Nous venons de voir quatre méthodes d'interpolations et
il en existe encore un grand nombre. Il est difficile de préconiser une
méthode plutôt qu'une autre. C'est pourquoi il est
conseillé d'utiliser systématiquement la validation
croisée qui donne les moyens de comparer les diverses méthodes.
Les techniques déterministes ont l'avantage de pouvoir être
automatisé, mais à l'inverse du krigeage (méthode
stochastique), elles ne prennent pas en compte la structure spatiale du
phénomène étudié. Leur but est avant tout d'aboutir
à une carte esthétique des valeurs estimées en produisant
des surfaces à aspect très lisse.
|