2.2/ Bathymétrie : Information auxiliaire
Un modèle numérique de terrain (MNT) est une
représentation de la topographie (altimétrie et/ou
bathymétrie) d'une zone terrestre. En cartographie les altitudes sont
habituellement représentées par des courbes de niveaux. Le MNT en
notre possession (source SHOM) utilise un maillage régulier carré
de 50 mètres. Il permet ainsi de reconstituer une vue en image de
synthèse du terrain (figure 3.6, image LIDAR : LIght Detection And
Ranging).
N
Figure 3.6
La morphobathymétrie reflète très souvent
la morphologie au toit du socle cristallin (D. Menier, géologue). En
effet la corrélation linéaire entre la profondeur des fonds
marins et celle au substratum est de 0,84. Le MNT peut donc fournir
une information complémentaire lors de la mise en oeuvre du
modèle de cokrigeage.
3/ Etude exploratoire de l'échantillon de la
variable d'intérêt
La mise en oeuvre des techniques d'estimation
géostatistique exige une analyse préalable des données
expérimentales. L'étude exploratoire a pour but
d'apprécier la distribution des données dans l'espace,
d'appréhender leur degré d'homogénéité, de
rechercher et de visualiser les observations atypiques ou tout simplement de se
familiariser avec la variable.
Il est ici rappelé que la variable d'intérêt
étudiée est la profondeur à laquelle nous atteignons la
roche en milieu marin (le toit du socle cristallin ou substratum).
3.1/ Histogrammes et statistiques descriptives
L'étude de l'histogramme permet :
- d'apprécier la variabilité des données
- de détecter d'éventuelles valeurs aberrantes.
La droite d'Henry : si les probabilités sont
alignées le long de la droite d'Henry, nous pouvons supposer que la
variable suit une distribution gaussienne.
Le box plot est une autre façon d'appréhender la
distribution de la variable. Il a l'avantage de mettre en valeur les quartiles.
Les quartiles Q1, Q2 et Q3 sont les éléments essentiels de ce
graphique. Le quartile Q2 (ou médiane) partage la série de
données en deux groupes d'effectifs égaux. Le quartile Q1 partage
le groupe dont les valeurs sont inférieures à la médiane,
en deux groupes d'effectifs égaux. Q3 fait de même pour le groupe
dont les valeurs sont supérieures à la médiane.
La distribution des profondeurs au toit du socle cristallin
(rocheux) est représentée par les trois graphiques de gauche de
la figure 3.8. Ils montrent que les valeurs sont comprises entre 2
mètres au-dessus et 25 mètres en dessous du niveau zéro
(référence SHOM). L'étendue de 27 mètres peut nous
paraître importante. Mais en y regardant de plus près, on
s'aperçoit que la moyenne et la médiane sont toutes deux
égale à -10 mètres. Il en résulte que 1/4 des
valeurs sont comprises entre -5 et -10 mètres et qu'un autre quart entre
-10 et -15 mètres. Sachant qu'il n'y a qu'un très petit nombre de
valeurs supérieures à zéro ou inférieures à
-20 mètres, on peut parler d'une distribution équitablement
répartie sur son étendue (25% des valeurs sur 5 mètres
d'étendue).
La droite d'Henry et un test de normalité
(Kolmogorov-Smirnov) montrent que la distribution des profondeurs au toit du
substratum ne suit pas une loi Gaussienne. Par contre le coefficient
d'asymétrie (cf. tableau du bas) et l'histogramme permettent de penser
qu'elle s'en approche.
Si la propriété de normalité a l'avantage
de définir complètement la distribution par sa moyenne et son
écart type, elle n'est pas une condition obligatoire en
géostatistique linéaire. Celle-ci ne fait aucune
hypothèse particulière sur la distribution des valeurs. Toutefois
d'après
C. Cressie (Statistics for Spatial Data, 1993 p.110), le krigeage
a tendance à fournir de meilleures prévisions lorsque les
données suivent une loi normale.
Q3
Q2
Q1
Valeurs extrêmes
Profondeur au toit du socle cristallin
Valeurs du MNT
Figure 3.8
A titre d'exemple, l'histogramme des valeurs du MNT n'est pas
symétrique. D'un côté, 75% des profondeurs se regroupent
entre +2 mètres et -8 mètres (10 m d'amplitude) et de l'autre
coté, 25% des valeurs s'étendent entre -8 mètres et -22
mètres (14 m d'amplitude). Certaines valeurs extrêmes apparaissent
autour des -20 mètres de profondeur. Alors pour estimer le MNT, Cressie
recommande soit une transformation des données par une fonction
mathématique pour rendre la distribution gaussienne, soit
discrétiser en zones géographiques afin que les profondeurs dans
chaque zone soient proches les une des autres. Chaque zone géographique
est alors traitée individuellement.
Principales statistiques relatives aux deux variables
|
Variable d'intérêt
|
Variable Secondaire
|
Minimum
|
-25,3
|
-21,8
|
Maximum
|
2,1
|
2,3
|
Moyenne
|
-9,9
|
-5,1
|
Médiane
|
-9,9
|
-4
|
Ecart-type
|
6,1
|
5,2
|
Variance
|
36,8
|
27,7
|
Coefficient d'asymétrie
|
-0,08
|
-0,9
|
Le coefficient d'asymétrie conforte le fait que la
variable d'intérêt a une distribution presque symétrique.
Enfin, le coefficient de corrélation linéaire entre les deux
variables est égal à 0,84 ce qui indique une forte
dépendance entre les variables.
|