L'écrasement correspond aux bases statiques : les
données mises à jour suppriment les données
antérieures. Cette méthode ne permet pas
l'historisation.
II.C.2.b - Archivage Également
appelé :
? mise à jour par relation level versionning ou
table versionning (Langran, 1992, p. 63)
? modèle snapshot (Bordin, 2006 ; Plumejeaud,
2011, p. 55 ; Pelekis et al., 2004 ; Langran, 1992, pp. 38-39)
? modèle par datation du support de collecte,
par couche datée (Plumejeaud, 2011, p. 55)
L'archivage consiste à enregistrer différentes
versions de la base entière en fonction de la date de mise à
jour, comme plusieurs versions d'une carte papier numérisée ou
plusieurs couches datées qui se succèdent. Chaque couche
possède des données attributaires et leur
référentiel spatial pour une date unique, en temps de
validité. C'est une observation du territoire sous la forme «
d'instantané » (en anglais snapshot).
56
L'archivage est un modèle d'historisation souvent
utilisé pour les bases de données d'occupation des sols produites
par traitement d'images de télédétection (satellite,
aérien). C'est notamment le cas pour Corine Land Cover, ou de la
première version de la cartographie forestière.
La principale qualité de ce modèle est qu'il
est intuitif. Son utilisation parait évidente lorsque la source des
données est une image étant fondée sur l'usage courant du
temps en cartographie et dans les SIG. Son principal défaut est qu'il
enregistre les données qui n'ont pas changé d'une version
à la suivante. Beaucoup de doublons sont donc stockés
inutilement. La résolution temporelle est donc limitée. Par
ailleurs, il limite la manipulation des données par l'utilisateur. Si
celui-ci attribue de nouvelles informations aux données en fonction de
ses besoins, il devra le faire pour chaque nouvelle version.
II.C.2.c - Versionnement
Également appelé :
? Modèle single time stamping (Pelekis et
al., 2004) ;
? Mise à jour tuple versionning (Langran, 1992)
;
? Mise à jour par horodatage (Bordin, 2006) ;
? Utilisé par le modèle base with amendments
(Langran, 1992).
La mise à jour par versionnement consiste à
enregistrer un premier état de la base, puis d'ajouter les
évolutions par date de mise à jour. Seules les données qui
ont changé sont à nouveau enregistrées dans la base. Les
différents états des données sont donc stockés, et
non plus différentes bases de données.
La technique utilisée est le versionnement par ligne.
Le temps est enregistré au niveau des objets informatiques, à
l'aide d'un intervalle mesurant les événements de vie. Chaque
objet, correspondant à une ligne de la table, possède au minimum
deux colonnes d'attributs temporels : une pour le début de sa
période de validité et une pour sa fin. Les nouveaux objets sont
enregistrés en ajoutant des lignes à la table, avec la date de la
mise à jour indiquée dans la colonne de début de
validité. Les anciennes versions des objets sont conservées en
remplissant la colonne de fin de validité avec la même date. La
colonne de fin de validité des objets courants peut être remplie
à l'aide des valeurs NULL, CURRENT, NOW ou INFINITY.
La principale qualité de ce modèle est qu'il
réduit les coûts de stockage. En ne stockant qu'une fois les
objets inchangés, la redondance des données est minimale en
comparaison avec l'archivage. Cela permet d'améliorer la
résolution temporelle en augmentant la fréquence entre les mises
à jour. Il est facile d'extraire ensuite des couches temporelles par
requête dans la base.
Le principal défaut de cette méthode est
qu'elle implique l'accroissement de la table d'enregistrement de la base de
données. Or plus la table est volumineuse et plus le temps de calcul des
requêtes sur les données est long. Il est possible
d'implémenter deux solutions à ce problème. L'indexation
du temps, sur le même modèle que l'indexation spatiale, permet
d'accélérer les requêtes temporelles. Il est
également possible de stocker les données dans plusieurs tables.
Cette solution, appelée partitionnement temporel, consiste à
séparer l'état courant et les versions antérieures des
données. Elle permet d'accéder plus rapidement au dernier
état des données et est souvent employée. Dernier
défaut, le versionnement implique lui aussi un certain nombre de
57
redondances, du fait de l'enregistrement complet d'un objet
à chaque modification d'un de ses attributs.