Recherche d'un processus d'historisation de base de données d'occupation des sols appliqué au référentiel géographique forestier de l'IGN( Télécharger le fichier original )par Romain Louvet Université Paris Diderot - Paris 7 - M1 Géographie et Sciences des territoires 2013 |
I.D - Consignes et méthodes de saisie de la MAJECLa mise à jour de la BDUni est régie par le processus de production appelé MAJEC (Mise A Jour En Continu). Ce processus, confiés au service de bases vecteurs, au service de la cartographie et aux cinq directions interrégionales de l'IGN, consiste à produire des éléments de topographies et des adresses de la BDUni. Cette production est assurée par les collecteurs de la MAJEC répartis entre les différentes directions régionales de l'IGN. La table des réconciliations permet d'ajouter des métadonnées sur la mise à jour en indiquant la personne l'ayant réalisée et sur quel ensemble de modifications. S'appuyant sur de multiples sources d'informations62, les collecteurs effectuent les modifications sur leur base clients qu'ils répercutent ensuite sur le serveur grâce aux outils du GCVS que nous avons décrits, principalement la zone de réconciliation. Il leur est demandé de suivre des consignes de saisie. Une zone de réconciliation doit prendre en compte un ensemble homogène ou cohérent de modifications que l'opérateur doit décrire dans la colonne « nom » de la table des réconciliations afin d'en faciliter l'exploitation. Cette zone doit être suffisamment grande pour intersecter tous les objets modifiés mais pas trop au risque de ralentir inutilement le temps de calcul du traitement de la mise à jour (IGN, 2012, p. 45). De nombreux contrôles sont réalisés obligatoirement avant chaque réconciliation. Leur rôle est d'éviter d'enregistrer des informations aberrantes dans la base centrale qui, sans ces contrôles, ne seraient pas détectées sinon. Les contrôles sont, par exemple, effectués sur : - La dimension z. Exemple : des hauteurs absurdes, comme un bâtiment plus haut à sa base qu'à son sommet. - La géométrie. Exemple : l'intersection de deux objets, comme deux bâtiments, ou une route et un bâtiment, ou un objet s'intersectant. - Doublon - Contrôle de l'hydrographie. Exemple : la source doit
avoir une hauteur positive, puisqu'elle Si une erreur apparait, mais qu'elle est justifiée, il est possible de faire basculer l'erreur en exception légitime. La colonne « exception_legitime » est alors remplie en fonction de l'erreur et le contrôle associé ne sera plus effectué pour l'objet en question. Un péage est un bon exemple d'exception légitime à l'intersection : c'est un bâtiment qui coupe une route, mais de fait il est au-dessus de celle-ci. Cette colonne est régulièrement vidée de son contenu pour effectuer à nouveau les contrôles afin de vérifier la qualité des données. 62 Orthophotographies de l'IGN, registres des actes communaux, courriers, appels, déplacement sur le terrain, l'Internet (images Google Earth et Bing, les Pages Jaunes, les sites des mairies,...), etc. xliv II - Apports et limites du modèle BDUni II.A - Capacités et outils développés Le modèle de mise à jour de la BDUni peut être qualifié, selon les catégories définies par Bordin (Bordin, 2002), comme un modèle de versionnement d'objets qui s'approche d'un historique des données. En d'autres termes, premièrement, la base enregistre les différents états des données dans le temps, différentes versions, ce qui a plusieurs avantages : - Tant que la donnée n'est pas modifiée, elle n'est enregistrée qu'une seule fois. Ce qui permet de limiter la quantité d'information à stocker. - Les données possèdent une date de création, modification, suppression. L'accès à des états temporels est ainsi plus rapide (que dans un modèle de journalisation par exemple)63. - Les données sont stockées dans deux tables, c'est le partitionnement temporel. Il permet d'accéder plus rapidement à l'état courant des données. Il y a cependant aussi des inconvénients : - La destruction d'une version, ou plutôt son archivage, puis la création d'une nouvelle version entraine la duplication des informations ne variant pas entre les deux. Le versionnement et l'horodatage des versions ont permis à l'IGN de développer des outils : - Extraction de différentiel pour la livraison de la mise à jour (Bonneau, 2008). - Visualisation d'un état de la base à une date donnée64. - Des prototypes de visualisation cartographique65. Deuxièmement, la base permet de contenir un lien entre les différents états d'un objet. Elle permet de suivre le changement en établissant un historique fondé sur la présence d'un identifiant et d'un identifiant successeur. Pour la BDUni, ce modèle est implémenté grâce à : - La conservation de la « cleabs », permettant de fonder l'identité fixe de l'objet informatique. - La liste chaînée des « numrec » et « numrecmodif » établissant le lien entre les objets. Ce modèle est, toujours selon Bordin, un modèle avancé. Il est en effet capable de s'attacher à l'aspect plus thématique de la mise à jour, à savoir : le suivi des évolutions. Toutefois, la limite importante de ce modèle tient au fait qu'il demande une réflexion sur l'interprétation de la modification ou de la suppression de l'objet géographique. Or, bien que des consignes de saisies existent dans ce sens (IGN, 2012), un réel manque de définitions plus claires demeure. Il manque des définitions et de consignes thématiques, c'est-à-dire qui ne soient plus simplement attachées aux objets informatiques mais aussi aux objets réels, géographiques, qu'ils représentent. D'autres questions demeurent. Il est demandé d'effectuer les réconciliations sur des ensembles homogènes : mais qu'est-ce qu'un ensemble homogène ? Il est possible de conserver l'identifiant de l'objet : quand considère-t-on qu'un objet géographique conserve son identité et quand est-il détruit ? La colonne « nom » doit identifier la réconciliation afin de faciliter les traitements, mais sa saisie est laissée à la discrétion de l'opérateur : les changements ne sont pas définis, ce qui 63 La journalisation consiste à ne conserver que l'état actuel de la base et à archiver toutes les modifications qu'ont subies les données dans le temps. Pour connaître l'état à une date donnée dans le passé, il faut effectuer toutes les modifications à rebours. 64 Voir Annexes. 65 Évolutions BDUni - cartographie des évolutions, sur http://rks1009w117.ign.fr/map-evolution/ xlv permettrait pourtant d'optimiser leur analyse par la requête. L'analyse du changement peut être complexe, surtout à décomposer : une même zone de changement ou de réconciliation peut avoir plusieurs causes et peut avoir des conséquences sur plusieurs classes d'objets ou plusieurs objets dans la même classe. La mise à jour par réconciliation effectuée par la MAJEC peut permettre théoriquement le suivi des objets pour l'analyse des changements, mais elle dépend fortement de l'appréciation de ce changement par l'opérateur, de l'interprétation des consignes de saisie, de sa maîtrise des outils et des contraintes temporelles de production des données. Le processus comprend en effet peu de contrôles ou de méthodes automatiques. Les opérateurs doivent réaliser les mises à jour selon des délais pour répondre aux objectifs de productivité (mesurés dans le contrat d'objectifs par des indicateurs de performance). Et la liberté du travail personnel de saisie contribue en partie à la satisfaction de ces objectifs. Figure 6: cas d'une mise à jour illustrant deux résultats différents en fonction de la saisie. La Figure 6 est un exemple concret d'une mise à jour et des questions qu'elle peut soulever. Au moment du contrôle, une incohérence est détectée : les objets « i » et « j » se superposent. Ces deux objets représentent un phare, « i » sa tour et « j » sa partie plus basse. Il s'agit d'une erreur de digitalisation qui ne devrait pas avoir pu être réconciliée auparavant. Considérons que l'opérateur avait classé cette incohérence en erreur légitime. Nous souhaitons corriger cette erreur, tout en conservant les identifiants « i » et « j » d'origine. Or, en fonction de la méthode de saisie, avec un outil de découpage (a) ou manuellement (b), le résultat n'est pas le même. Dans un cas l'identifiant est perdu, dans l'autre il est conservé. Si une zone de réconciliation est dessinée uniquement pour cette modification, un lien direct existera entre l'objet prédécesseur et ses successeurs. Mais si on réalise plusieurs corrections en même temps, on peut estimer qu'elles constituent un ensemble cohérent et les réconcilier en même temps, perdant de ce fait le lien spécifique entre prédécesseur et successeur. Enfin, au moment de nommer la réconciliation, plusieurs options sont encore possibles, ne facilitant pas le suivi : erreur, correction d'erreur, superposition, incohérence, aberration, etc. Cet exemple nous permet d'aborder un dernier point : celui du découpage des objets. Si un objet est découpé, un ou plusieurs nouveaux objets sont alors créés. Or un seul objet conserve l'identifiant permettant la filiation, cette information est perdue pour le ou les autres objets. De même, un objet qui serait détruit puis recréé (comme cela pourrait être le cas d'un bâtiment détruit puis reconstruit à l'identique) ne possède plus l'identifiant de départ. L'analyse du suivi du changement s'en trouve donc limitée. xlvi |
|