Données localisées numériques et référentiel spatial

L'accroissement de l'utilisation des données localisées numériques dans les sites utilisateurs conduit au développement progressif de nombreuses bases de données locales. Toutefois, les applications de l'information localisée numérique sont encore dans leur grande majorité des applications de type cartographique. Sans doute cela correspond-il à l'état des besoins, mais aussi à l'absence de référentiel spatial adapté. En effet, la nécessité de structurer ces bases de données locales suscite le recours à des données numériques de référence, mais les pratiques montrent alors que la mise sous forme numérique des cartes de base n’en constitue pas pour autant un référentiel spatial. Deux observations le suggèrent :

· les bases numériques issues des cartes papier contiennent beaucoup d’objets dont l’intérêt relatif est très variable, mais qui réduisent fortement les facilités d'emploi
· la mise à jour de ces bases visent essentiellement l’aspect " thématique " des données et non les aspects structurels et fonctionnels de leur contenu.

Autrement dit, dans l’état actuel de l’offre, ces grandes bases de données numériques se présentent comme un amalgame de données de statut et d'utilité très dissemblables dont la structuration ne se prête ni à des actualisations commodes ni à des enrichissements locaux.

Un référentiel spatial doit être compris comme un dispositif technique permettant à un utilisateur particulier l’association de données de diverses origines. Le dispositif est caractérisé par :

· le degré de précision qu'il offre pour la localisation des données,
· l'aptitude à supporter la généralisation des données,
· le respect des normes (référentiel géodésique, système de projection,...),
· l'universalité de son emploi.

A l’ère de l’information géographique numérique, le concept de référentiel spatial actualise, en l'enrichissant , la notion de carte de base.

Tant que les utilisations des informations géographiques étaient limitées à la lecture et à la compréhension des cartes, l’économie consistait pour le cartographe à la confection des produits de base d’usage universel. L'informatisation a bouleversé cette problématique en rendant possible l'accès aux données élémentaires et en offrant des facultés d'utilisation de ces informations par assemblage, agrégation, sélection et croisement.

Dès lors, l’intérêt économique de l'information géographique est transféré de ses producteurs à ses utilisateurs et réside dans la multiplication de ses emplois et de ses réemplois. Et ce sont la faisabilité et la facilité de ces réemplois aux travers de combinaisons diverses que le " référentiel spatial " doit permettre.

le point de vue utilisateur

Le référentiel a notamment pour objet de permettre une discrimination stable, géométriquement et sémantiquement, des objets d’une classe. Son efficacité dépend notamment de ces deux caractéristiques.

Le traitement cartographique traditionnel débouchant sur un document papier taisait et figeait les caractéristiques des informations représentées. En particulier, la hiérarchisation et la cohérence des données étaient fixées par le cartographe compte tenu des contraintes propres au produit (lisibilité simultanée, …) et au processus (superposition des couleurs, …). Le résultat, la carte papier, ne rend pas directement compte des choix faits et des arguments utilisés pour lever des contradictions ou des indéterminations locales. Le produit cartographique est globalement cohérent et nécessairement stable au regard de l’usage principal pour lequel il a été conçu, au moment de sa réalisation. La richesse totale d’information rend indulgent au regard d’imprécisions ponctuelles.

Lorsqu’il s’agit d’effectuer un traitement informatique particulier à partir d’une extraction d’une base de données numériques, les données exploitées sont presque toujours composites, la question posée limitée mais précise. Les défauts des données sont alors " au premier plan " et ont un impact essentiel sur la qualité du résultat. C’est l’amélioration de cette situation qu’escompte l’utilisateur lorsqu’il demande un référentiel spatial.

L'utilité actuelle du référentiel n'est pas d'assurer principalement la cohérence interne d'un produit particulier (c'est le rôle des professionnels d'un domaine d'application, d'un métier), mais de permettre un maximum d'utilisations croisées.

référentiel spatial, système de référence et données de référence

L'utilisateur emploie indifféremment ces appellations qui recouvrent cependant des objets techniques de nature différente. Les distinguer est une affaire de point de vue auquel l'utilisateur n'est que peu sensible dès lors que l'essentiel pour lui est de disposer d'une infrastructure de positionnement " sur étagère " qui va lui permettre de situer, d'ajuster et de mettre en relation ses propres données.

Schématiquement, le référentiel spatial comprend :

- le système de référence qui s'attache aux méthodes et normes de localisation d'une information sur la surface de la terre (forme conventionnelle de la terre, système de référence géodésique, systèmes de projection plane, …),
- les données de référence qui sont des ensembles d'objets particuliers dont la description est spécifiée, la qualité de localisation connue, la stabilité probable, l'identification aisée et l’actualisation régulière.

données de référence

L'approfondissement progressif des échanges entre utilisateurs, notamment au sein des animations régionales, montre de plus qu'il faut distinguer deux types de données de référence :

· des données de référence thématiques, qui correspondent à des domaines de préoccupation distincts : les infrastructures de transports, l'environnement, la planification territoriale, ...
· des données de référence d'un territoire, qui correspondent à un tronc commun de données :
- partagées par les différents acteurs d'un territoire et constitué d'une sélection particulière de différentes données thématiques,
- rassemblées en un "tronc commun" qu'il faut particulièrement documenter pour en faciliter l'échange et l'utilisation.

Ces distinctions amènent progressivement à reconsidérer les outils traditionnels d'organisation des données, dictionnaires et nomenclatures, pour qu'ils se conforment mieux aux règles et normes qui se développent actuellement, en particulier sous l'appellation de "métadonnées".

données de référence thématiques ou données "métier" de référence

Une couche de référence est une description d’un domaine ou d’un sous-domaine thématique :

· régulière, conforme à des règles préétablies,
· homogène, appliquée de la même façon en tout point du territoire,
· consensuelle, appliquée de la même façon par tous les spécialistes d'un métier ou d'un domaine.

Cette couche est périodiquement mise à jour et comporte outre ses objets constitutifs, leur spécification, leur organisation, les règles de simplification de l’information, pour assurer la comparabilité entre lieux et entre périodes.

Pour définir une couche de référence "implicitement" thématique, il faut réunir : une utilité sociale, une expertise thématique, des sources et des protocoles d’observation et d’interprétation proposant un langage descriptif du contenu, des règles d’affectation des traits descriptifs, des règles de délimitation des objets, des règles de "re-observation" et de "re-interprétation".

données de référence topographiques

Les données de référence topographiques sont des données de référence thématiques particulières. Outre leur fonction thématique de description physique du territoire, elles servent aussi à la localisation indirecte d'autres objets thématiques. Cette caractéristique entraîne des contraintes particulières car toutes les données descriptives du territoire n'ont pas la même aptitude à la localisation indirecte :

· certaines d'entre elles conjuguent par leur netteté une bonne précision de localisation et une sûreté d'identification (angle de bâtiment, édicule isolé, …). Leur aptitude à la localisation indirecte, qui peut ne pas paraître évidente à l'utilisateur, doit être signalée, par exemple par un attribut particulier, et elles doivent être maintenue ne serait-ce que pour cette caractéristique,
· l'économie générale de l'établissement et de l'entretien de telles données doit privilégier la confection d'une couverture complète du territoire en données minimales de qualité, de préférence à l'enrichissement thématique dispendieux et peu utile.

Ces considérations, essentielles à petite et moyenne échelle, sont à tempérer pour les grandes échelles (une fiche technique ultérieure traitera spécifiquement des référentiels spatiaux à grande échelle).

fonctions et caractéristiques

la référence de localisation

Quels que soient les objets contenus dans le référentiel, il s’agit d’apporter une garantie de qualité de la localisation de ces objets, c’est-à-dire :

· le respect des normes internationales et nationales,
· le rattachement au système de référence national ou la fourniture des règles de transformation vers celui-ci,
· l’application des formats d'échange dominants.

Les liaisons avec d’autres référentiels

Les principaux référentiels généraux doivent pouvoir "communiquer entre eux, aussi aisément que possible et de la façon la plus cohérente. Le référentiel spatial doit pouvoir permettre de mettre en relation des données attachées à des référentiels administratifs (limites communales en particulier), statistiques (îlots de recensement), d’adresses géographiques et postales, et fonciers (parcellaire cadastral). Les utilisateurs comprennent mal et admettront de moins en moins que les opérateurs publics de ces référentiels n'aient pas plus le souci de leur interopérabilité. Il est vrai qu'aujourd'hui cette mission n'est généralement pas très explicitée.

l’intégration dans les sites utilisateurs

Pour que le référentiel favorise effectivement la valorisation des données rassemblées par les utilisateurs, il faut qu’il puisse être correctement installé et utilisé sur des sites utilisateurs, aux caractéristiques très hétérogènes, ce qui impose :

· une structure informatique simple pour alléger l'installation initiale,
· des procédures de mise à jour régulières et faciles à mettre en œuvre par les utilisateurs,
· un référentiel spatial par définition doit être largement utilisé : il faut en faciliter l'accès technique mais aussi économique et juridique, c'est-à-dire élaborer une politique de prix incitative et des droits d'utilisation non limitants.

Formes de mises à disposition des données de référence thématiques

Les limitations des processus de traitement de l'information géographique ont fortement contraint les produits résultants. La carte papier impose de nombreuses sélections, généralisations et symbolisations. La forme numérique, dans ses aptitudes actuelles, assouplit ces contraintes : il est possible de conserver plus d'informations qu'on ne peut en représenter simultanément sur une édition graphique, les impacts des généralisations et symbolisations sont amoindris. Les développements actuels, tant des capacités de traitement simultané des outillages informatiques, que des technologies et méthodologies de capture et de manipulation d'images sous forme numérique, se conjuguent pour que, sans doute assez prochainement, des données de référence topographiques puissent être fournies sous forme d'image numérique.

· l'image est bien la description physique du territoire la plus fidèle et la plus complète,
· la structure maillée des fichiers numériques "encapsule" la signification des données dans une unité spatiale. Elle autorise ainsi l'emploi de procédures automatiques variées de changement d'échelle (changement de résolution spatiale) et plus généralement de traitement d'image,
· l'allègement du traitement aval permet d'envisager l'amélioration de la qualité des données (notamment leur fraîcheur), et la banalisation des procédures de changement d'échelle.

Cette nouvelle forme des données provoquera une modification profonde des modalités de gestion des bases de données numériques. Il faut impulser un programme spécifique de recherche sur ce thème.

gammes, référentiels gigognes

L'accord entre toutes les gammes d'échelles est une fiction. Même réalisé à un moment donné, des différentiels d'actualisation des données de référence apparaîtront avec le temps. Il faut donc gérer des processus de mise en cohérence géométrique et sémantique des représentations d'un même phénomène du monde réel à différentes échelles. Il revient aux spécialistes d'un domaine d'effectuer cet appariement pour leurs données de référence thématiques. L’un des problèmes techniques posé est alors de faire passer une donnée d’un référentiel spatial à l’autre et donc de changer de système de projection, de niveau de généralisation ou d'agrégation,... opérations qui appellent des techniques spécifiques et dont les résultats doivent être stables et comparables d’une utilisation à l’autre.

Il ne s'agit là aucunement de déduire les petites échelles des grandes échelles, chaque gamme d'échelle ayant son autonomie. Mais il est nécessaire de faire émerger, de banaliser, de spécifier et de rendre accessible ces procédures, dans les perspectives du développement de l'utilisation des données de référence thématiques topographiques sous forme d'images numériques telles qu'évoquées au point précédent.

autres points

Au-delà de ces indications générales, différentes questions plus particulières restent à approfondir.

Référencement direct ou indirect

L'important développement actuel des techniques de localisation directe par satellite va bouleverser l'économie de la localisation. Il convient d'en analyser l'impact particulier dans les relations entre données localisées et référentiels administratifs divers (adresse postale notamment), entre structuration a priori et constitution à la demande.

Modalités de diffusion

· développement de la notion d'abonnement à un référentiel et de niveau d'abonnement en fonction des degrés de précision et de complétude. Analyse des modalités tarifaires associées,

· explicitation et affichage des modalités d'actualisation d'un référentiel.

· mise à jour des référentiels en site utilisateur. Notion de différentiel annuel d'une base de données, composante "temporelle" des données de référence.

Dimension réglementaire

Les différents référentiels ont aujourd'hui des statuts variés plus ou moins explicites. L'élaboration d'un cadre réglementaire clair faciliterait leur mise en œuvre, leur reconnaissance publique et donc leur efficacité. Ce cadre contribuerait en particulier à garantir cohérence et pérennité.

Acteurs et fonctionnement

L'établissement et l'entretien des référentiels spatiaux, la spécification des modalités du passage d'un référentiel spatial à un autre, des liaisons d'un référentiel spatial avec des référentiels administratifs sont des missions essentielles de l'IGN.

L'établissement des données de référence thématiques sont de la responsabilité des différents organismes administratifs, techniques et professionnels concernés : ministères (routes, eau, environnement, …), collectivités locales (domaine public, structures foncières, …), spécialistes (géologie, végétation, …). Les bases de données numériques de l'IGN entrent dans cette catégorie en tant que données de référence topographiques.

Le développement des référentiels spatiaux ne dépendra pas seulement des réponses techniques qui seront apportées à ces questions, mais également de la volonté des utilisateurs à accepter pour eux-mêmes des contraintes qui leur permettent par ailleurs d'accéder plus aisément aux données de leurs partenaires.

 

Fiche élaborée par le groupe de travail "aide à la maîtrise d'ouvrage des SIG"

avril 1998