3.5 - Organisation des données et métadonnées requises. IFREMER des habitats marins
174 3 - Comment se fait l’acquisition des données ?
Case Study Greencastle Coding Bank : étude de cas sur l’analyse des données de rétrodiffusion de sondage multifaisceaux et des données de terrain en rapport avec les prises de poissons benthiques
3.4.3 - Autres combinaisons courantes de techniques
En plus de combiner des techniques acoustiques et de télédétection à une campagne de terrain, on a souvent recours à de nombreuses autres combinaisons de techniques. Les combinaisons les plus fréquentes sont brièvement abordées au début de ce chapitre.
Voici quelques détails supplémentaires et d’autres exemples de telles combinaisons :
– appareil photographique et caméra vidéo – Cette combinaison donne des images de meilleure résolution, utiles pour l’identification de la faune et de la flore (voir la soussection 3.3.6 « Techniques d’imagerie sous-marine ») ;
– appareil photographique ou caméra vidéo montés sur une benne ou sur un carottierboîte – Cette combinaison permet d’obtenir des échantillons accompagnés d’images qui les situent dans le contexte de la structure et des matériaux environnants ;
– appareil photographique ou caméra vidéo montés sur l’avant d’un chalut ou d’une drague – Cette combinaison permet elle aussi d’obtenir des échantillons accompagnés d’images qui les situent dans leur contexte. Elle est rarement utilisée à cause de la relative fragilité des caméras et des nombreux impacts des chaluts et des dragues sur le fond ;
– levé à pied avec prise de notes, d’échantillons et de photographies ;
– levé en plongée des zones de petit fond avec prise de photographies et de bandes vidéo, combiné avec un véhicule téléguidé muni d’un appareil photographique ou d’une caméra vidéo pour les zones plus profondes.
3.5 - Organisation des données et métadonnées requises
Les levés effectués pour la cartographie des habitats produisent de très grandes quantités de données, qu’il faut organiser et gérer avec soin. De plus, les levés sont effectués à l’aide de multiples techniques et par de nombreuses personnes, ce qui rend encore plus complexe le suivi des données acquises (quelles données, pourquoi, par qui, comment, où, quand ?) et des liens entre elles. Une fois les levés terminés, il se peut que les données soient transmises à d’autres personnes ou organismes pour être traitées, analysées et conservées. Il est important que les renseignements essentiels soient enregistrés d’une manière structurée au moment des levés, de sorte que, malgré le passage du temps et la transmission à des tiers, leur traitement et leur interprétation ne soient pas compromis par des lacunes concernant les détails des levés. Il ne suffit pas de se fier à la mémoire des opérateurs de terrain pour savoir comment chaque donnée a été acquise !
Il y a trois aspects principaux à prendre en considération :
– comment les données des levés doivent-elles être organisées ? Il faut gérer les multiples techniques, personnes, lieux, dates et échantillons afin de bien documenter les liens entre toutes ces facettes des données acquises. Ce n’est pas très utile de photographier les échantillons prélevés si par la suite on ne se rappelle plus quelle photographie correspond à quel échantillon ;
– quelle information doit être enregistrée ? Les métadonnées enregistrées doivent indiquer aux futurs utilisateurs des données comment elles ont été acquises, où, quand, par qui et selon quelles normes, et comment elles ont été traitées. Ce sont ces renseignements cruciaux sur la provenance des données qui permettent aux utilisateurs de savoir à quelles fins elles sont adéquates (ou, plus important encore, à
3 - Comment se fait l’acquisition des données ? 175 quelles fins elles ne sont pas adéquates). Il faut tenir compte de l’utilisation possible des données au-delà du programme en cours, par exemple dans des archives nationales et internationales. Les données d’un sondeur multifaisceaux ont-elles été acquises conformément aux normes hydrographiques internationales afin de pouvoir servir à la réalisation de cartes marines ? Est-il possible d’intégrer des données sur les prélèvements à la benne sans connaître le calibre du tamis utilisé ?
– comment les données doivent-elles être conservées ? Il faut enregistrer les données sur un support approprié et les étiqueter correctement, afin d’assurer qu’elles soient aisément utilisables dans l’avenir, qu’elles ne se détériorent pas avec le temps et qu’elles puissent être facilement intégrées à des données semblables provenant d’autres sources. Des données mal étiquetées (dont on ne sait pas où et quand elles ont été acquises) sont des données coûteuses qui n’auront que peu ou pas de valeur dans l’avenir.
3.5.1 - Organisation des données des levés
L’organisation et la gestion d’un levé sont des éléments vitaux de son succès. Une bonne gestion des différentes techniques de levé et des données correspondantes est donc essentielle pour que le levé résulte en un ensemble de jeux de données bien documentés. L’acquisition des données constitue une partie coûteuse et difficile à répéter du processus de cartographie, et une documentation médiocre peut rendre ces données inutiles.
Le responsable des levés (responsable scientifique ou chef d’équipe) doit non seulement veiller à ce qu’il y ait à la fin des levés un ensemble de jeux de données bien documentés, mais aussi à ce que les relations entre ces jeux de données soient connues. Voici les questions clés auxquelles il faut pouvoir répondre :
– combien d’échantillons ont été recueillis ?
– quelles techniques ont été employées à chaque station ?
– a-t-on pris une photographie de chaque échantillon prélevé ?
– quel système de numérotation ou d’étiquetage a-t-on utilisé pour indiquer la provenance des données ?
L’organisation générale des données des levés peut se faire de plusieurs manières.
Souvent, chaque organisme ou groupe met au point ses propres méthodes, adaptées aux types de levé qu’il effectue, aux milieux dans lesquels il travaille et à ses modalités de gestion interne des données (p. ex. systèmes institutionnels de gestion des données).
Même si chaque levé est dans une certaine mesure différent des autres et que chaque technique a ses particularités d’exploitation, il y a de nombreux points communs en ce qui concerne les données elles-mêmes et les processus d’acquisition de ces données.
Le processus qui comprend l’organisation d’un levé, l’arrivée sur le site, le déploiement des instruments et techniques employés, le prélèvement des échantillons et la compilation des jeux de données comporte beaucoup de points communs d’un levé et d’une technique à l’autre. Une structure commune est présentée à la sous-section 3.5.2 « Un modèle M
ESH
d’organisation des données de levés ».
Les métadonnées, c’est-à-dire les renseignements sur la nature des données acquises, où, quand, comment, par qui et pourquoi, ont également beaucoup de points communs d’une technique et d’un levé à l’autre. La sous-section 3.5.3 « Les métadonnées : une
métadonnées mises en avant par le projet M
ESH
.
176 3 - Comment se fait l’acquisition des données ?
3.5.2 - Un modèle M
ESH
d’organisation des données de levés
De manière générale, les levés suivent un modèle semblable : il s’agit de lever, au cours d’une ou plusieurs périodes déterminées, un territoire géographique défini, que l’on peut subdiviser pour des raisons de commodité en zones plus petites. À chaque activité d’échantillonnage correspond une hiérarchie reconnue de données et de métadonnées
(information ou données à propos des données), illustrée dans la figure ci-après, qui rend l’organisation des données facile à comprendre. L’information relative aux cinq premiers niveaux de la hiérarchie (de « Programme » à « Technique ») est liée à la planification des levés et est donc connue avant l’échantillonnage proprement dit.
Les levés consistent à atteindre les sites du territoire défini et à déployer un certain nombre de techniques, parfois à plusieurs reprises, pour obtenir des données ou des
échantillons. Certaines techniques produisent plusieurs types de données (p. ex. le sondage multifaisceaux produit des données de rétrodiffusion et des données bathymétriques ; les prélèvements peuvent donner des échantillons biologiques et physiques).
Ce concept général a servi à élaborer une structure ou modèle commun aux levés effectués pour la cartographie des habitats et à la documentation qui doit accompagner les données acquises. Ce modèle est largement applicable à tous les types de levés et de programmes de surveillance de l’environnement marin, ainsi qu’à tous les types de techniques. Le tableau ci-dessous énumère les termes clés (et certains autres termes possibles) des différents niveaux de ce modèle et leur description. Ces niveaux aident à organiser l’acquisition et l’étiquetage systématiques des données et métadonnées pour toutes les techniques employées et tous les échantillons recueillis dans le cadre d’un programme.
Structure hiérarchique de l’organisation de données d’échantillonnage
3 - Comment se fait l’acquisition des données ? 177
Terme Autre terme
Programme Projet
Levé
Territoire
Station
Technique
Échantillon
Réplicat
Campagne
Zone
Site
Méthode
Enregistrement
Description
Ensemble coordonné de levés ayant une finalité commune et qui peut se poursuivre sur plusieurs années.
Ensemble coordonné d’activités d’échantillonnage qui fait ou non partie d’un programme. Ces activités sont effectuées par des opérateurs de terrain au cours d’une période déterminée (le plus souvent continue), habituellement dans un territoire donné et dans un but général unique.
Région géographique faisant l’objet de levés, où se situent les stations d’échantillonnage et les cheminements effectués.
Lieu au sein d’un territoire à lever où l’on recueille un ou plusieurs échantillons (en faisant appel à une ou plusieurs techniques) ou images.
Détails sur l’appareil utilisé pour recueillir les données ou
échantillons. (Noter que ce niveau de métadonnées ne se rapporte pas au lieu de l’échantillonnage et n’est donc pas nécessairement lié à l’organisation des données des levés.)
Ensemble des données acquises à l’aide d’une seule technique à un endroit précis d’une station.
Exemplaire supplémentaire d’un échantillon recueilli à l’aide de la même technique, selon les mêmes paramètres et à la même station.
Termes employés dans le modèle M
ESH
d’organisation de levés
Programme
e.g. MESH, MNCR, InfoMar
Survey/cruise A
e.g. BGS/MI/DARD 2004 Blackstone's
Bank technique testing survey
Survey/cruise B
e.g. Ifremer 2003 Bay of Morlaix intertidal sampling survey
Survey area A
e.g. SE Blackstone's Bank
Survey area B
e.g. NW Blackstone's Bank
Site/station A (line) Site/station B (point)
Sample A
e.g. MBES line
Raw data
Bathymetry, backscatter
Sample B
e.g. Sidescan line
Sample A
Replicate 1
e.g. Grab sample
Sample A
Replicate 2
e.g. Grab sample
Raw data
Sidescan image
Raw data
Infauna, organics
Raw data
Infauna, PSA
Modèle M
ESH
d’organisation des données de levés
Sample B
e.g. ROV video
Raw data
Video, stills
178 3 - Comment se fait l’acquisition des données ?
3.5.3 - Les métadonnées : une information vitale à propos des données
Au cours de la compilation du site du SIG webGIS de M
ESH
, il s’est avéré que, dans de nombreux rapports antérieurs, il y avait de l’information absente ou inexacte. Par conséquent, les données étaient inutilisables ou d’une utilité limitée, en dépit du fait que le travail avait probablement été effectué par des personnes expérimentées en cartographie des habitats marins et selon des méthodes normalisées. L’enregistrement de
métadonnées (données à propos des données) est devenu indispensable pour rendre pleinement utilisable toute donnée d’un levé, qu’elle soit numérique ou analogique. Cela est d’autant plus vrai maintenant avec le volume accru de données, la diffusion et l’affichage de données par Internet et l’existence d’archives en ligne.
Les métadonnées décrivent la source, le contenu et la qualité des données. C’est par l’évaluation des métadonnées qu’un utilisateur arrive à déterminer si des données répondent aux besoins d’une application. À un niveau très élémentaire, les métadonnées comprennent de l’information spatiale et non spatiale, par exemple qui a recueilli les données, qui les diffuse, où, quand, comment et pourquoi elles ont été acquises. Des avertissements concernant l’utilisation des données peuvent également faire partie des
métadonnées.
L’enregistrement de métadonnées pour chaque jeu de données est probablement l’aspect le plus négligé des levés. Pourtant, cette information prend de plus en plus d’importance avec le temps, car des détails essentiels sur les circonstances de l’acquisition des données s’effacent de la mémoire des intervenants. Il peut donc être difficile d’interpréter ultérieurement les données en l’absence d’information essentielle à propos de ces données. Cette information joue également un rôle important dans l’évaluation de la qualité d’ensemble de toute carte résultant d’un levé (voir le chapitre 5 « Jusqu’à quel point une carte est-elle bonne ? »). Il est en outre important que cette information accompagne les données lorsqu’elles sont archivées, transmises à des tiers, ou intégrées
à d’autres ensembles ou bases de données (institutionnelles, nationales et internationales).
L’enregistrement de métadonnées selon des modalités constantes facilite grandement les
échanges de données. Avec la croissance des bases de données, les données doivent se présenter sous des formats communs et être accompagnées de métadonnées normalisées. Une méthode sûre consiste à faire en sorte que les métadonnées soient conformes à la norme ISO 19115. La plupart des métadonnées spatiales et temporelles récentes dans le domaine marin respectent cette norme.
Les métadonnées relatives aux levés ont les fonctions suivantes :
– décrire le jeu de données (nature des données, qui les a recueillies, pourquoi, où, quand et comment), afin qu’elles puissent être correctement interprétées au cours du processus de réalisation d’une carte d’habitats (réduire les risques de mauvaise
interprétation) ;
– fournir de l’information qui peut servir à évaluer la qualité des données et des produits interprétés qui en résultent, par exemple des cartes d’habitats (voir le chapitre 5
« Jusqu’à quel point une carte est-elle bonne ? ») ;
– fournir l’information sommaire destinée aux catalogues de métadonnées de base, qui permettront à d’autres personnes de trouver les données (voir le chapitre 6 « Que peut-on faire avec une carte ? ») ;
– faciliter l’archivage des données selon les règles de l’art, la diffusion des données à des tiers ainsi que leur versement dans d’autres bases de données, en décrivant la provenance des données afin que d’autres puissent les réutiliser de manière appropriée.
3 - Comment se fait l’acquisition des données ? 179
Au vu du modèle décrit à la sous-section 3.5.2 « Un modèle M
ESH
d’organisation des données de levés », une certaine information (métadonnées) peut être rattachée à chaque niveau du modèle. L’information est plus générale aux niveaux supérieurs du
modèle (programme, levé) et devient plus spécifique à une technique particulière et à un jeu de données aux niveaux inférieurs (échantillon, réplicat).
3.5.4 - Normes recommandées en matière de métadonnées de levés
Un ensemble normalisé de métadonnées a été élaboré pour les programmes de
cartographie des habitats. Cette norme définit des zones de métadonnées pour les niveaux « Programme », « Levé », « Territoire », « Station », « Échantillon » et
« Réplicat » du modèle (voir le lien Metadata Fields ). Cette norme a été élaborée à partir du modèle présenté à la sous-section 3.5.2 « Un modèle M
ESH
d’organisation des données de levés », en comparant les zones de métadonnées et bases de données semblables, l’information fournie par la recension des normes et protocoles pour la
cartographie des habitats benthiques, 2 e
édition (Coggan et al., 2007) et les lignes directrices opérationnelles de M
ESH
pour la cartographie des habitats (voir section 3.3).
Ensemble, les zones de cette norme procurent une documentation des métadonnées suffisante pour :
– énumérer les métadonnées de base pour le catalogue des métadonnées de M
ESH
et d’autres portails de métadonnées ; de sorte que les utilisateurs puissent en comprendre les éventuelles limites ;
– fournir les métadonnées permettant d’évaluer la fiabilité des cartes d’habitats qui seront produites ;
– accompagner le versement des données dans des archives nationales.
Les zones de métadonnées relatives à chaque technique, de même que les zones relatives au traitement et à la conservation des données, sont énumérées dans un classeur (voir le lien Video Metadata ). Ce classeur contient pour chaque zone des détails supplémentaires sur :
– le format (texte, nombre, liste de termes) ;
– le caractère obligatoire ou facultatif de la zone ;
– la liste des termes autorisés ;
– des exemples de données ;
– les zones analogues dans d’autres bases de données.
Lorsque l’on voit la liste des zones de métadonnées (voir le lien Metadata Fields ), les zones supplémentaires de métadonnées requises pour chaque technique, le traitement et la conservation des données, il peut sembler de prime abord que l’enregistrement de
métadonnées constitue une tâche complexe et lourde. En pratique, plusieurs zones sont facultatives et ne sont pas pertinentes dans tous les cas, et l’emploi de listes de termes réduit considérablement l’effort d’enregistrement des métadonnées pendant les levés.
L’équipe du projet M
ESH
travaille à la mise au point d’une application de base de données pour l’enregistrement de ces métadonnées, qui constituera un module de saisie complet à utiliser au cours des levés et des traitements qui s’ensuivent. La présentation en cascade des données, des niveaux supérieurs jusqu’aux niveaux inférieurs, et l’automatisation de la saisie de certaines zones devraient rendre la base de données relativement rapide et facile à utiliser.

公開リンクが更新されました
あなたのチャットの公開リンクが更新されました。