3.6 - Épuration et traitement initial des données. IFREMER des habitats marins
180 3 - Comment se fait l’acquisition des données ?
3.6 - Épuration et traitement initial des données
Toutes les techniques de levé et d’échantillonnage exigent une surveillance en cours d’exploitation, afin d’assurer leur bon fonctionnement ainsi que la fiabilité des données ou
échantillons obtenus. Pour ce faire, on peut notamment consigner les métadonnées appropriées, qui agissent dans bien des cas comme une liste de vérification permettant de s’assurer que les données sont correctement enregistrées. Après l’acquisition des données, il faut effectuer certaines opérations de traitement, d’épuration et de stockage afin que les données soient prêtes pour la phase d’analyse (voir le chapitre 4 « Comment réalise-t-on une carte ? »). Ce traitement initial consiste à vérifier que les données sont correctes, c’est-à-dire qu’elles reflètent réellement les variables qu’elles visent à décrire, au bon endroit et au bon moment. À la fin de cette étape, on devrait disposer d’un jeu de données « brutes » épurées, prêtes à archiver ou à transmettre à la prochaine phase d’analyse, en vue de la réalisation d’une carte d’habitats ou de toute autre utilisation pour laquelle les données sont pertinentes.
3.6.1 - Épuration des données
L’épuration des données consiste principalement à en éliminer les erreurs ou
« aberrations ». Par exemple, dans le cas des données acoustiques d’un sondage multifaisceaux, des échos naturels dus à la réflexion, à la réfraction et à d’autres sources de bruit se situent à l’extérieur des limites acceptables des résultats du sondage. Tout jeu de données comporte des aberrations. Dans certains cas, il faut les conserver ou les traiter de manière particulière. Par exemple, la présence d’espèces rares dans un jeu de données biologiques risque de compliquer les analyses multivariées ; il peut être nécessaire de ne pas en tenir compte pour certaines analyses, mais ce ne sont pas pour autant de « mauvaises » données, et il faut les conserver dans le jeu de données définitif.
Dans le cas de prélèvements à la benne, la position doit être enregistrée au moment où l’appareil touche le fond, puis vérifiée à nouveau. La position d’instruments remorqués peut être déterminée de deux manières :
– on peut la déterminer de manière précise à l’aide d’un dispositif de positionnement, par exemple un système à base ultra courte fixé sur le traîneau ou le bâti. Les données de positionnement ainsi obtenues peuvent être enregistrées directement dans l’appareil.
Les positions et les images peuvent être ainsi enregistrées simultanément, ou encore reliées ultérieurement en utilisant le temps comme dénominateur commun ;
– on peut en faire une estimation en utilisant le théorème de Pythagore ou la formule de la chaînette qui tient compte de la courbure du câble de remorquage. Ces calculs sont généralement effectués après l’acquisition des données. Même s’ils peuvent donner une estimation raisonnable de la distance entre l’instrument et le navire, ils n’indiquent pas la position réelle, en raison des courants latéraux. Tout calcul de position postérieur à l’acquisition des données doit faire l’objet d’une vérification par un opérateur au regard de toute l’information de positionnement disponible. Dans le cas d’une bande vidéo, une telle information peut provenir des données de rétrodiffusion qui montrent les démarcations entre zones et que l’on peut comparer à la position de la caméra au moment où la bande vidéo montre un changement marqué de la composition du fond.
L’épuration des données peut prendre d’autres formes. Dans le cas des bandes vidéo, certaines parties du cheminement de la caméra peuvent ne pas être utilisables. Par exemple, le tout début d’une prise de vue ne doit pas être inclus dans l’analyse. La caméra est toujours mise en marche pendant qu’elle descend dans l’eau, afin que l’opérateur puisse savoir quand elle touche le fond. Une fois qu’elle a touché le fond, il faut prévoir une courte « période de stabilisation » pour permettre à la caméra de quitter l’endroit où, au moment de l’atterrissage, elle a perturbé le fond et déplacé des particules
3 - Comment se fait l’acquisition des données ? 181 qui ont pu obstruer son champ de vision. Il faut aussi exclure les moments où les sédiments sont perturbés par le bâti de la caméra. Ces séquences ne sont pas très utiles, car elles ne peuvent rien révéler mis à part la présence de sédiments non consolidés !
Suite d’images extraites d’une bande vidéo, qui montre une détérioration de la visibilité due aux sédiments fins déplacés par le cadre de la caméra. (L’intervalle entre deux images successives est d’environ 0,3 seconde)
3.6.2 - Corrections de position
Les corrections de position peuvent comprendre les transformations entre diverses projections géodésiques. La norme reconnue en cartographie est le système WGS84
(World Geodetic System 1984).
Les transformations de projection peuvent être automatisées, notamment dans le cadre d’un SIG. Si les données sont conservées dans un tableur, elles sont également modifiables à l’aide d’un logiciel de conversion contenu dans un micro-ordinateur ou hébergé dans un site Web.
Les corrections de position peuvent également comprendre la correction des erreurs humaines intervenues lors de l’enregistrement ou de la numérisation des positions de prélèvement d’échantillons. Certaines de ces erreurs sont évidentes, comme une position correspondant à un lieu sur la terre ferme ou une valeur manifestement trop grande ou trop petite. Ces erreurs sont souvent faciles à corriger par comparaison avec d’autres données, mais si elles sont nombreuses, les corrections risquent de prendre beaucoup de temps. Il ne faut pas oublier que les erreurs humaines sont inévitables lorsqu’un grand nombre de données sont écrites, saisies ou transposées à la main.
3.6.3 – Réduction de la marée
Les réductions de la marée sont nécessaires lorsque les mesures bathymétriques sont effectuées à l’aide d’un sondeur monofaisceau ou multifaisceaux, d’un sonar à interféromètre ou d’un lidar. Des normes internationales reconnues concernant les levés hydrographiques (voir le fichier Swath Bathymetry ROG à propos des lignes directrices opérationnelles concernant la bathymétrie par télédétection acoustique) dictent la
précision requise de ces corrections, qui font intervenir un réseau de marégraphes ou de
modèles prédictifs des marées.
Liens vers des documents
Swath Bathymetry ROG : lignes directrices opérationnelles concernant la bathymétrie par télédétection acoustique
182 3 - Comment se fait l’acquisition des données ?
3.6.4 - Techniques acoustiques
Les principales tâches d’épuration et de traitement des données acoustiques après leur acquisition consistent à éliminer les aberrations (signaux erronés et parasites) et à appliquer les réductions de la marée. Par exemple, dans le cas des sondeurs multifaisceaux, les aberrations ou erreurs se manifestent sous forme de points situés audessus ou en dessous du principal groupe de points (qui correspond au fond) ; on peut donc les sélectionner et les supprimer. Pour faire les réductions de la marée, il faut appliquer les changements de marée estimatifs ou mesurés dans la zone des levés pour la période où ces levés ont été effectués. Les mesures sont effectuées à l’aide de marégraphes, alors que les données estimatives peuvent être déduites des données hydrographiques publiées sur les marées.
Dans le cas des techniques de levé acoustiques, en plus de l’étalonnage initial, il est crucial de maintenir les bons paramètres des instruments et d’insérer les corrections requises. Si cela n’est pas fait correctement au moment des levés, les corrections seront difficiles à faire par la suite (voir le fichier Swath Bathymetry ROG ) à propos des lignes directrices opérationnelles concernant la bathymétrie par télédétection acoustique, de même que les guides d’instructions des fabricants). Il est essentiel de connaître avec
précision la position du navire, et de mesurer à intervalles réguliers la vitesse du son dans la colonne d’eau ainsi que les mouvements du navire (pilonnement, roulis et tangage). Si ces paramètres font l’objet d’un suivi au moment de l’acquisition des données, l’épuration et le traitement en seront d’autant facilités par la suite.
En résumé, il est conseillé d’avoir à bord l’équipement nécessaire pour faire l’étalonnage des instruments et pour traiter les données et contrôler leur qualité sur-le-champ, alors qu’il est encore possible de refaire au besoin l’acquisition des données.
Étant donné le haut débit et le volume considérable de données, le filtrage automatisé est un préalable nécessaire au contrôle de qualité et à l’épuration des données. Les opérateurs à bord doivent définir certains paramètres d’acceptation et de rejet, afin d’assurer l’élimination des signaux erronés ou des artefacts. Ces opérations de filtrage et de suppression des pointes sont essentielles et reposent sur les compétences et l’expérience de l’opérateur de terrain, qui peut en faire varier les paramètres selon de nombreux facteurs extérieurs.
Il faut toutefois utiliser les filtres avec précaution, car certaines données exceptionnelles ou non caractéristiques pourraient être rejetées ou altérées. Autant que possible, l’opérateur de terrain doit enregistrer ces données dans le fichier brut tout en les marquant afin que l’on puisse les examiner plus tard et prendre une décision à leur sujet.
3.6.5 - Prélèvement d’échantillons
Le prélèvement d’échantillons ne produit pas de flots de données qu’il faut vérifier, épurer et traiter au fur et à mesure. Ces échantillons peuvent toutefois devoir faire l’objet de certains traitements élémentaires à bord avant que l’on puisse les analyser.
Il faut déterminer et noter correctement le lieu des prélèvements. Un traitement partiel est faisable sur-le-champ – p. ex. tamisage et mesures de conservation des échantillons biologiques. Les métadonnées d’acquisition comprennent généralement l’emplacement géographique précis de l’échantillon, la date et l’heure de prélèvement, la profondeur.
C’est toujours une bonne chose de noter le plus tôt possible une description de l’échantillon. Il faudrait photographier de manière systématique tous les échantillons, sans oublier d’inclure leur numéro d’identification et une indication de l’échelle. Ces photos pourront s’avérer très utiles pour l’interprétation ultérieure des données et pour confirmer le prélèvement des échantillons en cas de mélange ou de perte.
Il faut appliquer des mesures appropriées d’assurance qualité et de contrôle de qualité à toutes les étapes du traitement des échantillons, de l’identification des espèces et du
3 - Comment se fait l’acquisition des données ? 183 décompte des spécimens. Les espèces réputées correctement identifiées mais présentes en très petit nombre – espèces rares – pourront être conservées ou non selon le type d’analyse à effectuer. Il faut évidemment éliminer les aberrations résultant d’une erreur, d’une mauvaise identification ou d’une contamination.
Il faut suivre des normes reconnues de taxinomie et de recensement. Mentionnons entre autres les protocoles du NMBAQC (système national de contrôle de qualité de l’analyse dans le domaine de la biologie marine) et les lignes directrices relatives au traitement d’échantillons du SGQAE (groupe de travail du CIEM sur l’assurance qualité des mesures biologiques dans l’Atlantique nord-est).
Assurance qualité de l’identification sur le terrain, à l’aide de collections de référence
En vertu des lignes directrices opérationnelles pour les prélèvements au chalut et à la drague, il faut autant que possible remettre au laboratoire la totalité des échantillons à des fins d’identification et de recensement. Cependant, les chaluts et les dragues peuvent donner des échantillons volumineux, qu’il n’est pas toujours possible de conserver en entier pour le laboratoire, à cause des possibilités limitées d’arrimage et de stockage à bord des navires. Il peut être alors plus approprié de traiter les échantillons à bord, par exemple à l’aide des systèmes de recensement semi-quantitatifs SACFOR ou DAFOR
(voir le fichier Applying SACFOR Report – Curtis et Coggan, 2007 – à propos de l’utilisation de l’échelle SACFOR pour l’enregistrement de l’abondance relative des organismes coloniaux dans des échantillons prélevés au chalut).
Une collection de référence de chaque échantillon doit être conservée à des fins d’assurance qualité. Cette collection doit contenir au moins un spécimen de chaque taxon ou espèce (sauf si le spécimen est identifié sans équivoque – p. ex. Asterias rubens). Les collections de référence pourront être traitées à terre pour confirmer l’identification faite sur le terrain. Les espèces de certains taxons ne sont pas faciles à distinguer rapidement sur le terrain (p. ex. Macropodia, Inachus, Ebalia, Galathea, Nucula, Abra, crevettes pandalid, etc.).
Si le temps ne permet pas d’identifier ou de distinguer les espèces de tels taxons, on peut alors placer dans la collection de référence tous les spécimens (ou un sous-échantillon) de ces taxons afin qu’ils soient identifiés (et pesés) à terre. (Remarque : le terme
collection de référence désigne ici une collection de spécimens triée sur place à des fins d’identification ultérieure au laboratoire. Le même terme désigne aussi un ensemble choisi de spécimens que l’on conserve en laboratoire pour confirmer l’identification d’échantillons, à des fins de contrôle de qualité, et aussi comme collection nationale ou régionale afin de s’assurer que l’identification des spécimens est cohérente à l’échelon national ou international).
Liens vers des documents
Applying SACFOR report : rapport sur l’utilisation de l’échelle SACFOR pour l’enregistrement de l’abondance relative des organismes coloniaux dans des échantillons prélevés au chalut
3.6.6 - Analyse de sédiments
Lorsque l’on prélève un échantillon physique, il faut le mettre dans un contenant et enregistrer les métadonnées de l’échantillon. Celles-ci comprennent généralement le type d’instrument, l’emplacement géographique précis de l’échantillon, la date et l’heure du prélèvement, la profondeur, le degré de récupération et le type de sédiment. Afin de réduire le risque d’erreur et donc le besoin de faire des corrections, c’est toujours une bonne chose de noter le plus tôt possible une description de l’échantillon. Les
métadonnées doivent respecter une structure définie afin que les mêmes zones soient enregistrées pour tous les échantillons. La typologie employée doit être prise en considération dans les notes afin que celles-ci soient cohérentes d’un échantillon à l’autre.
184 3 - Comment se fait l’acquisition des données ?
Le fichier Detailed explaination of seabed sediment classification – Long, 2006 –, qui contient une étude de cas sur la classification de sédiments, résume la typologie de Folk modifiée par la British Geological Survey – Commission géologique britannique – afin de correspondre à la typologie E
UNIS
des habitats. Il faut aussi mesurer la couleur de l’échantillon le plus tôt possible après le prélèvement.
Comme dans le cas des échantillons biologiques, il faut photographier de manière systématique tous les échantillons, sans oublier d’inclure leur numéro d’identification et une indication de l’échelle. Le sous-échantillonnage et les tests à des fins géotechniques devraient être faits le plus tôt possible afin de perturber au minimum les sédiments et d’éviter qu’ils ne sèchent trop.
Sauf indication contraire, les échantillons géochimiques organiques doivent être congelés.
Le traitement et l’épuration des données se font généralement au retour dans un laboratoire bien équipé.
Liens vers des documents
Seabed sédiment classification : étude de cas sur la classification de sédiments
3.6.7 - Techniques d’imagerie photographique et de vidéo sous-marines
Contrairement aux images acoustiques, les images photographiques et vidéo n’ont pas besoin d’être corrigées avant leur interprétation. Il peut être nécessaire de prévoir des règles d’interprétation d’images médiocres comme dans l’exemple de la sous-section
3.6.1 « Épuration des données » (s’il faut procéder à une évaluation quantitative et analyser des images prises à toutes les 30 secondes d’un cheminement de 20 minutes à des fins d’analyse biologique et géologique), où des images sont voilées par des sédiments non consolidés. À titre d’exemple de règle, on peut établir qu’une image dont au moins un quart est voilé par des sédiments déplacés ne pourra pas être analysée et qu’il faudra faire avancer le film jusqu’à la prochaine image acceptable, à partir de laquelle sera calculé le prochain intervalle de 30 secondes. Il peut être nécessaire de rendre les images plus nettes ou de les soumettre par lots à diverses fonctions d’un logiciel de traitement d’images. Le traitement à effectuer est propre à chaque jeu de données et peut comprendre une augmentation ou une diminution de la luminosité, du contraste, de la netteté ou de la saturation des couleurs afin de mieux voir les détails.
Les images photographiques et vidéo risquent d’être totalement inutiles du point de vue de la cartographie si elles ne sont pas correctement géoréférencées. Il est donc crucial de prendre des mesures adéquates pour noter l’emplacement géographique auquel correspond chaque image et fournir une estimation de la précision spatiale. Pour plus de détails sur le géoréférencement des images photographiques et vidéo, voir le fichier Video
ROG des lignes directrices opérationnelles concernant la vidéo.
Il est important de s’assurer que les images soient conservées sur un support fiable qui ne deviendra pas obsolète avec les progrès de la technologie. D’autre part, si des images sont copiées sur un support moins susceptible de devenir périmé, il faut veiller à ce que leur qualité soit préservée au cours de la copie. Par exemple, certains formats numériques sont conçus pour comprimer l’information, généralement en faisant une moyenne des régions qui ont l’air semblables. Dans le cas d’une bande vidéo, cela risque souvent de supprimer des détails là où ils seraient le plus nécessaires.
Liens vers des documents
Video ROG : lignes directrices opérationnelles concernant la vidéo.
3 - Comment se fait l’acquisition des données ? 185
3.6.8 - Imagerie des profils sédimentaires (IPS)
Géoréférencement des images
Il faut déterminer l’emplacement géographique précis auquel correspond chaque image.
Les lignes directrices opérationnelles concernant l’IPS recommandent d’enregistrer la position du GPS différentiel chaque fois que l’appareil d’IPS touche le fond pour prendre une photographie. Ainsi, l’emplacement géographique correspondant à chaque image peut être déterminé en établissant la correspondance entre le journal de terrain (où l’on a noté le numéro de l’image) et le journal de bord.
Si l’horloge interne de la caméra est synchronisée avec celle du GPS, il est utile de vérifier l’horodatage de l’image (zones EXIF ou IPTC associées à chaque image numérique) avec l’horodatage des données de position.
Dans les gros navires de recherche, le fichier de journal de navigation peut contenir les coordonnées de plusieurs points autour du navire, par exemple les portiques arrière et latéraux. Ces coordonnées sont calculées à partir de la distance entre ces points et un point de référence commun, en tenant compte de l’orientation du navire. Il faut
évidemment veiller à bien mesurer cette distance, c’est-à-dire à déterminer avec soin la position sur le navire où la caméra a été utilisée (p. ex. portique latéral). Dans les plus petits navires, ces distances ne sont pas nécessairement calculées, et le journal de navigation ne donne que la position de l’antenne du GPS différentiel. Il faut alors noter l’erreur ou la précision spatiale correspondante.
Analyse des images
Les images d’IPS permettent une analyse très détaillée donnant plus de 20 paramètres physiques, chimiques et biologiques pertinents pour les études de surveillance et d’évaluation. Pour plus de détails à ce sujet, voir la partie de la recension des normes et protocoles pour la cartographie des habitats benthiques qui porte sur l’IPS. Les notes cidessous concernent surtout l’information des images d’IPS qui est la plus pertinente pour la caractérisation des habitats dans un contexte de cartographie des habitats. La figure ciaprès montre les principales caractéristiques d’une image d’IPS.
Exemple des paramètres fondamentaux d’IPS utiles pour la caractérisation des
habitats
(source : Cefas).
Une simple inspection visuelle des images d’IPS peut donner de l’information sur les
éléments suivants :
– le type de sédiment (vase, sable, sable graveleux, etc.) ;
– le degré de stratification du profil sédimentaire, utile pour noter une couche de sédiment fin recouvrant un sédiment grossier ;
186 3 - Comment se fait l’acquisition des données ?
– la profondeur de pénétration (mesurable avec précision), qui indique le degré de fermeté du sédiment ;
– la rugosité de l’interface sédiment–eau, qui indique la présence de petites figures
sédimentaires ou de perturbations superficielles ;
– la présence de terriers ou de vides, qui indique une bioturbation du sédiment ;
– la présence d’une couche de discontinuité apparente du potentiel d’oxydoréduction, c’est-à-dire une fine couche typique de sédiment où les processus d’oxydation sont remplacés de manière spectaculaire par des processus de réduction, ce qui produit un sédiment plus foncé ;
– la présence de vestiges de couches de discontinuité apparente du potentiel d’oxydoréduction ;
– l’identité des organismes éventuellement présents. a
Au besoin, on peut faire une analyse granulométrique plus détaillée des sédiments. Dans le cas des vases, sables et graviers, on peut déterminer la taille des grains en comparant l’image de l’échantillon avec un ensemble d’images standard dont la taille moyenne des grains été déterminée en laboratoire (voir la figure ci-après). b c d
Exemples d’images d’IPS standard utilisées pour une analyse granulométrique : a) sable fin, b) sable moyen et grossier, c) sable grossier et gravier, d) mélange de sable et de gravier relativement grossier
(photos by R Diaz)
Dans le cas de matériaux plus grossiers, la taille des grains peut être déterminée à partir d’une image correctement étalonnée, à l’aide d’un logiciel d’analyse d’image. La répartition de la taille des grains peut être déterminée en mesurant tous les grains d’une partie représentative de l’image (voir la figure ci-après).
Image d’IPS agrandie d’un sédiment grossier, dont on a choisi une partie représentative
(rectangle rouge) où l’on mesurera la taille de chaque grain afin de déterminer la répartition de la taille des grains (photo by
R. Diaz).

Public link updated
The public link to your chat has been updated.