4.2 - Optimisation de l’analyse des données de terrain. IFREMER des habitats marins
Ci-dessous, vous trouverez de brèves informations sur les Guides de cartographie. Ce guide offre une méthode pour assurer la cohérence et la compatibilité des cartes d'habitats benthiques. Il aide à comprendre les processus et les décisions pour produire une carte d'habitats complète et de grande qualité.
4 - Comment réalise-t-on une carte ? 197
La modélisation dans la cartographie des habitats
On fait souvent la distinction entre modèles empiriques et modèles déterministes. Un
modèle empirique se fonde sur une analyse statistique des données, et les résultats s’expriment sous forme de probabilités. Dans l’analyse des données, il n’est pas nécessaire de comprendre la relation de cause à effet entre une variable indépendante et une variable dépendante, à condition que la relation fonctionne assez bien pour prédire la répartition des valeurs. Ce type de modèle est dit centré sur des données.
Un modèle déterministe prédit la répartition des valeurs à partir d’une connaissance des relations de cause à effet. Ce type de modèle peut s’exprimer sous forme de formules mathématiques (p. ex. calcul de courants de fond) ou de règles (p. ex. luminosité minimale pouvant soutenir la croissance des algues). Un modèle déterministe est souvent dit à base de règles. Les connaissances d’experts constituent une version de la modélisation à base de règles, dans laquelle les « règles » prennent la forme de connaissances d’experts et peuvent ne pas s’exprimer de manière systématique. Si l’on applique des connaissances d’experts et l’observation directe pour tracer les frontières entre habitats (p. ex. cartographie d’un littoral à partir de photographies aériennes), on parle alors de cartographie directe.
Les modèles mixtes combinent des éléments d’un modèle empirique et d’un modèle déterministe.
De plus, si la modélisation fait appel à la manipulation de cartes et d’autres données contenues dans un SIG, on la qualifie alors de modélisation cartographique. La
cartographie des habitats se fonde souvent sur des modèles mixtes à l’intérieur d’un SIG, où diverses données servent à prédire la répartition des milieux physiques susceptibles d’héberger une biocénose donnée. De tels modèles sont appelés modèles d’adéquation des milieux physiques (MAMP). Ces modèles sont ensuite traduits en cartes d’habitats sous l’hypothèse que les habitats correspondant à ces milieux physiques sont effectivement présents.
4.2 - Optimisation de l’analyse des données de terrain
La première étape de la production d’une carte d’habitats consiste à traiter, à analyser et
à classifier les données biologiques afin qu’elles puissent être intégrées aux couches physiques pour produire au bout du compte une carte d’habitats biologiquement pertinente.
Les données de terrain constituent un élément vital du processus de cartographie en ce qui concerne les caractéristiques physiques et biologiques. Elles sont nécessaires pour valider les données de télédétection et pour affecter des types de terrain aux régions cartographiées (p. ex. affleurements rocheux, plages de sable). Il est toutefois important de déterminer les classes d’habitat qui seront cartographiées. Il faut faire, entre des
biocénoses et les variables physiques correspondantes, des associations qui permettront de déduire la répartition des habitats là où des couches physiques seront disponibles (par
échantillonnage ou modélisation).
Il y a deux approches fondamentales de la détermination des classes d’habitat sur une
carte :
1. L’application directe d’une typologie existante (classification descendante) par l’observation sur place, en faisant appel au jugement d’experts pour faire la correspondance entre ce que l’on voit sur le terrain et les classes de la typologie ;
2. La détermination des classes d’habitat à partir des données de terrain, par une analyse des données permettant de faire des associations significatives entre des paramètres physiques et biologiques (classification ascendante).
198 4 - Comment réalise-t-on une carte ?
Schéma illustrant les approches descendante et ascendante de la détermination des classes d’habitat.
Dans l’approche descendante (à gauche), la typologie existante (rectangles) est appliquée aux
échantillons (cercles). Dans l’approche ascendante (à droite), les similarités entre échantillons servent
à déterminer les classes.
Les deux approches exigent de l’utilisateur une connaissance approfondie de la typologie qu’il utilise et de sa structure, afin qu’il puisse l’appliquer correctement et avoir confiance en l’exactitude des classes ainsi déterminées.
En ce qui concerne l’identification des habitats à partir d’images vidéo, voir White et al.,
2007.
4.2.1 - Méthodes de classification des données
La qualité et la quantité des données acquises dépendent non seulement des limites des techniques employées, mais aussi des coûts ainsi que des compétences disponibles en matière d’enregistrement et de taxinomie. Quel que soit le format, il est probable que les données soient enregistrées dans un classeur qui énumère les espèces par site et les caractéristiques physiques par site. On suppose que les données enregistrées sous cette forme respectent une norme acceptable et ont fait l’objet d’un processus d’assurance qualité (p. ex. vérification de la taxinomie).
Le traitement ultérieur de ces données dépend de la finalité du programme de
cartographie des habitats. Voici les options possibles :
– l’application d’une typologie existante. Trois méthodes sont communément employées pour attribuer une classe d’habitat à des données : (1) faire intervenir des experts pour choisir une classe uniquement parmi celles d’une typologie existante (p. ex. E
UNIS
) ;
(2) analyser les données et leur affecter une classe d’une typologie existante, mais seulement si les données correspondent adéquatement à cette classe ; si les données sont sensiblement différentes des descriptions existantes, on peut créer de nouvelles
classes pour les fins du levé local et proposer leur inclusion dans une version mise à sensiblement différente des descriptions existantes, analyser ces données et étendre la description générale ; dans une typologie, la plupart des habitats sont décrits d’une manière générale et les variations sont indiquées ; ces variations peuvent constituer le point de départ de la définition d’un niveau hiérarchique inférieur dans la typologie ;
– l’analyse multivariée pour définir des classes d’habitat propres à ce levé. Les données sont soumises à des techniques d’analyse statistique (en général multivariée) qui visent à les subdiviser en groupes naturels de données semblables. Ces groupes servent à définir des classes qui ont une signification principalement pour ce levé particulier. On s’attend toutefois à ce que les scientifiques entreprennent de lier leurs conclusions à d’autres levés semblables et que les classes définies de cette manière aient une validité plus étendue ;
4 - Comment réalise-t-on une carte ? 199
– la mesure de propriétés spécifiques des habitats. Elle permet d’attribuer à un lieu une
probabilité qu’il héberge une espèce ou corresponde à une classe d’habitat donnée.
Ces probabilités peuvent être cartographiées, à raison d’une carte par espèce ou par type d’habitat. Il en résulte donc une carte pour chaque classe, liée par exemple aux données sur plusieurs espèces (p. ex. nombre d’espèces et autres indices de diversité) ou sur une seule espèce (présence ou absence, abondance), à une caractéristique importante (p. ex. pourcentage de silt), ou à la probabilité de correspondre à une
classe d’habitat donnée.
4.2.2 - Application d’une typologie existante
Voici une description des trois méthodes d’application d’une typologie existante mentionnées à la sous-section 4.2.1 « Méthodes de classification des données ».
Analyse par des experts
Pour un observateur expérimenté ayant une bonne connaissance de la typologie, ce peut
être la manière la plus rapide de déterminer les classes d’habitat. En général, l’analyse par des experts sert à faire correspondre les observations faites sur le terrain avec les
classes d’habitat prédéfinies. Là où les habitats sont accessibles, on utilise beaucoup les données de terrain visuelles (c’est-à-dire l’observation humaine directe) résultant par exemple de levés à pied d’un littoral ou de levés en plongée. Un exemple de cette méthode est celui d’un levé en zone intertidale mené par le Countryside Council for Wales
(CCW) : des levés du littoral ont fourni des données de terrain pour des ébauches de
carte obtenues à partir de photographies aériennes. Le document CCW intertidal mapping.htm résume la méthodologie et illustre le rendu cartographique.
Détermination des classes d’habitat à partir d’observations
Il faut noter qu’il y a des inconvénients à se fier uniquement aux données de terrain et aux
classes d’habitat : cela ne permet pas de vérifier l’affectation des classes d’habitat au regard des données sur les espèces ou sur les caractéristiques des habitats. C’est une bonne chose de prendre des notes sur les espèces, les formes de vie et les caractéristiques des habitats, et de prendre des photos à des fins de référence.
Analyse des données au regard de descriptions de classes d’habitat
L’acquisition de données sur les espèces, les formes de vie et les caractéristiques des
habitats permet de leur affecter des classes d’une manière plus rigoureuse et systématique après le levé. Dans une typologie des habitats, par exemple E
UNIS
, la
200 4 - Comment réalise-t-on une carte ? définition des classes repose sur des caractéristiques physiques et des espèces clés, et s’accompagne de descriptions détaillées de la composition des espèces, de leur abondance relative et de leurs variations. On peut dans un premier temps analyser les données au regard des définitions de classe, puis utiliser les descriptions détaillées comme moyen de vérification.
Affectation automatique des classes d’habitat
L’affectation de classes d’habitat fondée sur le jugement d’experts introduit évidemment un certain degré de subjectivité dans l’interprétation, et il est possible que les conclusions soient différentes selon les observateurs. Idéalement, il faut une approche plus objective, que peut fournir dans une certaine mesure un système automatisé qui établit la correspondance entre les données de terrain disponibles et des classes d’habitat prédéfinies. C’est ce que fait le logiciel d'affectation de classes d'habitat (en abrégé HMP pour Habitat Matching Program – paragraphe 4.2.2.1) mis au point dans le cadre du projet
M
ESH
.
Le logiciel HMP fait appel à ce que l’on appelle des standards. Les standards sont des définitions normalisées des classes d’habitat de la typologie E
UNIS
et de la typologie des
habitats marins de Grande-Bretagne et d'Irlande (Connor et al., 2004). Ces définitions normalisées ont été élaborées à partir d’un corpus considérable de données de levés existants. Lorsque l’on soumet à HMP les données biologiques, physiques et environnementales d’une campagne de terrain, le logiciel cherche à les faire correspondre
à ses standards. HMP affiche les cinq meilleures correspondances, avec pour chacune une indication du degré de corrélation entre les données de l’échantillon et les standards.
L’affectation finale d’une classe d’habitat à des données fait appel au jugement de l’utilisateur, qui prend en considération la confiance qu’il a envers les données soumises et le degré de correspondance indiqué par l’indice de corrélation. Le paragraphe Logiciel d'affectation de classes d'habitat (voir paragraphe 4.2.2.1) contient plus de détails sur le logiciel HMP. Le logiciel et le guide d’utilisation sont accessibles dans le dossier des documents en fin de chapitre.
E
UNIS
_2004_report.pdf
: rapport sur le logiciel HMP
MNCR_04_05_introduction.pdf
: présentation de la version MNCR du logiciel HMP
Logiciel d'affectation de classes d'habitat
Le logiciel d'affectation de classes d'habitat (en abrégé HMP pour Habitat Matching
Program) automatise la classification d’échantillons benthiques selon les classes de la
typologie des habitats marins de Grande-Bretagne et d'Irlande (Connor et al., 2004) et des classes équivalentes de la typologie européenne E
UNIS
.
À l’heure actuelle, l’affectation à des données de classes d’habitat de ces typologies exige un niveau élevé de connaissances en biologie marine et peut prendre beaucoup de temps. C’est pourquoi le JNCC a mis au point dans le cadre du projet M
ESH
un logiciel qui vise à améliorer l’efficacité et l’exactitude de ce processus.
Ce logiciel consiste à établir la correspondance entre les données de terrain d’un levé en zone intertidale ou subtidale et des définitions normalisées (appelées standards) de
classes d’habitat des typologies de référence. HMP fait appel à des mécanismes de comparaison et de statistique pour établir cette correspondance. HMP accepte en entrée des données biologiques aussi bien que physiques. Ce logiciel est destiné :
– aux organismes qui entreprennent des levés d’habitats benthiques dont les données doivent être interprétées selon la typologie E
UNIS
ou la typologie des habitats marins de Grande-Bretagne et d'Irlande ;
4 - Comment réalise-t-on une carte ? 201
– aux organismes qui ont classifié des données de terrain d’après une version antérieure de ces typologiques et qui ont besoin d’une mise à jour selon la version la plus récente
(2004).
Principales caractéristiques de HMP – Est-ce l’outil approprié ?
Les standards de HMP sont fondés sur des données de terrain qui ont servi à définir les
classes de la typologie des habitats marins de Grande-Bretagne et d'Irlande, allant de la zone intertidale jusqu’à 200 m de profondeur. La représentation des habitats benthiques au large des côtes est plus limitée, et la typologie n’inclut pas à l’heure actuelle les
habitats pélagiques. HMP tente d’établir des correspondances avec les données de terrain de cette gamme d’habitats du Royaume-Uni et des eaux européennes avoisinantes.
HMP est capable d’analyser jusqu’à 250 échantillons à la fois. Il accepte les données biologiques sous forme semi-quantitative (SACFOR), quantitative (nombre/m
2
), ou de présence ou absence (1 ou 0). Il accepte également des données physiques portant sur neuf variables (p. ex. le substrat et la profondeur).
HMP affiche les cinq types d’habitat qui correspondent le mieux à chaque échantillon, à partir d’analyses séparées des données biologiques et physiques. De plus, il peut construire un tableau comparatif des données des échantillons (p. ex. nom et nombre d’individus de chaque taxon) par rapport à celles de ces cinq types d’habitat (standards).
HMP est un logiciel convivial qui ne requiert qu’une connaissance élémentaire de MS
Excel. L’utilisateur doit toutefois avoir certaines connaissances en biologie marine pour pouvoir interpréter les résultats de manière optimale.
Les standards
Les fichiers de standards contiennent des profils biologiques ou physiques qui constituent les caractéristiques représentatives de chaque type d’habitat. Ces fichiers font partie de
HMP et servent à établir la correspondance entre les données des échantillons et les types d’habitat. Les fichiers de standards ont été produits par le JNCC à partir des données (conservées dans l’application de base de données Marine Recorder) des levés qui ont servi à définir chacun des types d’habitat de la typologie des habitats marins de
Grande-Bretagne et d'Irlande (Connor et al., 2004).
Fonctionnement du processus d’établissement des correspondances
HMP compare chaque enregistrement de données d’un échantillon avec tous les profils du fichier de standards pertinent, en faisant appel à des techniques d’analyse statistique multivariée, afin de trouver les standards qui correspondent le plus étroitement au profil de l’échantillon. Il affiche les cinq standards qui correspondent le mieux, pour les données biologiques d’une part et les données physiques d’autre part. Les résultats sont affichés sous forme de tableau (voir la figure). Le nom ou le code de l’échantillon figure à l’extrême gauche de chaque ligne du tableau, et les cinq types d’habitat qui lui correspondent le mieux suivent en ordre de gauche à droite. Les meilleures correspondances pour les données biologiques et pour les données physiques sont présentées ensemble dans deux parties d’un même écran. À l’heure actuelle, HMP affiche les cinq meilleures correspondances, peu importe jusqu’à quel point ces standards sont « éloignés » de l’échantillon. Pour cette raison, et aussi du fait que les meilleures correspondances ne sont pas nécessairement les mêmes dans le cas des données biologiques et des données physiques, l’utilisateur peut choisir le type d’habitat qu’il considère le plus approprié pour l’échantillon. Pour faciliter ce choix, HMP donne une idée de la « qualité de la correspondance » sous forme d’un indice de corrélation pour chacun des cinq types d’habitat affichés, et fournit diverses options de comparaison des résultats.
202 4 - Comment réalise-t-on une carte ?
Tableau de résultats d’analyse de HMP contenant l’identification des échantillons (colonne de gauche) et les trois meilleures correspondances pour les données biologiques et physiques
On peut consulter en fin de chapitre les liens suivants :
Technical Summary and Examples.doc
donne des renseignements techniques supplémentaires sur le logiciel HMP
Manual_for_Habitat_Matching_Program_v2.pdf
est le guide complet d’utilisation http://www.searchmesh.net/ est le site Web du projet M
ESH
, où le logiciel HMP sera accessible en 2008.
4.2.3 - Définition des classes d’habitat propres à un levé
Les données sur les espèces et les caractéristiques physiques peuvent servir à créer des
classes fondées sur les similarités et les dissimilarités entre ces données. L’analyse multivariée de ces données constitue une approche empirique de la détermination des
classes d’habitat (où on « laisse les données s’exprimer ») qui exploite au maximum les données de terrain biologiques, physiques et environnementales. Cependant, l’analyse est habituellement orientée d’une certaine manière pour accentuer l’importance des espèces clés ou des raretés (voir plus loin l’alinéa Transformation). Pour l’essentiel, cette méthode consiste à faire une analyse statistique de nombreux échantillons différents afin de trouver des associations significatives entre les biocénoses et les conditions du milieu où elles vivent. Ces associations peuvent ensuite servir à définir et à classifier différents
habitats « naturels ».
Le principe du processus d’association entre données biologiques et physiques et de définition de caractéristiques d’habitat est simple. À partir d’un ensemble d’échantillons pour lesquels on dispose de données biologiques, physiques et environnementales, ce processus se déroule en quatre étapes :
1. Recherche de structures ou de groupes dans les données biologiques (voir paragraphe 4.2.3.1)
4 - Comment réalise-t-on une carte ? 203
2. Recherche de structures ou de groupes dans les données physiques (voir paragraphe 4.2.3.2)
3. Recherche de corrélations entre structures des données biologiques et physiques, afin de définir des classes d'habitat (voir paragraphe 4.2.3.3)
4. Détermination des principales espèces caractéristiques et des propriétés physiques de chaque classe d'habitat (voir paragraphe 4.2.3.4)
Biological patterns
Correlation?
Habitat descriptions
Mud & Nephrops
Sand & Ensis
Gravel & Pecten
Cobbles & hydroids
Boulder & sponge
Habitat
Classes
Physical patterns
Détermination de classes d’habitat à partir de structures des données biologiques et physiques et de leurs corrélations
Les similarités et les dissimilarités se mesurent généralement à l’aide du coefficient de similarité de Bray-Curtis. Les coefficients ainsi calculés entre tous les échantillons pris deux à deux sont mis dans une matrice. Ensuite, on utilise deux techniques complémentaires d’analyse multivariée, l’ORDINATION et la CLASSIFICATION, pour trouver les groupes naturels d’échantillons semblables.
Un certain nombre de logiciels d’analyse statistique sont souvent utilisés en écologie benthique :
– PRIMER (Plymouth Routines In Multivariate Ecological Research – Modules Plymouth de recherche multivariée en écologie) offre des fonctions d’ordination par positionnement multidimensionnel non métrique (module MDS) et par analyse des composantes principales (PCA), afin de réunir en groupes d’échantillons (ou d’espèces) des structures de composition d’espèces et de variables environnementales ainsi que des modèles de regroupement hiérarchique (CLUSTER et SIMPROF) (Clarke et Warwick, 2001 ; Clarke et Gorley, 2006). PRIMER repère les variables (espèces) qui contribuent le plus aux similarités entre échantillons (SIMPER), analyse les similarités et dissimilarités entre groupes d’échantillons (ANOSIM, analogue des tests ANOVA d’analyse univariée), teste des relations entre deux ensembles d’échantillons selon des modèles multivariés (RELATE), repère les variables environnementales qui « expliquent le mieux » les structures des données biologiques (BEST). PRIMER possède également une vaste gamme de modules d’analyse univariée, de fonctions graphiques et d’autres modules d’analyse de données biologiques, physiques et environnementales ;
– DECORANA (DEtrended CORrespondence ANAlysis – Analyse des correspondances redressée) est un outil d’ordination complété par TWINSPAN (two-way indicator species analysis – Analyse à double entrée d’espèces indicatrices), outil de
classification d’espèces et d’échantillons qui produit un tableau à double entrée ordonné de leur occurrence (Hill, 1979a,b). Le processus de classification est hiérarchique : les échantillons sont répartis successivement en catégories, et les espèces sont ensuite réparties en catégories selon la classification des échantillons ;
204 4 - Comment réalise-t-on une carte ?
– CANOCO est une extension de DECORANA (Hill, 1979b). Ce logiciel comprend les techniques indirectes d’analyse des composantes principales, d’analyse des correspondances (redressée) et d’analyse des coordonnées principales, de même que les techniques directes de calcul de moyenne pondérée, d’analyse canonique des correspondances (ou analyse discriminante linéaire) et d’analyse de redondance (ter
Braak, 1986 et 1988). CANOCO peut en outre vérifier à l’aide de tests de permutation de Monte Carlo si des espèces sont liées à des variables environnementales mesurées
(ter Braak, 1988).
Préparation des données
L’emploi d’outils d’analyse suppose que les données soient préparées de manière appropriée. En résumé, il faut s’assurer des points suivants :
– la taxinomie est correcte, du moins jusqu’à un certain niveau taxinomique (ou forme de vie en cas d’incertitude), et la nomenclature est normalisée afin d’éliminer les différences de noms (synonymes) d’un levé à l’autre ;
– seules des données acquises à l’aide de techniques comparables sont regroupées
(p. ex. les données de prélèvements à la benne et de carottages ne sont pas regroupées) ;
– lorsque des appareils différents ont été utilisés, par exemple une benne de 0,1 m
2
et une benne de 0,25 m
2
, les données sont normalisées en conséquence, par exemple en exprimant l’abondance des espèces en nombre par mètre carré ; la normalisation peut aussi se faire sous forme de pourcentages, mais cela risque de prêter à confusion ;
– il peut être souhaitable de transformer les données afin de diminuer l’influence des taxons très abondants, qui pourraient masquer des structures biologiques sousjacentes ;
– à l’opposé, il peut être souhaitable de choisir des espèces clés afin de mettre l’accent sur les espèces structurantes ou qui ont un rôle majeur, et de diminuer l’importance des raretés, ou même d’éliminer les espèces très rares des données ;
– les données physiques comprennent souvent des mesures de différentes variables, comme la température (
°C), la salinité ( o
/ oo
) et la profondeur (m). Comme ces variables sont mesurées avec des unités différentes, il faut normaliser les données de manière à les situer sur une échelle sans unité (afin que l’on puisse les comparer).
Avertissements
L’utilisation de techniques d’analyse requiert des compétences spécialisées. Il faut être conscient des limites des données et savoir comment les choix effectués en cours d’analyse peuvent influer sur les résultats. Il faut toujours exercer un jugement d’expert dans l’interprétation des résultats.
¾
Les transformations modifient de différentes manières la pondération des espèces rares par rapport aux espèces abondantes. La transformation la plus radicale consiste
à réduire l’abondance à une indication de présence ou d’absence. L’utilisation du système SACFOR est aussi une forme de transformation. Les données sur l’abondance des espèces peuvent être transformées selon la racine carrée, la racine quatrième ou le logarithme des nombres d’individus. Les transformations peuvent avoir des effets très importants sur la nature des groupes déterminés (voir la soussection 3.6.5).
¾
Il est souvent inapproprié d’inclure une trop grande variété d’habitats dans une analyse multivariée, dont les résultats reflètent alors des catégories évidentes
(habitats de gravier d’une part, de vase d’autre part) en masquant des différences plus
4 - Comment réalise-t-on une carte ? 205 subtiles et « intéressantes » au sein de ces groupes. Il peut être préférable d’analyser séparément des habitats très différents.
¾
L’endofaune et l’épifaune sont rarement échantillonnées de manière efficace par une même technique. Il est donc normal de les échantillonner et de les analyser séparément, ce qui donne des ensembles distincts de classes de biocénose. Les analyses de l’endofaune conviennent davantage à des sédiments non consolidés
(vases, sables, graviers), et les analyses de l’épifaune à des sédiments consolidés
(rochers, blocs). Il faut s’attendre à certaines difficultés pour les substrats
intermédiaires (cailloutis), où l’habitat est caractérisé par l’endofaune aussi bien que l’épifaune.
Les descriptions de « biotope » de la typologie des habitats marins de Grande-Bretagne et d'Irlande (Connor et al., 2004) et de la typologie E
UNIS
(EUropean Nature Information
System – Système européen d’information sur la nature) ont tendance à favoriser l’épifaune sur les substrats durs (où elle est facilement observable) et l’endofaune dans les substrats meubles (où elle est plus abondante que l’épifaune). Un nombre relativement restreint de « biotopes » ont une description approfondie de l’endofaune aussi bien que de l’épifaune. Il est important d’être conscient de ces limites des descriptions de « biotope » existantes et du fait que des échantillons peuvent fournir des données plus complètes sur l’endofaune aussi bien que l’épifaune.
À l’heure actuelle, il y a peu de documentation sur les liens entre épifaune et endofaune.
Si l’on découvrait de tels liens, l’évaluation des « biotopes » à des fins de validation sur le terrain serait plus simple et moins coûteuse. Les associations entre l’endofaune et l’épifaune font l’objet d’une autre étude du projet M
ESH
intitulée « supervisée », p. 241.
4.2.3.1 - Recherche de structures dans les données biologiques
L’objectif visé ici est d’analyser les données biologiques des échantillons, qu’il faut avoir en nombre suffisant, afin d’identifier et de caractériser des biocénoses « naturelles » distinctes. Le processus commence avec l’hypothèse vide selon laquelle les échantillons ne présentent aucune différence de structure de la biocénose (c’est-à-dire qu’ils contiennent les mêmes types d’espèces et dans les mêmes proportions). Si l’analyse montre que c’est faux, on rejette l’hypothèse vide pour classer les échantillons en groupes qui ont des biocénoses semblables. Il en résulte une structure des données biologiques que l’on peut ensuite examiner afin de repérer les espèces qui caractérisent les
échantillons d’un groupe et celles qui distinguent un groupe d’un autre.
206 4 - Comment réalise-t-on une carte ?
22 samples 5 groups
Characterising taxa
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
• ---------
v s v s v s v s v s
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
- - -- - -- - -- - --
Discriminating taxa
Groupement des données des échantillons et identification des taxons qui distinguent les groupes les uns des autres
Préparation des données
Une certaine préparation des données est généralement nécessaire avant l’analyse. En plus de vérifier que l’identification taxinomique est cohérente dans l’ensemble des
échantillons (absence de synonymes), il faut souvent normaliser les jeux de données ou les transformer (p. ex. quant à la méthode d’expression de l’abondance des espèces).
Ces opérations peuvent parfois s’effectuer dans le logiciel d’analyse.
Normalisation
Le prélèvement d’échantillons benthiques est susceptible de donner lieu à un degré assez
élevé d’« erreurs d’échantillonnage » ou de variations. Par exemple, il est très difficile d’assurer la constance des prélèvements au chalut, car la distance parcourue par le chalut est potentiellement très variable d’un prélèvement à l’autre, même si ceux-ci sont de durée fixe (p. ex. 10 minutes), à cause de l’effet de la marée et des conditions météorologiques sur la vitesse du navire qui remorque le chalut. Il faut donc normaliser les données afin d’éliminer les variations d’échantillonnage. Dans le cas d’échantillons prélevés au chalut, on calcule la surface balayée à chaque prélèvement (distance parcourue
× largeur du chalut) et on exprime l’abondance (ou la biomasse) des espèces par unité de surface du fond (p. ex. par m
2
, 10 m
2
, 100 m
2
ou km
2
, selon le cas). Dans le cas des échantillons prélevés à la benne ou par carottage, la convention acceptée est d’exprimer l’abondance (ou la biomasse) par unité de surface du fond échantillonné plutôt que par unité de volume de matériel prélevé. C’est pour cette raison que les spécifications des bennes et des carottiers font référence à une surface (p. ex. benne Day de 0,1 m
2
, carottier-boîte de 0,2 m
2
, etc.). Une méthode universelle de normalisation de l’abondance ou de la biomasse consiste à l’exprimer sans unités, c’est-à-dire à la convertir en pourcentage.
4 - Comment réalise-t-on une carte ? 207
Espèce
Abondance Abondance Abondance en nombre d’individus par
100 m
Ech 1 Ech 2 Ech 1
2
162.5 68.9
en pourcentage
Ech 2 Ech 1 Ech 2
Exemple de normalisation des données sur l’abondance des espèces. Deux prélèvements au chalut couvrant des surfaces différentes
(200 m
67.5
3.2
4.3
2
pour l’échantillon 1 et 390 m
2
pour l’échantillon 2) ont été effectués. Même si les
46.0
0.4
7.4
19.5
données en nombres d’individus semblent
0.4
8.6
18.7
2
et abondance en pourcentage) montrent que les deux
0.6
0.5
Totaux 472 934 236.0 100 100
Transformation
Dans les biocénoses, il est courant d’avoir un grand nombre de petits animaux et un nombre relativement limité d’espèces de grande taille, ce qui peut poser des problèmes dans les analyses de biocénose fondées sur l’abondance des espèces. En effet, une ou deux espèces très nombreuses semblent alors être les seuls descripteurs significatifs de la biocénose, alors que celle-ci peut en fait compter plus d’une centaine d’espèces, dont certaines de grande taille et caractéristiques de l’habitat (p. ex. le tourteau), mais présentes en nombre restreint. Il faut donc équilibrer les données de manière à réduire l’influence statistique des espèces très nombreuses et de rehausser l’importance des espèces moins abondantes. Cela se fait par simple transformation mathématique des données brutes sur l’abondance des espèces, comme le montre le tableau ci-après. La racine carrée, la racine quatrième et la fonction Log(x+1) ont un effet de plus en plus important sur les données brutes. La transformation « Présence ou absence » est la plus radicale de toutes puisqu’elle élimine entièrement les données sur l’abondance. Le choix de la transformation à utiliser est une question d’expérience et de jugement, mais on peut répéter systématiquement les analyses afin de tester des transformations de plus en plus radicales.
Abondance
Transformations
Racine carrée
Racine quatrième
Log
(x+1)
P ou A
Exemple de tableau des
1
1
10 000
100 000
100.00
316.23
1 000 000 1000.00
10.00
17.78
31.62
4.00
5.00
6.00
1
1
1
Certaines formes de vie ne se prêtent pas à des mesures d’abondance en nombres d’individus. C’est le cas par exemple des espèces coloniales (p. ex. Éponges, Hydraires,
Bryozoaires), qui peuvent cependant être caractéristiques de certains habitats, en particulier les récifs de cailloutis, les affleurements rocheux, ainsi que les graviers et sables stables. Il est donc crucial d’inclure ces espèces dans l’analyse, et les données sur la biomasse peuvent alors être préférables aux statistiques d’abondance. Les données sur la présence ou l’absence des espèces permettent de faire une évaluation initiale portant sur toutes les formes de vie, coloniales ou non. Cette évaluation constitue un point de départ utile de l’analyse, que l’on peut ensuite raffiner en utilisant les données sur l’abondance ou la biomasse. L’utilisation des données sur l’abondance exclut en principe toute prise en considération des espèces coloniales, parce que celles-ci sont typiquement notées sur une échelle non numérique d’abondance relative (p. ex. l’échelle SACFOR décrite précédemment) et que les logiciels d’analyse sont incapables de traiter des données non numériques.
208 4 - Comment réalise-t-on une carte ?
Dans un tel cas, on convertit les données sur l’abondance relative ou la biomasse en
« équivalents numériques » en leur attribuant ce qui semble être une valeur d’abondance appropriée. Les méthodes qui permettent de faire une telle conversion de manière cohérente en sont encore à leurs balbutiements, mais cela ne devrait pas constituer un obstacle si l’on considère l’effet des transformations probables sur les valeurs ainsi attribuées. En effet, l’ordre de grandeur est plus important que la valeur précise, comme le montre le tableau.
Valeur attribuée Racine carrée Racine quatrième Log (x+1)
100 10.00 3.16 2.00
200 14.14 3.76 2.30
1000 31.62 5.62 3.00
2000 44.72 6.69 3.30
Méthodologie
La méthode la plus souvent employée pour déterminer les structures des données biologiques est l’analyse de groupement. Les similarités entre échantillons peuvent être visualisées à l’aide d’un dendrogramme (analyse de groupement) ou d’un schéma d’ordination (voir plus loin). Un certain nombre de logiciels permettent de faire ces analyses, par exemple PRIMER , MVSP
(Multi Variate Statistical Package – Logiciel statistique d’analyse multivariée) et CLUSTAN
(CLUSter ANalysis – Analyse de groupement).
L’analyse de groupement est une technique qui consiste à comparer la composition de chaque échantillon avec celle de chacun des autres échantillons (comparaisons deux à deux). Cette technique est valable pour les données sur la présence ou l’absence, l’abondance et la biomasse. En Europe, l’indice de comparaison le plus utilisé est le coefficient de similarité de Bray-Curtis. Une similarité triangulaire des similarités entre
échantillons est produite puis utilisée dans une procédure qui regroupe les échantillons les plus semblables. Ces groupes sont placés dans un dendrogramme qui représente la hiérarchie des similarités entre échantillons et groupes d’échantillons (figure ci-dessous).
Clustering
20
80
100
40
60
Samples
1 2 3 4
A
17 0 0 0
B
21 0 0 13
C
17 25 0 18
D
0 19 35 17
E
0 34 43 12
F
0 0 0 0
Sample
1 2 3 4
1 -
2 25.6
-
3 0.0 67.9
-
4 52.2 68.1 42.0
-
Samples
3
2D Stress: 0
2
Sample data Similarity index
1
4
Ordination
Schéma d’une analyse de groupement. À partir d’une matrice donnant l’abondance des espèces dans chaque échantillon, on calcule un indice de similarité (au centre) à partir duquel on trace un dendrogramme des similarités, ou un schéma d’ordination dans lequel les échantillons semblables sont entourés (d’après Clarke et Warwick, 2001).
4 - Comment réalise-t-on une carte ? 209
Le schéma d’ordination est une autre façon de représenter ces similarités et dissimilarités.
Des points représentant les échantillons sont placés dans un espace multidimensionnel de telle sorte que la distance entre deux points représente le degré de similarité ou de dissimilarité entre les échantillons correspondants (plus les points sont rapprochés, plus les échantillons sont similaires). Une méthode populaire, appelée positionnement multidimensionnel non métrique, fait appel aux valeurs de similarité ordonnées, de sorte que les deux points les plus rapprochés correspondent aux échantillons les plus similaires, et les deux plus éloignés aux échantillons les moins similaires. En réalité, le schéma compte n-1 dimensions, où n est égal au nombre d’échantillons, mais pour faciliter l’interprétation, le schéma est ramené à 2 ou 3 dimensions avec une valeur de
« contrainte » qui indique jusqu’à quel point le schéma 2D ou 3D représente l’ordination multidimensionnelle.
Pour faciliter l’interprétation des ordinations par positionnement multidimensionnel, on peut tracer des contours qui mettent en évidence les groupes d’échantillons similaires déterminés par l’analyse de groupement. Par exemple, dans le schéma d’ordination ciaprès des données sur l’épifaune, on délimite trois groupes principaux (contours rouges).
On associe à chaque échantillon un disque dont la surface représente l’abondance relative d’une espèce choisie. Dans ce cas-ci, le crabe porcelaine Pisidia longicornis est nettement une espèce caractéristique de l’un des groupes.
T ransform: Fourth root
Resemblance: S17 Bray Curtis similarity
3D Stress: 0.13
Pisidia longicornis
178
179
158
182
124
105
38
185
177
156
145
147
144
180
97
49
99
16
164
190
52
77
100
176
84
128
163
152
157
37
149
34 169
33
165
40
206
111
3
171
146
26
116
30
203 112
210
93
45
196
4
60
64
238
94
153
57
202
197
201
68 66
43
134
58
172
173
3
12
21
30
Exemple de représentation en 2 dimensions d’une ordination par positionnement multidimensionnel des données sur l’épifaune. Les stations d’échantillonnage sont étiquetées par leur numéro d’ordre.
Les traits rouges sont des contours d’indice de similarité de 42 %. Par conséquent, tous les
échantillons à l’intérieur d’un contour ont un indice de similarité d’au moins 42 %. Trois groupes principaux ressortent à ce niveau de similarité. À chaque échantillon est associé un cercle qui représente l’abondance relative du crabe porcelaine Pisidia longicornis. L’échelle d’abondance relative de ces cercles figure à droite du graphique.
4.2.3.2 - Recherche de structures dans les données physiques
L’objectif visé ici est de trouver dans les paramètres physiques et environnementaux des structures qui déterminent le type d’habitat. Le substrat (rocher, gravier, sable, vase, etc.) est généralement le principal facteur, car chaque type de substrat fournit des conditions de vie différentes et héberge donc des biocénoses manifestement différentes. Ces conditions sont modifiées par des paramètres environnementaux tels que la profondeur, l’exposition (aux vagues et à l’énergie des marées), la salinité, etc., qui forment une
210 4 - Comment réalise-t-on une carte ? matrice multidimensionnelle de milieux physiques. L’analyse des données physiques et environnementales indique quelle partie de cette matrice est représentée par un
échantillon et quelles sont les principales composantes qui caractérisent et différencient des groupes d’échantillons.
Préparation des données
Seules de véritables variables (pourcentage de gravier, de sable ou de vase dans des sédiments, mesures réelles de la température et de la salinité, etc.) peuvent donner lieu à des analyses numériques. Il est parfois souhaitable de simplifier l’analyse en convertissant les données en catégories que l’on utilise ensuite comme facteurs. Cette approche est courante dans le cas des données sur les sédiments, où l’on utilise le triangle de Folk pour classifier les échantillons de sédiments en catégories telles que
« sable graveleux », « gravier sableux », « vase sableuse », etc., que l’on voit sur de nombreuses cartes de sédiments benthiques.
De nombreux facteurs ou descripteurs environnementaux sont enregistrés sous forme de catégories. C’est le cas par exemple de l’exposition aux vagues (exposé, abrité, extrêmement abrité) et des étages ou zones biologiques (sublittorale, infralittorale, circalittorale, etc.). Ces catégories sont souvent notées sous forme de codes, plus faciles
à manipuler dans un tableur ou à lire sur un graphique. Si l’on utilise des codes numériques, il faut se rappeler qu’il s’agit de catégories et que l’on ne peut pas les utiliser dans des analyses numériques.
Lorsque l’on mesure un ensemble de variables physiques et environnementales, les données sont exprimées avec une variété d’unités différentes (p. ex la température en
°C, la salinité en o
/ oo
, la vitesse du courant en nœuds ou en m/s). Il est futile de tenter une analyse numérique sur les valeurs absolues de ces mesures, car les données dont les valeurs ont la plus grande étendue sembleront avoir l’influence la plus grande. Pour surmonter cette difficulté, il faut exprimer les données sous forme de valeurs relatives, sans unités. Cela se fait par une opération mathématique simple appelée normalisation, à partir de la moyenne et de l’écart type des valeurs. L’opération consiste à soustraire de chaque valeur la moyenne, puis à diviser le résultat par l’écart type.
Dans l’exemple ci-dessus, les valeurs de la température vont de 5 à 14
°C, et celles de la salinité de 33,1 to 34,0 o
/ oo
. Ces deux jeux de données semblent très différents lorsque l’on regarde les valeurs (colonne A), ou même leur étendue, leur moyenne ou leur écart type. La normalisation des données les rend indépendantes des unités de mesure. Si l’on compare les données normalisées (colonne C), on constate que la température et la salinité ont des structures identiques.
4 - Comment réalise-t-on une carte ? 211
Méthodologie
Il y a plusieurs manières de déterminer des structures dans les données physiques. La plus connue est probablement l’analyse des composantes principales (ACP). Cette méthode d’ordination simplifie les données physiques en les exprimant dans un nouveau système de coordonnées, de telle sorte que la première coordonnée (première composante principale) ait la plus grande variance, que la deuxième composante principale ait la deuxième plus grande variance, et ainsi de suite. Dans cette méthode d’analyse indirecte des gradients, les échantillons sont répartis selon les axes d’ACP. Les composantes principales représentent des combinaisons linéaires des variables.
50
0
% Sand
D
D
D
Mean (mm)
C
Sorting
B
% Gravel
B
B
C
C
% Silt/Clay
-50
-50 0
PC1
50 100
Graphique résultant d’une analyse des composantes principales (ACP) des données d’échantillons de sédiments prélevés dans quatre zones (A à D) du banc Hastings Shingle dans la Manche (Brown et al.,
2001). Les variables sont la taille moyenne des grains (mm), le coefficient de classement, le pourcentage de gravier, le pourcentage de sable, et le pourcentage de silt ou d’argile. La plus grande variance (le long de l’axe de la première composante principale) est clairement définie par le rapport du contenu des échantillons en sable et en gravier.
On peut néanmoins appliquer aux données physiques les mêmes techniques employées pour l’analyse des données biologiques. Ainsi, l’analyse de groupement et l’ordination par positionnement multidimensionnel constituent des méthodes simples de détermination des structures. Cependant, le coefficient de similarité de Bray-Curtis n’a pas la même utilité pour les données physiques que pour les données biologiques, parce que la valeur zéro n’a pas de signification particulière dans les données physiques : elle ne représente qu’un point sur une échelle, alors que dans les données biologiques un zéro indique l’absence d’une espèce. Comme les variables ont probablement des échelles différentes, la normalisation produit des valeurs négatives et positives. Des mesures de distance comme la distance euclidienne constituent donc la meilleure mesure de similarité pour des données physiques et environnementales.
212 4 - Comment réalise-t-on une carte ?
Représentation en 2 dimensions d’une ordination par positionnement multidimensionnel des mêmes données que dans le graphique précédent d’ACP (Brown et al., 2001). Le regroupement plus serré des échantillons des zones A et D indique que ceux-ci sont plus semblables et plus constants dans leur composition que les échantillons des zones B et C.
4.2.3.3 - Recherche de corrélations entre structures des données biologiques et physiques
Différentes méthodes sont disponibles pour examiner les corrélations entre les structures couramment utilisés qui possèdent une variété de fonctions d’analyse multivariée.
PRIMER
PRIMER (Plymouth Routines In Multivariate Ecological Research – Modules Plymouth de recherche multivariée en écologie) comporte une vaste gamme de modules d’analyse univariée et multivariée et de fonctions graphiques pour l’analyse de données biologiques, physiques et environnementales (Clarke et Warwick, 2001 ; Clarke et Gorley, 2006). Les modules BEST et LINKTREE sont conçus pour lier des structures de données biologiques multivariées à une ou plusieurs variables environnementales.
Le module BEST de la version 6 de PRIMER combine les fonctions BIO-ENV et BVSTEP de la version 5. BIO-ENV utilise toutes les variables environnementales disponibles pour trouver la combinaison qui « explique le mieux » les structures des données biologiques.
Cependant, lorsqu’il y a un grand nombre de variables (plus de 15 ou 16), ce module peut perdre de son utilité à cause du temps de calcul trop long. L’option BVSTEP permet alors d’effectuer une recherche par étapes des variables significatives, à la fois par sélection
ascendante et par élimination descendante. En commençant par la variable ayant le coefficient de corrélation le plus élevé, on ajoute successivement des variables, on teste les combinaisons qui en résultent et (à chaque étape) on élimine la variable dont la contribution est la moindre. Plusieurs itérations de la procédure sont effectuées à partir d’un certain nombre (p. ex. jusqu’à 6) de variables choisies au hasard, afin de trouver la
« meilleure corrélation ».
4 - Comment réalise-t-on une carte ? 213
Exemple de tableau d’analyse de BIO-ENV portant sur la répartition des Polychètes benthiques dans la mer d’Irlande (tiré de Mackie et al., 1997). Une combinaison de trois variables environnementales
(pourcentage de gravier, pourcentage de silt et profondeur) donne la corrélation la plus élevée avec les structures observées dans les données biologiques.
À partir de la combinaison de variables qui, d’après la fonction BIO-ENV, « explique le mieux » les structures des données biologiques, et des similarités fauniques entre stations, le module LINKTREE trouve la manière la plus efficace de décrire les relations entre les données biologiques et environnementales par rapport aux variables successives prises séparément. En commençant avec le groupe formé de tous les
échantillons, LINKTREE le sépare en deux groupes (séparation binaire) en fonction de la ou des variables environnementales qui exercent le plus d’influence. Par exemple, la première séparation pourrait être telle que les deux groupes soient les moins similaires quant à la salinité de l’eau. En répétant de manière itérative ce processus sur les groupes résultants, LINKTREE sépare les échantillons en un certain nombre de groupes, à l’intérieur desquels tous les échantillons ont des caractéristiques biologiques et physiques semblables.
Plus techniquement, l’ensemble des échantillons est successivement séparé selon la ou les variables environnementales qui maximisent la séparation entre les groupes dans un espace multidimensionnel. Il arrive que plusieurs variables interviennent dans une séparation (lorsque chacune de ces variables donne le même résultat). Un test statistique sert à déterminer si une séparation est significative (à un niveau de 5 %). Si elle ne l’est pas, le processus de séparation s’arrête. Une valeur de sortie (B %, voir le tableau) donne une mesure absolue des différences entre groupes, une faible valeur indiquant que les
échantillons sont similaires.
Contrairement à l’analyse de groupement, le regroupement se fait ici par séparation, et il peut y avoir des inversions dans le modèle de regroupement. À la différence de BIO-ENV, les variables environnementales sont non additives dans LINKTREE. Cela présente l’avantage qu’une variable peut être jugée importante dans une partie de toute la répartition de la faune, mais pas ailleurs (à l’inverse, BIO-ENV examine la situation dans son ensemble). Le module LINKTREE a aussi un potentiel de prédiction : si les conditions du milieu sont connues pour une nouvelle station d’échantillonnage, les résultats du
LINKTREE permettent d’affecter celle-ci à un ensemble ou groupe particulier de sites.
214 4 - Comment réalise-t-on une carte ?
Exemple d’analyse effectuée par le module LINKTREE de PRIMER : séparations binaires successives des échantillons en des groupes ayant des propriétés biologiques et physiques semblables. La première ligne du tableau ci-dessous montre que, au nœud G, les échantillons sont séparés en deux groupes, AG et H, selon le pourcentage de sable qu’ils contiennent.
Nœud et séparation Variable Gauche (Droite)
Exemple de tableau montrant une partie de l’information descriptive résultant d’une analyse par
LINKTREE de la répartition de la faune benthique dans la partie ouest du chenal de Bristol (tiré de
Mackie et al., 2006)
CANOCO
Créé comme une extension de DECORANA (Hill, 1979b), CANOCO est un logiciel qui effectue l’ordination canonique de biocénoses (CANOnical Community Ordination) par analyse de corrélation (partielle, redressée et canonique), analyse des composantes principales et analyse de redondance (ter Braak, 1986 et 1988). Depuis une vingtaine d’années, ce logiciel a évolué pour inclure une variété de méthodes d’ordination multivariée, et la version 4.5 actuelle est disponible avec une interface utilisateur Windows
(ter Braak et Smilauer, 2002). Jongman et al. (1995) présentent en détail la théorie sousjacente et la mise en œuvre des diverses techniques.
Les ordinations, tout comme l’analyse de groupement, constituent des méthodes
« indirectes » d’analyse des relations entre les espèces et leur milieu, puisque des
4 - Comment réalise-t-on une carte ? 215 procédures supplémentaires sont nécessaires pour établir la corrélation entre les structures biologiques et les variables environnementales. Les analyses canoniques (ou contraintes) évitent cela en intégrant ordination et régression.
Les méthodes d’ordination disponibles se répartissent en quatre catégories :
Ordinations sans contrainte
Ordinations canoniques
Ordinations partielles
Ordinations canoniques partielles
Description de la structure d’un seul jeu de données
Explication d’un jeu de données par un autre jeu de données (ordinations contraintes par les variables explicatives)
Description de la structure d’un jeu de données en tenant compte des variations expliquées par un second jeu de données (données covariables)
Explication d’un jeu de données par un autre jeu de données en tenant compte des variations expliquées par un troisième jeu de données (données covariables)
Ter Braak et Verdonschot (1995) examinent l’utilisation de l’analyse canonique des correspondances (ACC) en écologie aquatique. Cette technique est la méthode d’analyse directe des gradients la plus utilisée. Elle est largement employée dans des études du milieu benthique, des zones intertidales jusqu’aux grands fonds (Ysebaert et Herman,
2002 ; Narayanaswamy et al., 2003 ; Bergquist et al., 2005). En ACC, les axes d’ordination sont déterminés à partir de combinaisons linéaires des variables environnementales qui maximisent la dispersion des cotes des espèces (et des
échantillons). Les variables environnementales sont représentées par des flèches qui partent du point origine du graphique, celui-ci correspondant à la moyenne générale de chaque variable. Les longues flèches sont plus fortement corrélées aux axes d’ordination que les flèches courtes.
Dans l’exemple qui suit, on a utilisé l’ACC pour étudier les relations entre les espèces et le milieu pour les Polychètes benthiques de la mer d’Irlande (Mackie et al., 1997). Une sélection ascendante des variables a permis de détecter les sept qui « expliquaient le mieux » les données. À chaque étape, un test de permutation de Monte Carlo a été utilisé pour déterminer jusqu’à quel point chaque variable était significative. Les cinq premières
Collectivement, les sept variables expliquaient 34,75 % de l’inertie totale.
Exemple de tableau de sélection ascendante de variables lors d’une étude de la répartition des
Polychètes benthiques dans la mer d’Irlande
Dans l’ordination, les axes I et II étaient les plus importants, comptant pour 21,3 % de la variance des espèces, et pour 61,2 % de la variance expliquée par les variables.
216 4 - Comment réalise-t-on une carte ?
Exemple de tableau sommaire d’ordination par ACC pour les relations entre les Polychètes et les variables environnementales
Comme le montre le graphique de l’ordination et la matrice de corrélations, le contenu des sédiments en gravier a été la variable la plus influente pour l’axe I. La profondeur et la latitude ont joué le rôle le plus important dans la définition de l’axe II. Des variables telles que la profondeur et la latitude peuvent toutefois n’être que des intermédiaires représentant d’autres facteurs qui varient en même temps (p. ex. la température, la pression, les courants) plutôt que de jouer un rôle important en soi.
4 - Comment réalise-t-on une carte ? 217
Exemple de matrice de corrélations des variables environnementales pour les axes I à IV
Même si elles ne font pas partie du graphique d’ACC illustré ci-dessus, les espèces peuvent également y être représentées, soit sur le même graphique avec chaque station
d’échantillonnage, soit séparément (pour plus de clarté). Les espèces représentées sont alors celles qui ont la plus forte corrélation avec les facteurs environnementaux. De la même manière, les relations entre espèces et environnement peuvent être étudiées à l’aide d’une analyse canonique des correspondances partielles. Oug (1998) l’a montré dans une étude de la macrofaune benthique de la région de Tromsø, en Norvège.
4.2.3.4 - Détermination des principales caractéristiques
L’établissement de corrélations entre les données biologiques d’une part, et les données physiques et environnementales d’autre part, produit un certain nombre de groupes d’échantillons susceptibles d’être représentatifs de différents habitats. Au sein de chaque groupe, les échantillons ont des propriétés similaires, et il reste à déterminer quelles caractéristiques définissent l’habitat et son échelle pertinente.
Caractéristiques biologiques
Les listes d’espèces par ordre d’abondance sont utiles, car elles donnent un aperçu facile de l’importance relative des divers taxons au sein de chaque groupe. Par contre, elles ne comprennent généralement ni les espèces coloniales ni les plantes, auxquelles on attribue rarement un indice d’abondance. Il est néanmoins important d’inclure ces espèces si elles sont caractéristiques de l’habitat, particulièrement si elles confèrent à l’habitat une certaine structure (algues, éponges, etc.) utilisée par d’autres espèces.
La vraie question à résoudre est d’identifier les espèces qui ont permis de déterminer les structures (groupements) biologiques observés. La liste des taxons caractéristiques comprend normalement ceux qui contribuent le plus aux similarités au sein d’un groupe, alors que les taxons discriminants sont ceux qui contribuent le plus aux dissimilarités entre groupes. Dans le logiciel PRIMER un même module appelé SIMPER (SIMilarity
PERcentages – pourcentages de similarité) produit ces deux types de listes, comme le montre l’exemple suivant.
Taxon
Groupe 1
Hinia sp.
Pagarus bernhardus
Ophiura ophiura
Ophiura albida
Callionymus sp.
Macropodia sp.
Pagarus prideauxi
Aphrodita aculeata
Corbula gibba
Gobiidae
Abondance moyenne Contribution (%) Pourcentage cumulatif
1071,00 14,57 14,57
256,25 11,11 25,68
214,25 7,63 33,31
3137,50 5,97 39,28
9,00 4,86 44,13
16,75 4,63 48,76
5,50 4,30 53,06
8,50 4,13 57,19
71,25 4,10 61,29
25,25 3,96 65,24
218 4 - Comment réalise-t-on une carte ?
Hinia sp.
Callionymus sp.
Macropodia sp.
Aequipecten opercularis
Pagarus prideauxi
Liocarcinus holsatus
Gobiidae
Taxon
Groupe 2
Pagarus bernhardus
Anapagarus laevis
Ophiura albida
Abondance moyenne Contribution (%) Pourcentage cumulatif
92,54 12,50 12,50
31,85 8,90 21,40
123,92 7,74 29,14
32,00 6,77 35,91
5,92 5,47 41,38
10,69 4,76 46,14
7,38 4,60 50,74
6,69 4,49 55,23
3,92 4,25 59,48
4,00 3,99 63,47
Exemple de la première partie des résultats du module SIMPER portant sur des échantillons prélevés au chalut à perche dans la Manche orientale, où deux groupes principaux ont été identifiés. Cette première partie donne les dix taxons les plus abondants de chaque groupe, avec leur abondance moyenne et leur contribution (en pourcentage, avec les pourcentages cumulatifs) à la similarité moyenne entre les échantillons de ces groupes.
Taxon
Aphrodita aculeata
Phaxas pellucidus
Acanthocardia
sp.
Limanda limanda
Abra
sp.
Echinocardium cordatum
Liocarcinus pusillus
Buglossidium luteum
Echiichthys vipera
Ophiura ophiura
Aequipecten opercularis
Crangon allmanni
Psammechinus miliaris
Abondance moyenne
Groupe 1 Groupe 2
Contribution
(%)
8,50 0,31 4,19
4,00 0,00 3,61
Pourcentage cumulatif
4,19
7,80
7,00 0,00 3,61 11,41
7,50 0,08 3,53 14,94
113,25 0,08 3,41 18,35
9,75 0,15 3,22 21,57
0,75 2,08 3,10 24,68
5,75 0,92 2,78 27,46
0,25 1,15 2,72 30,18
214,25 2,31 2,68 32,86
1,50 7,38 2,53 35,39
0,50 3,46 2,51 37,91
0,00 5,15 2,45 40,36
Exemple de la seconde partie des résultats du module SIMPER portant sur des échantillons prélevés au chalut à perche dans la Manche orientale, où deux groupes principaux ont été identifiés. Cette seconde partie donne les taxons qui contribuent aux premiers 40 % de dissimilarité entre les groupes, avec leur abondance moyenne dans chaque groupe et leur contribution (en pourcentage, avec les pourcentages cumulatifs) à cette dissimilarité.
Il faut en outre considérer la fidélité et la spécificité des espèces par rapport à un type d’habitat. Un degré élevé de fidélité d’une espèce signifie qu’elle est toujours présente dans un type d’habitat. Un degré élevé de spécificité d’une espèce signifie qu’elle est présente uniquement dans ce type d’habitat (autrement dit, qu’elle est inféodée à ce type d’habitat). Ce sont évidemment des propriétés importantes des taxons caractéristiques.
Dans l’exemple ci-dessus, plusieurs taxons sont présents dans un groupe mais non dans l’autre (p. ex. Phaxas pellucidus, Psammechinus miliaris).
Enfin, il est important d’enregistrer la liste complète des espèces du type d’habitat, ou du moins celles qui sont le plus souvent présentes (avec les données sur leur abondance relative ou leur biomasse, pour l’ensemble des échantillons du groupe). Ces données seront nécessaires pour décrire la classe d’habitat cartographiée, pour créer une nouvelle
classe d’habitat dans une typologie existante, et pour aider à définir un standard pour ce nouveau type d’habitat dans le logiciel HMP.
4 - Comment réalise-t-on une carte ? 219
Le module TWINSPAN effectue une analyse à double entrée d’espèces indicatrices afin de classifier les espèces et les échantillons, et produit un tableau ordonné à double entrée de l’occurrence des espèces (Hill, 1979a, b). Là encore, les résultats requièrent une
interprétation « écologique ». Le processus de classification est hiérarchique. Les
échantillons sont successivement subdivisés en catégories, puis les espèces sont réparties en catégories sur la base de la classification des échantillons. Cette technique est souvent employée en botanique, mais il y a relativement peu d’applications dans le domaine des habitats benthiques (p. ex. Heip et Craeymeersch, 1995 ; Hensley, 1996 ;
Rendall, 1997). Mettam et al. (1994) ont fait appel à la fois à l’analyse de groupement et à
TWINSPAN dans leur étude de la macrofaune benthique de l’estuaire de la Severn.
L’analyse de groupement a produit dix groupes fauniques, alors que TWINSPAN en a produit neuf. Après avoir considéré l’ensemble de ces résultats, les auteurs ont déterminé huit groupes fauniques – dont chacun occupe des types de sédiment différents à des profondeurs différentes.
Caractéristiques physiques
Les résultats des analyses effectuées à l’aide de BIO-ENV (PRIMER) ou de CANOCO indiquent les variables physiques qui contribuent le plus à déterminer les structures biologiques. Parmi celles-ci, le type de substrat est d’un intérêt particulier et doit être décrit le plus complètement possible. L’étendue des valeurs d’autres variables physiques, comme la salinité, la profondeur et la température, doit faire partie de la description, de même que les descripteurs hydrodynamiques, environnementaux ou écologiques comme l’exposition aux vagues, la vitesse des courants, la zone biologique, etc.
4.2.3.5 - Établissement des correspondances avec une typologie existante
L’étape finale de la définition des classes d’habitat propres à un levé consiste à voir si certaines des descriptions d’habitat issues de l’analyse et de l’interprétation des données de terrain correspondent en tout ou en partie à des habitats identifiés dans une typologie existante. À ce jour, de nombreuses études ont négligé cette étape : au lieu de tenter de faire des liens entre les classes d’habitat déterminées et une typologie « normalisée » existante, elles se fondent uniquement sur les classes d’habitat propres à l’étude. Cette façon de faire ne présente pas de grands avantages. La comparaison avec des typologies existantes et la réalisation de cartes entièrement ou partiellement corrélées avec de telles
typologies sont importantes pour la normalisation des cartes et l’interopérabilité des données (voir le chapitre 6 « Que peut-on faire avec une carte ? »).
Si aucune correspondance satisfaisante n’est trouvée, il faut utiliser l’information pour créer une nouvelle classe d’habitat, afin d’améliorer la typologie existante. Il est possible de proposer des améliorations à la typologie E
UNIS
à l’aide des documents suivants disponibles dans le dossier des documents :
Le document
E
UNIS
marine habitat classification: Application, testing and
improvement (
E
UNIS
application v3.doc
) explique comment définir de nouvelles classes d’habitats pour la typologie E
UNIS
.
Le document
E
UNIS
marine proposal pro-forma (
E
UNIS
marine proposal proforma v3.xls
) contient un formulaire et donne un exemple de proposition.
Toute proposition de classe d’habitat pour la typologie E
UNIS
doit être saisie sur ce formulaire et envoyée au JNCC, à l’adresse [email protected]
.
4.2.4 - Regroupement de données
Plusieurs techniques d’analyse présentées plus haut supposent que les données ont été acquises au moyen de techniques normalisées, que ce soit au cours d’un même levé (ou d’une série de levés coordonnés) ou de plusieurs levés différents suffisamment similaires

Lien public mis à jour
Le lien public vers votre chat a été mis à jour.
Caractéristiques clés
- Cadre méthodologique pour la cartographie des habitats marins
- Assure la cohérence et la compatibilité des cartes d'habitats benthiques
- Aide à la production de cartes d'habitats complètes et de haute qualité
- Fournit des explications simples et une assistance étape par étape
- Convient tant aux commanditaires qu'aux exécutants des levés