Amélioration des estimations du flux de carbone dans les océans avec l'IA
Une nouvelle méthode d'IA améliore la mesure du carbone dans les particules océaniques.
― 11 min lire
Table des matières
- Utilisation de l'Intelligence Artificielle pour la Classification d'Images
- Lieux d'Échantillonnage
- Processus de Collecte d'Échantillons
- Labellisation des Données
- Entraînement du Modèle
- Stratégie d'Adaptation de Domaine
- Estimations du Flux de Carbone
- Évaluation des Performances
- Conclusions et Directions Futures
- Source originale
L'océan joue un rôle important dans le contrôle du niveau de dioxyde de carbone (CO2) dans l'atmosphère. Ça se fait surtout par un processus où le CO2 de l'air se dissout dans l'eau de mer. Ce processus se produit parce qu'il y a une différence entre la quantité de CO2 dans l'air et celle dans l'eau. Dans les couches supérieures de l'océan, des algues microscopiques utilisent le CO2 durant la photosynthèse pour créer de la matière organique. Une partie de cette matière organique se décompose en petites Particules, appelées carbone organique particulaire (COP), qui coule dans les eaux plus profondes. Ce processus aide à stocker le carbone pendant longtemps, contribuant à la capacité de l'océan à retirer du CO2 de l'atmosphère.
Pour comprendre combien de carbone est retiré par l'océan, il est important de mesurer combien de COP est exporté de la surface vers les profondeurs océaniques. Ces dernières années, des avancées technologiques ont permis une meilleure collecte d'Images de l'océan, ce qui aide à estimer comment le carbone se déplace dans l'océan de manière détaillée. Un appareil appelé le Profiler de Vision Sous-Marine (UVP) prend des images des particules dans l'océan pour aider à comprendre combien de carbone elles représentent.
Cependant, il y a des défis pour estimer le Flux de carbone en utilisant les données de l'UVP. Souvent, les estimations peuvent être très incertaines, avec des erreurs de plus de 50%. Ça peut arriver parce que les particules sont généralement considérées comme si elles étaient toutes de la même taille et type, même s'il y a une large gamme de types de particules créées par différents processus biologiques et physiques. Chaque type de particule peut avoir des quantités différentes de carbone et couler à des vitesses différentes.
Des recherches ont montré qu'identifier les différents types de particules peut aider à fournir des estimations plus précises de l'exportation de carbone. Cependant, cette méthode nécessite beaucoup de travail manuel pour labelliser les images, ce qui est cher et ne fonctionne pas bien avec de grands ensembles de données. Une autre étude a exploré une façon de catégoriser les images sans avoir besoin de labelliser chaque image manuellement, mais cela a laissé une incertitude sur la manière de relier ces catégories statistiques aux types de particules réels.
Classification d'Images
Utilisation de l'Intelligence Artificielle pour laLes techniques d'intelligence artificielle, en particulier les réseaux de neurones convolutionnels (CNN), sont souvent utilisés pour classifier les images. Ces techniques ont été employées en science marine pour identifier des types de petites créatures océaniques, comme le phytoplancton et le zooplancton. En général, les CNN sont entraînés en utilisant un processus où un expert labellise un petit ensemble d'images, puis l'IA applique ce qu'elle a appris pour labelliser d'autres images. Cependant, il y a un défi parce que les caractéristiques de ces organismes peuvent changer selon où et quand ils sont prélevés. Ça rend difficile pour le modèle entraîné de bien fonctionner dans de nouveaux endroits ou à d'autres moments.
Une solution potentielle est l'adaptation de domaine, qui implique d'utiliser des données de la nouvelle zone pour aider l'IA à mieux apprendre. Cela peut aider à éviter que le modèle échoue lorsqu'il rencontre des espèces ou des formes différentes dans l'océan.
Il y a aussi une méthode appelée apprentissage semi-supervisé, où l'expert labellise seulement quelques images pendant que l'IA organise les images similaires ensemble. Ça peut réduire le temps que l'expert doit passer à labelliser, mais son succès dépend encore de la capacité de l'IA à trier les images en catégories pertinentes.
Dans cette étude, une nouvelle méthode a été proposée utilisant des CNN pour classifier les images de particules prises dans l'océan. Cette méthode vise à améliorer notre capacité à estimer combien de carbone se trouve dans chaque type de particule, ce qui devrait conduire à de meilleures prévisions du flux de carbone. Ça nous aide aussi à en apprendre plus sur les processus biologiques importants pour ce flux de carbone.
L'approche inclut l'implication d'un expert humain dans le processus d'entraînement pour aider l'IA à s'adapter aux nouvelles données provenant de différents efforts d'Échantillonnage. L'étude a mesuré la teneur en carbone dans les particules labellisées et a comparé les résultats aux méthodes traditionnelles d'estimation du flux de carbone.
Lieux d'Échantillonnage
Pour tester cette méthodologie, des échantillons ont été collectés dans diverses zones de l'océan. Cela incluait des endroits dans le Pacifique Nord, le bassin de Santa Barbara, et l'Atlantique Nord. Chaque endroit a ses propres caractéristiques uniques et niveaux de flux de carbone.
Dans le centre du Pacifique Nord, plusieurs stations ont été échantillonnées, y compris des régions avec des niveaux de nutriments et des taux de flux faibles. Le Pacifique Nord subarctique a un faible export de carbone, tandis que le bassin de Santa Barbara a montré des niveaux plus élevés de flux de carbone. Des échantillons ont également été prélevés dans l'Atlantique Nord oriental pendant une période de niveaux de nutriments élevés.
Processus de Collecte d'Échantillons
La collecte de particules impliquait l'utilisation de pièges à sédiments qui capturaient les particules tombant de la surface. Ces pièges étaient conçus avec des tubes spéciaux qui comprenaient une couche de gel pour maintenir les particules. Une fois les pièges ramenés, des images ont été prises du gel collecté, et des régions contenant les particules ont été sélectionnées pour analyse. Chaque particule a été mesurée pour recueillir des données sur sa taille.
Labellisation des Données
Pour analyser les particules, les images ont été classées en fonction du type de particules qu'elles représentaient. Il y avait de nombreuses catégories, y compris différents types de pellets fécaux provenant d'animaux marins, des agrégats formés à partir de divers matériaux, et des types d'algues microscopiques. Certaines images contenaient des particules qui ne contribuaient pas au flux de carbone et ont été identifiées mais non comptées dans les estimations de carbone.
Le processus de labellisation des images a été complété avant cette étude, et certaines images se sont révélées floues, ce qui signifie qu'elles pouvaient s'insérer dans plus d'une catégorie. Pour mesurer cette incertitude, des sous-ensembles d'images ont été relabellisés, et les chercheurs ont trouvé qu'environ 80% des nouvelles étiquettes correspondaient aux annotations d'origine. Sur cette base, une sélection d'images clairement labellisées a été utilisée pour entraîner le modèle d'IA.
Entraînement du Modèle
Pour entraîner le CNN, un type spécifique d'architecture CNN appelé ResNet-18 a été utilisé. Elle trouve un équilibre entre la vitesse et la précision, ce qui la rend adaptée à cette tâche. L'entraînement a impliqué de passer les images à travers le modèle par lots et d'appliquer des techniques pour éviter le surapprentissage. Les chercheurs ont également utilisé des méthodes d'augmentation de données pour améliorer les performances du modèle.
Pendant l'entraînement, des ajustements ont été faits pour optimiser comment les images étaient redimensionnées, comment l'algorithme d'apprentissage fonctionnait, et comment minimiser les erreurs dans les prédictions. Différentes méthodes de redimensionnement des images ont été testées pour s'assurer que les formes des particules étaient préservées, ce qui est important pour une classification précise.
Stratégie d'Adaptation de Domaine
Après l'entraînement du modèle, il était important de l'appliquer à de nouvelles données provenant de différentes campagnes d'échantillonnage. C'est là qu'intervient le processus d'adaptation de domaine. Le modèle formé sur des données précédentes peut avoir des difficultés avec de nouvelles données. Pour remédier à cela, les chercheurs ont utilisé un processus où les prédictions faites par le modèle seraient vérifiées par un expert humain.
D'abord, le modèle générait des prédictions pour le nouveau jeu de données, et l'expert passait en revue les prédictions les plus confiantes. Ces images examinées seraient ensuite réintégrées dans l'ensemble d'entraînement pour améliorer la précision du modèle.
Cette étape était conçue pour limiter la quantité d'intervention humaine nécessaire, permettant au modèle de fonctionner de manière indépendante autant que possible tout en bénéficiant toujours des conseils d'un expert.
Estimations du Flux de Carbone
Une fois toutes les images labellisées, l'étape suivante était de calculer le flux de carbone des particules échantillonnées. Les chercheurs ont mis à jour les paramètres utilisés dans les études précédentes pour tenir compte de la manière dont ils regroupaient différentes classes de particules. Après avoir calculé la teneur en carbone pour chaque particule, le flux total de carbone a été estimé à partir des données d'imagerie.
Pour fournir une base de comparaison, des estimations de flux de carbone annotées par des humains ont été calculées. Cela permet aux chercheurs d'évaluer à quel point les prédictions basées sur le modèle correspondaient aux méthodes traditionnelles et aux mesures observées de carbone dans l'environnement.
En comparant ces différentes méthodes, les chercheurs visaient à déterminer à quel point les prédictions du modèle étaient précises et si elles pouvaient refléter de manière fiable le flux de carbone se produisant dans l'océan.
Évaluation des Performances
L'étude a analysé comment les prédictions du modèle se comparaient à celles faites par des experts humains. Les résultats ont montré que les estimations du modèle étaient proches de celles des annotations humaines et des mesures chimiques, indiquant que le modèle fonctionnait bien.
De plus, les performances du modèle ont été évaluées à travers différentes classes de particules. Pour la plupart des classes, le modèle a bien fonctionné par rapport au labellisation humaine. Cependant, il y a eu quelques cas où des classes minoritaires n'ont pas aussi bien fonctionné en raison d'un manque de données.
En termes d'efficacité temporelle, la nouvelle méthode a significativement réduit la quantité d'effort humain nécessaire pour la classification des images tout en produisant des estimations fiables du flux de carbone. La capacité du modèle à classifier précisément les images a contribué à la compréhension de la façon dont le carbone circule dans l'océan, mettant en lumière des processus écologiques importants.
Conclusions et Directions Futures
Cette étude met en avant l'utilité d'appliquer des techniques avancées de classification d'images pour mieux comprendre la dynamique du carbone dans l'océan. En utilisant la vision par ordinateur, les chercheurs peuvent gérer de grands volumes de données d'imagerie qui nécessiteraient autrement un étiquetage humain excessif, leur permettant de se concentrer sur l'interprétation des résultats plutôt que sur des tâches de classification fastidieuses.
Il y a encore des domaines à améliorer, notamment en ce qui concerne les performances du modèle avec des types de particules rares. À mesure que de plus en plus de données deviennent disponibles dans diverses régions, le modèle peut apprendre de celles-ci, ce qui pourrait améliorer sa capacité à classifier tous les types de particules avec précision.
Dans l'ensemble, cette approche représente un pas significatif vers une compréhension plus détaillée des flux de carbone dans nos océans, ce qui est crucial pour faire face au changement climatique et ses impacts. Les méthodes développées dans cette étude ont le potentiel d'être appliquées à d'autres ensembles de données écologiques, améliorant les capacités de recherche à travers divers domaines scientifiques.
Titre: A computer vision-based approach for estimating carbon fluxes from sinking particles in the ocean
Résumé: The gravitational settling of organic particles in the ocean drives long term sequestration of carbon from surface waters to the deep ocean. Quantifying the magnitude of carbon sequestration flux at high spatiotemporal resolution is critical for monitoring the oceans ability to sequester carbon as ecological conditions change. Here, we propose a computer vision-based method for classifying images of sinking marine particles and using allometric relationships to estimate the amount of carbon that the particles transport to the deep ocean. We show that our method reduces the amount of time required by a human image annotator by at least 90% while producing ecologically- informed estimates of carbon flux that are comparable to estimates based on purely human review and chemical bulk carbon measurements. This method utilizes a human-in-the-loop domain adaptation approach to leverage images collected from previous sampling campaigns in classifying images from novel campaigns in the future. If used in conjunction with autonomous imaging platforms deployed throughout the worlds oceans, this method has the potential to provide estimates of carbon sequestration fluxes at high spatiotemporal resolution while facilitating an understanding of the ecological pathways that are most important in driving these fluxes.
Auteurs: Vinícius J Amaral, C. A. Durkin
Dernière mise à jour: 2024-07-10 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.07.06.602339
Source PDF: https://www.biorxiv.org/content/10.1101/2024.07.06.602339.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.