Un noyau des plus proches voisins pour la classification : application aux images de plancton bidimensionnelles in situ avec correction des estimations de volume total pour les copépodes

Les organismes qui composent le plancton sont des éléments essentiels de la biosphère : à la base de la chaine alimentaire marine, ils sont au cœur des cycles biogéochimiques, notamment du carbone, de l'azote et de l'oxygène. En effet, le phytoplancton capte le dioxyde de carbone de l'...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Dubois, Cédric
Format: Dissertation
Sprache:eng
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Les organismes qui composent le plancton sont des éléments essentiels de la biosphère : à la base de la chaine alimentaire marine, ils sont au cœur des cycles biogéochimiques, notamment du carbone, de l'azote et de l'oxygène. En effet, le phytoplancton capte le dioxyde de carbone de l'atmosphère et produit du dioxygène ; le zooplancton contribue à exporter ce carbone en profondeur. Les écologues étudient cette « pompe à carbone biologique », afin d'évaluer son efficacité actuelle et future face changement climatique. Une approche moderne consiste à étudier la manière dont l'environnement est lié au fonctionnement des écosystèmes par le biais des « traits » (caractéristiques individuelles) des organismes. Une corrélation importante a été observée entre la distribution des tailles des zooplanctons et l'efficacité de la séquestration du carbone. Des instruments d'imagerie in situ et de grands jeux de données d'images ont été mis en œuvre pour le plancton, permettant la classification taxonomique des organismes et la quantification du volume total par groupe. Le développement de méthodes de classification automatisée a été essentiel pour l'assistance au traitement des données. À ce titre, les Réseaux de Neurones Artificiels (RNAs) se sont avérés très utiles et précis, mais leurs décisions sont souvent difficiles à interpréter. Dans un premier temps, nous montrons que l'approche transformation-puis-classification-simple des RNAs avec une transformation simple et explicite, conduit à une méthode de classification dont les prédictions sont interprétables (donc fiables) et précises. La transformation proposée est définie comme une combinaison linéaire de cibles par classe. Ensuite, la classification est effectuée, comme avec les RNAs, en prenant la cible la plus proche. Notre résultat principal démontre que cette transformation définit un noyau associé au classifieur des k-plus-Proches-Voisins-Pondérés (kPPP). Ceci permet d'interpréter les kPPP comme un membre d'une famille plus large de classifieurs utilisant des cibles, qui satisfait un critère d'optimalité. Nous proposons une implémentation moderne des kPPP suffisamment efficace pour traiter de grands ensembles de données, tels que ceux collectés chaque jour par les instruments d'imagerie du plancton. Nous avons ainsi effectué une validation croisée avec l'omission d'un échantillon sur de grands jeux de données d'images de plancton. Dans un second temps, nous étudions l'estimation du volume des copépodes à part