Active deep learning for medical imaging segmentation

This thesis proposes a novel active learning framework capable to train effectively a convolutional neural network for semantic segmentation of medical imaging, with a limited amount of training labeled data. Our approach tries to apply in segmentation existing active learning techniques, which is b...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Górriz Blanch, Marc
Format: Dissertation
Sprache:eng
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:This thesis proposes a novel active learning framework capable to train effectively a convolutional neural network for semantic segmentation of medical imaging, with a limited amount of training labeled data. Our approach tries to apply in segmentation existing active learning techniques, which is becoming an important topic today because of the many problems caused by the lack of large amounts of data. We explore different strategies to study the image information and introduce a previously used cost-effective active learning method based on the selection of high confidence predictions to assign automatically pseudo-labels with the aim of reducing the manual annotations. First, we made a simple application for handwritten digit classification to get started to the methodology and then we test the system with a medical image database for the treatment of melanoma skin cancer. Finally, we compared the traditional training methods with our active learning proposals, specifying the conditions and parameters required for it to be optimal. Esta tesis propone un nuevo marco de aprendizaje activo capaz de entrenar de manera efectiva una red neuronal convolucional para la segmentación semántica de imágenes médicas, a través de una cantidad limitada de instancias de entrenamiento. Nuestro enfoque trata de introducir técnicas existentes de aprendizaje activo en el campo de la segmentación, tema poco tratado en la actualidad debido a los numerosos problemas que puede causar la falta de datos en el entrenamiento de sistemas con gran cantidad de parametros. Exploramos estrategias para el estudio de la información de la imagen, que nos permiten diseñar un método rentable de selección de instancias óptimas para el entrenamiento de nuestro sistema. Estas técnicas nos permiten introducir en segmentación el método activo de coste efectivo, muy usado en clasificación, que trata de usar de manera iterativa predicciones de alta confianza como pseudo etiquetas, haciendo disminuir la cantidad de anotaciones requeridas de forma manual. En primer lugar, desarrollamos una simple aplicación para la clasificación de dígitos manuscritos para iniciarnos con la metodología y luego testeamos el sistema con una base de datos de imágenes médicas para el tratamiento del cáncer de piel de melanoma. Finalmente, comparamos el modelo clásico de entrenamiento con las distintas versiones de entrenamiento activo propuestas, especificando las condiciones y los paramentaras necesarios para que estas