P33 - Prédiction de la peur de la récurrence du cancer chez les femmes cinq ans après le diagnostic à l'aide de l'apprentissage automatique et des données de consommation de soins de santé
L'espérance de vie s'est considérablement allongée ces dernières décennies grâce aux progrès thérapeutiques et aux dépistages de plus en plus précoces. Néanmoins, l'après-cancer n'est pas un retour à l’état antérieur et les personnes ont à faire face à beaucoup de difficultés dan...
Gespeichert in:
Veröffentlicht in: | Journal of Epidemiology and Population Health 2024-05, Vol.72, p.202473, Article 202473 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | L'espérance de vie s'est considérablement allongée ces dernières décennies grâce aux progrès thérapeutiques et aux dépistages de plus en plus précoces. Néanmoins, l'après-cancer n'est pas un retour à l’état antérieur et les personnes ont à faire face à beaucoup de difficultés dans leur vie quotidienne parmi lesquelles, la peur de la récidive du cancer (PRC). La PRC se caractérise par un niveau élevé d'anxiété et de préoccupations entre autres. Alors que des interventions psychosociales ciblées ont montré leur intérêt pour aider à réduire la PRC, aucune prise en charge ou mesure efficace n'existe à en France permettant d'identifier précocement les personnes susceptibles de souffrir de PRC clinique. L'objectif de travail est d'utiliser les données de remboursement de soins de santé issues de l'enquête VICAN (VIe après le CANcer) pour proposer un modèle d'intelligence artificielle (IA) interprétable afin d'identifier les patients à risque de développer une PRC clinique.
Après une étude de l'état de l'art et une analyse exploratoire, nous avons entrepris une sélection minutieuse des médicaments, des actes biologiques et médicaux pertinents pour investiguer la PRC guidée par des considérations cliniques et pratiques. Les données de remboursement de chaque patient ont été analysées au-delà des deux premières années de traitement, excluant ainsi la phase initiale du traitement influencée significativement par le processus thérapeutique. À travers des processus d'exploration de données et compte tenu de la nature sparse des données, plusieurs expérimentations de données ont été élaborés, suivi d'une étude comparative entre différents algorithmes d'apprentissage automatique tels que la forêt aléatoire, les machines à vecteurs de support, le gradient boosting, l'extreme gradient boosting et le perceptron multicouche. La performance des modèles a été évaluée avec l'AUC (aire sous la courbe de ROC) pour sélectionner le modèle optimal. Toutes les étapes d'analyse de données, de prétraitement et de classification ont été réalisées en utilisant le langage de programmation Python.
Notre jeu de données de 925 individus avec la PRC connue a été exploité pour des expérimentations axées sur le niveau de classification des médicaments, d'actes biologiques et actes médicaux, avec la création de profils pour chaque combinaison de niveaux. De plus, nous explorons la nature du prétraitement des données en utilisant des algorithmes de sur-échantillonnage et de sélection de variable |
---|---|
ISSN: | 2950-4333 |
DOI: | 10.1016/j.jeph.2024.202473 |