Stratégie de modélisation de la forme fonctionnelle des variables continues dans un modèle de régression en utilisant des splines cubiques restreintes
Lorsque l'on souhaite modéliser la relation entre une variable continue et une variable réponse, le choix du traitement de la variable continue, i.e. de sa forme fonctionnelle, est une étape clé. Ce choix se résume trop souvent à la catégorisation de la variable continue, en deux ou plusieurs c...
Gespeichert in:
Veröffentlicht in: | Revue d'épidémiologie et de santé publique 2023-05, Vol.71, p.101805, Article 101805 |
---|---|
Hauptverfasser: | , , , , , , , , |
Format: | Artikel |
Sprache: | fre |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Lorsque l'on souhaite modéliser la relation entre une variable continue et une variable réponse, le choix du traitement de la variable continue, i.e. de sa forme fonctionnelle, est une étape clé. Ce choix se résume trop souvent à la catégorisation de la variable continue, en deux ou plusieurs catégories. La catégorisation, bien qu'offrant une facilité d'interprétation, pose toutefois des problèmes majeurs. Elle suppose une relation par palier avec la réponse qui est irréaliste et entraîne une perte d'information, et donc une perte de précision dans les estimations et une perte de puissance dans les tests associés. Dans le cas d'une variable confondante, la catégorisation entraîne de surcroît de la confusion résiduelle non expliquée par le modèle. De plus, la catégorisation induit une inflation du risque alpha lorsque les « cut-off » sont déterminés à partir de la variable réponse. Enfin, les "cut-off" choisis sont souvent hétérogènes entre les études, rendant les comparaisons difficiles. Une autre méthode consiste à traiter la variable continue en supposant une association linéaire, hypothèse souvent non respectée. Pourtant, plusieurs outils tels que les splines ou les polynômes fractionnaires permettent de modéliser la forme fonctionnelle d'une variable continue de manière très flexible. Notre objectif est de décrire la mise en œuvre d'une telle modélisation et de l'illustrer sur un exemple concret.
Une revue de littérature a été réalisée afin de définir une stratégie de modélisation. Pour illustrer cette dernière, nous avons utilisé une étude multicentrique française de 352 patients atteints d'un cancer de la prostate. Le but était d’étudier l'impact de l'apoptose des lymphocytes-T CD8 induite par la radiothérapie (RILA) sur la survie sans toxicité tardive à l'aide d'un modèle de Cox « cause-specific ».
La variable continue (RILA) a d'abord été intégrée au modèle multivariable en utilisant une spline cubique restreinte. L'avantage de ce type de splines est de permettre de vérifier l'hypothèse de linéarité en testant la nullité de certains de ses coefficients. Le choix du nombre de nœuds et de leur position sera discuté. Ici, cinq nœuds ont été choisis à l'aide du critère AIC et ont été placés aux quantiles de distribution du RILA. L'association n’étant pas linéaire, la modélisation par spline a été maintenue. Une communication classique des résultats avec report des coefficients de régression n'est pas informative, les coefficients de splines n'ayant pas |
---|---|
ISSN: | 0398-7620 |
DOI: | 10.1016/j.respe.2023.101805 |