Robust linear mixed models, alternative methods to quantile regression for panel data, and adaptive LASSO quantile regression with fixed effects
La thèse est constituée de trois chapitres. Le premier s'intéresse au lien entre l’exposition à la pollution de l’air et les affections respiratoires chez les enfants et les adolescents. La cohorte comprend 82 individus observés mensuellement pendant 6 mois. Nous proposons un modèle linéaire mi...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dissertation |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | La thèse est constituée de trois chapitres. Le premier s'intéresse au lien entre l’exposition à la pollution de l’air et les affections respiratoires chez les enfants et les adolescents. La cohorte comprend 82 individus observés mensuellement pendant 6 mois. Nous proposons un modèle linéaire mixte robuste combiné à une analyse en composantes principales afin de gérer la multicolinéarité entre les covariables et l’impact des observations extrêmes sur les estimations. Le deuxième chapitre analyse des données de panel au moyen de modèles à effets fixes et utilisant différentes fonction de perte. Afin d'éviter que le nombre de paramètres augmente avec la taille de l'échantillon, nous pénalisons chaque méthode de régression par LASSO. Les propriétés asymptotiques de ces nouvelles techniques sont établies. Nous testons les performances des méthodes avec des données de panel économiques issues de l'OCDE. Le but recherché dans le troisième chapitre est de contraindre simultanément les constantes de régression individuelles et les covariables explicatives. Le LASSO adaptatif permet de réduire la dimensionnalité en assurant asymptotiquement la sélection du bon modèle. Nous testons la précision des méthodes proposées sur des données de cohorte de dimension modérée.
This thesis consists of three chapters on longitudinal data analysis. Linear mixed models are discussed, both random effects (where individual intercepts are interpreted as random variables) and fixed effects (where individual intercepts are considered unknown constants, i.e., they must be estimated). Furthermore, robust models (resistant to outliers) and efficient models (with low estimator variability) are proposed in the scope of repeated measures. The second part of the thesis is dedicated to quantile regression, which explores the full conditional distribution of an outcome given its predictors. It introduces a more general method for dealing with heteroscedastic variables and longitudinal data. The first chapter is motivated by evaluating the statistical association between air pollution exposure and children and adolescents' lung ability among six months. A robust linear mixed model combined with an equally robust principal component analysis is proposed to deal with multicollinearity between covariates and the impact of extreme observations on the estimates. Huber and Tukey loss functions (M-estimation examples) are considered to obtain more robust estimators than the least squared function usually |
---|