PCA Rerandomization

Mahalanobis distance of covariate means between treatment and control groups is often adopted as a balance criterion when implementing a rerandomization strategy. However, this criterion may not work well for high‐dimensional cases because it balances all orthogonalized covariates equally. We propos...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Canadian journal of statistics 2024-03, Vol.52 (1), p.5-25
Hauptverfasser: Zhang, Hengtao, Yin, Guosheng, Rubin, Donald B.
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Mahalanobis distance of covariate means between treatment and control groups is often adopted as a balance criterion when implementing a rerandomization strategy. However, this criterion may not work well for high‐dimensional cases because it balances all orthogonalized covariates equally. We propose using principal component analysis (PCA) to identify proper subspaces in which Mahalanobis distance should be calculated. Not only can PCA effectively reduce the dimensionality for high‐dimensional covariates, but it also provides computational simplicity by focusing on the top orthogonal components. The PCA rerandomization scheme has desirable theoretical properties for balancing covariates and thereby improving the estimation of average treatment effects. This conclusion is supported by numerical studies using both simulated and real examples. Résumé La distance de Mahalanobis entre les moyennes des covariables de groupes traités et non traités est souvent utilisée comme critère d'équilibre lors de la mise en œuvre d'une stratégie de re‐randomisation. Cela dit, ce critère peut ne pas fonctionner correctement pour les cas à grande dimension car il équilibre toutes les covariables orthogonalisées de manière égale. Les auteurs de ce travail proposent de recourir à l'analyse en composantes principales (ACP) afin d'identifier les sous‐espaces appropriés dans lesquels la distance de Mahalanobis devrait être calculée. L'ACP peut non seulement réduire efficacement la dimensionnalité pour les covariables de grande dimension, mais elle offre également une simplicité de calcul en se concentrant sur les composantes orthogonales les plus importantes. Ce schéma de re‐randomisation basé sur l'ACP possède des avantages théoriques intéressants pour équilibrer les covariables et, par conséquent, améliorer l'estimation des effets moyens du traitement. Les auteurs appuient leur conclusion par des études numériques utilisant à la fois des simulations et des exemples concrets.
ISSN:0319-5724
1708-945X
DOI:10.1002/cjs.11765