Aller au contenu principal
Causal Estimation with Longitudinal Outcome-Highly-Adaptive LASSO
In longitudinal causal inference, the estimation of time-specific propensity scores is often impeded by data sparsity. In particular, there may be a large dimensionality of the covariate history, or certain covariates closely related to the observed treatment. In order to handle this problem, analysts typically hand-pick a subset of covariates to include in logistic regression models to estimate the propensity scores. However, if the full set of confounders is not included, or if the logistic regression model is incorrectly specified, estimation of the causal parameter will be biased. We address these issues by proposing a nonparametric data-adaptive estimator of the propensity scores which smooths over covariate information that is unrelated to the outcome. A doubly robust inference longitudinal targeted maximum likelihood estimator produces consistent, superefficient, and asymptotically linear estimation, such that valid 95% confidence intervals can be constructed.
Estimation causale avec LASSO longitudinal ayant des résultats hautement adaptatifs
Dans l’inférence causale longitudinale, l’estimation des scores de propension propres au temps est souvent entravée par la rareté des données. Tout particulièrement, l’historique des covariables peut être de grande dimension ou certaines covariables peuvent être étroitement liées au traitement observé. Pour résoudre ce problème, les analystes sélectionnent généralement un sous-ensemble de covariables à inclure dans les modèles de régression logistique afin d’estimer les scores de propension. Cependant, si l’ensemble des facteurs de confusion n’est pas inclus, ou si le modèle de régression logistique est mal spécifié, l’estimation du paramètre causal sera biaisée. Nous abordons ces problèmes en proposant un estimateur non paramétrique des scores de propension qui s’adapte aux données et qui aplanit les informations de covariables qui ne sont pas liées au résultat. Un estimateur du maximum de vraisemblance ciblé longitudinal à inférence doublement robuste produit une estimation cohérente, ultra efficace et asymptotiquement linéaire, de sorte qu’il est possible de construire des intervalles de confiance valides à 95 %.
Date and Time
-
Co-auteurs (non y compris vous-même)
David Berger
Université de Montréal
Yan Liu
Université de Montréal
Ashkan Ertefaie
University of Pennsylvania
Denis Talbot
Université Laval
David Benkeser
Emory University
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Mireille Schnitzer Université de Montréal