Aller au contenu principal
Model Selection for Causal Inference in Missing Exposure Problems
In causal inference, properly selecting the propensity score (PS) model is an important topic and has been widely investigated in observational studies. There is also a large literature focusing on the missing data problem. However, there are very few studies investigating the model selection issue for causal inference when the exposure is missing at random (MAR). In this paper, we discuss how to select both imputation and PS models, which can result in the smallest root mean squared error (RMSE) of the estimated causal effect in our simulation study. Then, we propose a new criterion, called "rank score" for evaluating the overall performance of both models. The simulation studies show that the full imputation plus the outcome-related PS models lead to the smallest RMSE and the rank score can help select the best models. An application study is conducted to quantify the causal effect of cardiovascular disease (CVD) on the mortality of COVID-19 patients.
Sélection de modèles pour l'inférence causale dans les problèmes d'exposition manquante
En inférence causale, la sélection correcte du modèle de score de propension (PS) est un sujet important et a été largement étudiée dans les études d'observation. Il existe également une littérature abondante consacrée au problème des données manquantes. Toutefois, il existe très peu d'études portant sur la question de la sélection du modèle pour l'inférence causale lorsque l'exposition est manquante au hasard (MAR). Dans cet article, nous examinons comment sélectionner à la fois les modèles d'imputation et les modèles PS, qui peuvent aboutir à la plus petite erreur quadratique moyenne (RMSE) de l'effet causal estimé dans notre étude de simulation. Nous proposons ensuite un nouveau critère, appelé « score de rang », pour évaluer la performance globale des deux modèles. Les études de simulation montrent que l'imputation complète et les modèles PS liés aux résultats conduisent à la RMSE la plus faible et que le score de classement peut aider à sélectionner les meilleurs modèles. Une étude d'application est menée pour quantifier l'effet causal des maladies cardiovasculaires (MCV) sur la mortalité des patients COVID-19.
Date and Time
-
Co-auteurs (non y compris vous-même)
Yuliang Shi
University of Waterloo
Joel Dubin
University of Waterloo
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Yeying Zhu University of Waterloo