Aller au contenu principal
Improving Causal Inference with Deep Learning: A Comparative Analysis of TARNet, Dragonnet, and NEDnet in Low and High-Dimensional Tabular Data
Deep learning models, including TARNET, Dragonnet, and NEDnet, are increasingly used for estimating treatment effects in epidemiology. This study evaluates their performance within the Targeted Maximum Likelihood Estimation (TMLE) framework. Plasmode simulations are conducted on two epidemiological datasets: one with 50 investigator-specified covariates and another with 167 covariates, including 142 proxies. Performance metrics include bias, standard errors, and coverage probability. Results show that NEDnet achieves the highest coverage but exhibits greater bias in high-dimensional settings. Super Learners had lower coverage, and even double cross-fitting provided limited improvement. Findings underscore the importance of selecting estimators based on covariate availability and dimensionality.
Amélioration de l'inférence causale avec l'apprentissage profond : Une analyse comparative de TARNet, Dragonnet et NEDnet sur des données tabulaires de faible et grande dimension.
Les modèles d’apprentissage profond, y compris TARNET, Dragonnet et NEDnet, sont de plus en plus utilisés pour estimer les effets des traitements en épidémiologie. Cette étude évalue leur performance dans le cadre de l'estimation ciblée par maximum de vraisemblance (TMLE). Des simulations plasmodes sont effectuées sur deux ensembles de données épidémiologiques : l’un avec 50 covariables spécifiées par les investigateurs et l’autre avec 167 covariables, dont 142 variables proxy. Les critères d’évaluation incluent le biais, les erreurs standards et la probabilité de couverture. Les résultats montrent que NEDnet atteint la couverture la plus élevée, mais présente un biais plus important dans les contextes à haute dimensionnalité. Les Super Learners affichent une couverture plus faible, et même le double cross-fitting n’a apporté qu’une amélioration limitée. Ces résultats soulignent l’importance du choix des estimateurs en fonction de la disponibilité et de la dimensionnalité des covariables.
Date and Time
-
Co-auteurs (non y compris vous-même)
Zining Annie Wang
University of British Columbia
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Mohammad Ehsanul Karim The University of British Columbia