Aller au contenu principal
A Nonparametric Framework for Treatment Effect Modifier Discovery in High Dimensions
Heterogeneous treatment effects are driven by treatment effect modifiers (TEMs), pre-treatment covariates that modify the effect of a treatment on an outcome. Current approaches for uncovering TEMs are limited to low-dimensional data, data with weakly correlated covariates, or parametric data-generating processes. We resolve these issues by developing a framework for defining model-agnostic TEM variable importance parameters appropriate for high-dimensional data with arbitrary correlation structure, deriving causal machine learning estimators of these parameters, and establishing these estimators' asymptotic properties. Simulation experiments demonstrate that these estimators' asymptotic guarantees are approximately achieved in realistic sample sizes for observational and randomized studies alike. This framework is applied to gene expression data collected during a clinical trial investigating the effect of a novel treatment on disease-free survival in breast cancer.
Un cadre non paramétrique pour la découverte de modificateurs de l'effet de traitement en grande dimension
Les effets hétérogènes de traitement sont déterminés par les modificateurs de l'effet du traitement, des variables antérieures au traitement qui modifient l'effet d'un traitement sur un résultat. Les approches actuelles pour découvrir les modificateurs de l'effet du traitement sont limitées aux données de faible dimension, aux données avec des variables faiblement corrélées, ou aux processus paramétriques de génération de données. Nous résolvons ces problèmes en développant un cadre permettant de définir des paramètres d'importance des variables modificateurs de l'effet de traitement pour les données de grande dimension avec une structure de corrélation arbitraire, en dérivant des estimateurs d'apprentissage automatique causal de ces paramètres, et en établissant les propriétés asymptotiques de ces estimateurs. Des simulations démontrent que les garanties asymptotiques de ces estimateurs sont approximativement atteintes dans des tailles d'échantillon réalistes pour les études observationnelles et randomisées. Ce cadre est appliqué aux données d'expression génétique recueillies au cours d'un essai clinique étudiant l'effet d'un nouveau traitement sur la survie sans maladie dans le cas du cancer du sein.
Date and Time
-
Co-auteurs (non y compris vous-même)
Ning Leng
Genentech Inc
Nima S Hejazi
Harvard T.H. Chan School of Public Health
Mark J van der Laan
University of California, Berkeley
Sandrine Dudoit
University of California, Berkeley
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Philippe Boileau McGill University