A Framework to Analyze Time-to-Event Outcomes From Non-Probability Samples
We propose a framework for analyzing time-to-event outcomes in non-probability cohorts using external probability samples to adjust for selection bias. The framework includes inverse probability weighting (IPW), outcome regression (OR), and doubly robust (DR) estimation, ensuring consistency under model misspecification. We consider two approaches for estimating survival probabilities: pseudo-observations to reconstruct complete data and direct modification of survival probability estimation from censored data. The methods apply to parametric and semi-parametric models, including Kaplan-Meier and Cox proportional hazards models. Simulations show that IPW and OR estimators perform well when correctly specified but degrade under misspecification, whereas DR estimators are unaffected if at least one model is correct. This framework extends statistical methods for continuous outcomes to survival analysis, providing a robust approach for handling bias in non-probability cohorts.
Un cadre pour l'analyse des résultats de temps jusqu'à l'événement à partir d'échantillons non probabilistes
Nous proposons un cadre pour l'analyse des résultats de temps jusqu'à l'événement dans les cohortes non probabilistes en utilisant des échantillons probabilistes externes pour corriger le biais de sélection. Ce cadre comprend la pondération des probabilités inverses (IPW), la régression des résultats (OR) et l'estimation doublement robuste (DR), garantissant la cohérence en cas de mauvaise spécification du modèle. Nous considérons deux approches pour l'estimation des probabilités de survie : les pseudo-observations pour reconstruire des données complètes et la modification directe de l'estimation des probabilités de survie à partir de données censurées. Les méthodes s'appliquent aux modèles paramétriques et semi-paramétriques, y compris les modèles de Kaplan-Meier et de Cox à risques proportionnels. Les simulations démontrent que les estimateurs IPW et OR donnent de bons résultats lorsqu'ils sont correctement spécifiés, mais qu'ils se dégradent en cas de mauvaise spécification, alors que les estimateurs DR ne sont pas affectés si au moins un modèle est correct. Ce cadre étend les méthodes statistiques pour les résultats continus à l'analyse de survie, fournissant une approche robuste pour traiter les biais dans les cohortes non probabilistes.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais