Nonparametric Distribution Estimation for Survival Data Using Double Generators
Estimating conditional survival functions is a central problem in survival analysis. Traditional nonparametric methods often struggle with nonlinear relationships or high-dimensional covariates. We propose a nonparametric regression approach based on deep generative models. A single neural network with two task-specific branches simultaneously parameterizes conditional generators for survival and censoring times, modeling their joint distribution without strong parametric assumptions. This “double-generator” design enables simulation of synthetic data that preserves complex dependencies between outcomes, censoring mechanisms, and covariates. Under mild identifiability conditions weaker than conditional independent censoring, we establish the statistical validity of the method and derive its minimax optimal rate. Extensive simulation studies show improved accuracy and robustness over several state-of-the-art benchmarks for estimating conditional survival functions.
Estimation non paramétrique de la distribution pour les données de survie à l'aide de deux générateurs
L'estimation des fonctions de survie conditionnelles est un problème central dans l'analyse de survie. Les méthodes non paramétriques traditionnelles ont souvent du mal à traiter les relations non linéaires ou les covariables à haute dimension. Nous proposons une approche de régression non paramétrique basée sur des modèles génératifs profonds. Un seul réseau neuronal avec deux branches spécifiques à la tâche paramètre simultanément les générateurs conditionnels pour les temps de survie et de censure, modélisant leur distribution conjointe sans hypothèses paramétriques fortes. Cette conception à « double générateur » permet la simulation de données synthétiques qui préservent les dépendances complexes entre les résultats, les mécanismes de censure et les covariables. Dans des conditions d'identifiabilité modérées, plus faibles que la censure conditionnelle indépendante, nous établissons la validité statistique de la méthode et en dérivons son taux optimal minimax. Des études en simulation approfondies montrent une précision et une robustesse améliorées par rapport à plusieurs références de pointe pour l'estimation des fonctions de survie conditionnelles.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English