A Gradient Boosting Decision Tree Based Estimation Method for the Mixture Cure Model

Existing semiparametric estimation methods for cure models rely on restrictive parametric assumptions, and existing nonparametric estimation methods only work with single covariates. We propose a gradient boosting decision tree-based method to estimate the mixture cure model. The new method inherits the features of the original gradient boosting decision tree method and provides more accurate estimates of the cure probability and the relative risk for uncured subjects than existing methods when there are no a priori parametric assumptions on the forms of complex covariate effects in the model. This is demonstrated with small mean square errors in the estimates of the cure probability, relative risk score, and survival function in a simulation study with large samples. The method also has the potential to deal with high-dimensional covariates. The proposed method is illustrated with a large sample study of colon cancer.

Méthode d'estimation basée sur un arbre de décision à amplification de gradient pour modèle de mélange de guérison

Les méthodes d'estimation semi-paramétriques existantes pour les modèles de guérison reposent sur des hypothèses paramétriques restrictives, et les méthodes d'estimation non paramétriques existantes ne fonctionnent qu'avec des covariables uniques. Nous proposons une méthode basée sur un arbre de décision à amplification de gradient pour estimer le modèle de mélange de guérison. La nouvelle méthode hérite des caractéristiques de la méthode originale d'arbre de décision à amplification de gradient et fournit des estimations plus précises de la probabilité de guérison et du risque relatif pour les sujets non guéris que les méthodes existantes lorsqu'il n'y a pas d'hypothèses paramétriques a priori sur les formes d'effets covariables complexes dans le modèle. Cela est démontré par de faibles erreurs quadratiques moyennes dans les estimations de la probabilité de guérison, le score de risque relatif et la fonction de survie dans une étude de simulation avec de grands échantillons. La méthode permettrait également de traiter des covariables à haute dimension. La méthode proposée est illustrée par une étude sur un large échantillon de cas de cancer du côlon.

Session

Recent Advances in Cure Rate Modelling

Date and Time

Tue, 06/02/2026 - 14:30 - Tue, 06/02/2026 - 15:00

Additional Authors and Speakers (not including you)

Language of Oral Presentation

English

Language of Visual Aids

English