From Trees to GLMs in Non-Life Insurance
A recently identified equivalence shows that regression trees fit using mean squared error loss can be expressed as the least-squares fit of a linear model, with the predictors being binary indicators of the tree's internal nodes. We generalize this result to trees fit using a deviance loss and generalized linear models, bridging the gap between these two modelling paradigms and introducing a GLM/tree hybrid regression model. We explore how this relationship can be applied in non-life insurance and propose improvements to tree-based models in terms of fit, regularisation, and interpretability.
Des arbres aux modèles linéaires généralisés en assurance non-vie
Une équivalence récemment identifiée montre que les arbres de régression ajustés à l’aide d’une fonction de perte quadratique moyenne peuvent être exprimés comme l’ajustement aux moindres carrés d’un modèle linéaire, dont les variables explicatives sont des indicateurs binaires des nœuds internes de l’arbre. Nous généralisons ce résultat aux arbres ajustés à l’aide d’une perte de déviance et aux modèles linéaires généralisés, comblant ainsi l’écart entre ces deux paradigmes de modélisation et introduisant un modèle hybride de régression GLM/arbre. Nous examinons comment cette relation peut être appliquée en assurance non-vie et proposons des améliorations des modèles fondés sur les arbres en matière d’ajustement, de régularisation et d’interprétabilité.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English