Aller au contenu principal
From Point to Probabilistic Gradient Boosting for Claim Frequency and Severity Prediction
Gradient boosting for decision tree algorithms are increasingly used in actuarial applications as they show superior predictive performance over traditional generalized linear models. Many enhancements of the first gradient boosting machine algorithm exist. We present in a unified notation, and contrast, all the existing point and probabilistic gradient boosting for decision tree algorithms: GBM, XGBoost, DART, LightGBM, CatBoost, EGBM, PGBM, XGBoostLSS, cyclic GBM, and NGBoost. In this comprehensive numerical study, we compare their performance on five publicly available datasets for claim frequency and severity. We compare the algorithms on the basis of computational efficiency, predictive performance, and model adequacy. The fully interpretable EGBM achieves competitive predictive performance compared to the black box algorithms considered. We find that model adequacy and predictive accuracy are achievable simultaneously.
Des approches ponctuelles aux approches probabilistes pour la prévision de la fréquence et de la sévérité par boosting du gradient en actuariat.
Les algorithmes de boosting du gradient basés sur les arbres de décision (GBDT) sont de plus en plus utilisés dans les applications actuarielles vu leur puissance de prévision supérieure aux modèles linéaires généralisés. Plusieurs améliorations au premier algorithme de GBDT existent. On présente dans une notation unifiée et on compare tous les algorithmes existants de GBDT : GBM, XGBoost, DART, LightGBM, CatBoost, EGBM, PGBM, XGBoostLSS, cyclic GBM et NGBoost. Dans cette étude numérique exhaustive, on compare les algorithmes sur cinq jeux de données disponibles publiquement pour la prévision de la fréquence et de la sévérité des sinistres. On compare les algorithmes sur la base du temps de calcul, de la performance de prévision et de l’adéquation. Le modèle pleinement interprétable EGBM atteint des performances comparables aux autres algorithmes « boîtes-noires » considérés dans l’étude. On constate que l’adéquation du modèle et la puissance de prévision sont atteignables en même temps.
Date and Time
-
Co-auteurs (non y compris vous-même)
Marie-Pier Côté
Université Laval
Langue de la présentation orale
Anglais
Langue des supports visuels
Français

Speaker

Edit Name Primary Affiliation
Dominik Chevalier Université Laval