Convolution-Smoothed Quantile XGBoost for Estimating Environmental Exposure Extremes
Modelling human exposures to environmental extremes is a critical public health priority, as episodic spikes can trigger severe adverse health outcomes. To manage the inherent complexity of multi-source environmental data, Extreme Gradient Boosting (XGBoost) has emerged as a robust tool for capturing spatial and temporal structure. We introduce convolution-smoothed quantile regression for XGBoost, which enables the estimation of conditional quantiles. This approach supports uncertainty quantification through point-wise prediction intervals and facilitates extreme value characterization by estimating a conditional inverse cumulative distribution function (CDF) from a dense grid of quantiles. Using environmental data from California, we show that the proposed method provides reliable estimates of high-exposure risk while producing well-behaved tail estimates, improving risk assessment for extreme pollutant exposures.
Quantile XGBoost lissé par convolution pour l'estimation des expositions environnementales extrêmes
La modélisation de l'exposition humaine à des conditions environnementales extrêmes est une priorité essentielle en matière de santé publique, car les pics épisodiques peuvent avoir des conséquences néfastes graves sur la santé. Pour gérer la complexité inhérente aux données environnementales provenant de sources multiples, l'amplification extrême de gradient (Extreme Gradient Boosting ou XGBoost) s'est imposée comme un outil robuste permettant de saisir la structure spatiale et temporelle. Nous introduisons la régression quantile lissée par convolution pour XGBoost, qui permet l'estimation des quantiles conditionnels. Cette approche permet de quantifier l'incertitude grâce à des intervalles de prédiction ponctuels et facilite la caractérisation des valeurs extrêmes en estimant une fonction de répartition inverse conditionnelle à partir d'une grille dense de quantiles. À l'aide de données environnementales provenant de Californie, nous montrons que la méthode proposée fournit des estimations fiables du risque d'exposition élevée tout en produisant des estimations de queue bien comportées, améliorant ainsi l'évaluation des risques liés à l'exposition à des polluants extrêmes.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English