Bayesian State-Space Models for Robust Air Quality Prediction.
Air quality forecasting relies on data from large environmental monitoring networks. However, these data are often noisy, incomplete, and heterogeneous across space and time, limiting the performance of recurrent deep learning models for pollutant time-series prediction. This study proposes a hybrid statistical machine learning framework that integrates Bayesian Kalman filtering with recurrent neural networks to improve robustness under data uncertainty. Kalman filtering is applied as a preprocessing and latent state estimation step to smooth pollutant and meteorological time series before model training. Standalone Gated Recurrent Units (GRU) and Long Short-Term Memory (LSTM) models are compared with Kalman-enhanced and attention-augmented variants. The framework is evaluated using hourly multivariate air-quality and meteorological data from three Canadian cities, covering five pollutants. Results demonstrate improved forecasting accuracy and stability using the proposed approach.
Modèles bayésiens spatio-temporels pour une prévision robuste de la qualité de l'air
Les prévisions relatives à la qualité de l'air s'appuient sur les données fournies par de vastes réseaux de surveillance environnementale. Cependant, ces données sont souvent bruitées, incomplètes et hétérogènes dans l'espace et dans le temps, ce qui limite les performances des modèles récurrents d'apprentissage profond pour la prévision des séries chronologiques de polluants. Cette étude propose un cadre hybride d'apprentissage automatique statistique qui intègre le filtrage bayésien de Kalman à des réseaux neuronaux récurrents afin d'améliorer la robustesse face à l'incertitude des données. Le filtrage de Kalman est appliqué comme étape de prétraitement et d'estimation de l'état latent pour lisser les séries chronologiques de polluants et de données météorologiques avant l'entraînement du modèle. Les modèles autonomes Gated Recurrent Units (GRU) et Long Short-Term Memory (LSTM) sont comparés à des variantes améliorées par Kalman et augmentées par l'attention. Le cadre est évalué à l'aide de données multivariées horaires sur la qualité de l'air et les conditions météorologiques provenant de trois villes canadiennes et couvrant cinq polluants. Les résultats démontrent une amélioration de la précision et de la stabilité des prévisions.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais