Aller au contenu principal
Beyond Classical Prediction Problems: A Selective Review of Random Forests for Complex Data and Specialized Analytical Tasks
Random forests (RFs) were originally designed for classification and regression tasks involving independent data. Since then, they have become one of the most widely used and influential tools in statistical learning, with Breiman’s seminal paper cited over 170,000 times as of January 2026. The flexibility of the RF framework allows it to be extended beyond traditional point prediction problems to accommodate more complex data structures and specialized analytical objectives. I will present a selective review of developments in the application of RFs to such advanced scenarios. I will demonstrate how RFs can be adapted to handle dependent data, including longitudinal, and spatial data. I will also explore their use in estimating alternative target quantities, such as conditional average treatment effects and covariance matrices. Furthermore, I will highlight how RFs can provide measures of uncertainty, enabling the construction of prediction intervals and other inferential tools.
Au‑delà des problèmes classiques de prédiction : une revue sélective des forêts aléatoires pour les données complexes et les tâches analytiques spécialisées
Les forêts aléatoires (FA) ont été initialement conçues pour des tâches de classification et de régression impliquant des données indépendantes. Depuis, elles sont devenues l’un des outils les plus utilisés et les plus influents en apprentissage statistique, l’article fondateur de Breiman ayant été cité plus de 170 000 fois en janvier 2026. La flexibilité du cadre FA permet de l’étendre au‑delà des problèmes traditionnels de prédiction ponctuelle, afin de traiter des structures de données plus complexes et des objectifs analytiques spécialisés. Je présenterai une revue sélective des développements liés à l’application des FA à de tels scénarios avancés. Je montrerai comment les FA peuvent être adaptées pour gérer des données dépendantes, notamment des données longitudinales et spatiales. J’examinerai également leur utilisation pour l’estimation de quantités cibles alternatives, telles que les effets de traitement moyens conditionnels et les matrices de covariance. En outre, je mettrai en évidence la manière dont les FA peuvent fournir des mesures d’incertitude, permettant la construction d’intervalles de prédiction et d’autres outils inférentiels.
Date and Time
-
Co-auteurs (non y compris vous-même)
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Denis Larocque HEC Montréal