Aller au contenu principal
The M-structure and its roles in Model Uncertainty: Prediction and Decision
What if there is uncertainty in the modeling process itself? In the era of big data and machine learning, where models grow increasingly complex, the concern of model uncertainty has become more prominent. The theory in this context has evolved from a generalized view of probability to one centered on expectation. The nonlinear expectation framework provides a systematic foundation but remains difficult to interpret and relate to data-driven practice. We introduce the M-structure, which combines the properties of classical and nonlinear expectations. Its hybrid nature offers greater flexibility and tractability, enabling connections and extensions to statistics. Notably, it shows how to address model uncertainty under symmetry and exchangeability, with its own LLN and CLT supporting standardization. We highlight two recent applications: a robust prediction algorithm under distributional uncertainty and the multi-armed bandit problem with delayed feedback in reinforcement learning.
La structure M et ses rôles dans l’incertitude des modèles : prédiction et décision
Et s’il existait une incertitude dans le processus de modélisation lui-même ? À l’ère du big data et de l’apprentissage automatique, où les modèles deviennent de plus en plus complexes, la question de l’incertitude des modèles est devenue plus préoccupante. La théorie dans ce contexte a évolué d’une vision généralisée de la probabilité vers une approche centrée sur l’espérance. Le cadre des espérances non linéaires fournit une base systématique, mais reste difficile à interpréter et à relier à la pratique orientée sur les données. Nous introduisons la structure M, qui combine les propriétés des espérances classiques et non linéaires. Sa nature hybride offre une plus grande flexibilité et maniabilité, permettant des connexions et des extensions vers la statistique. Notamment, elle montre comment traiter l’incertitude des modèles sous symétrie et échangeabilité, avec ses propres formes de la loi des grands nombres (LLN) et du théorème central limite (CLT), soutenant la standardisation. Nous mettons en avant deux applications récentes : un algorithme de prédiction robuste sous incertitude distributionnelle et le problème du bandit manchot avec retour différé en apprentissage par renforcement.
Date and Time
-
Co-auteurs (non y compris vous-même)
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Yifan Li Western University