Analyse des données bayésiennes non paramétriques
Peter Müeller
UT Austin, USA
6–8 juillet 2020, 14h-–6h (HNE)
Ce cours intensif en ligne est co-organisé par le StatLab du CRM et le programme de cycle supérieur de biostatistique de l’Université McGill.
Inscription gratuite. Les détails sont disponibles sur le site Web du CRM.
Résumé :
Tous les modèles sont faux, mais certains sont utiles. Bon nombre de statisticiens connaissent et apprécient ce commentaire de G.E.P. Box sur la modélisation statistique. Bien souvent, le choix du modèle d’inférence final constitue un compromis entre une représentation fidèle des conditions expérimentales, la préférence de la parcimonie et le besoin d’une mise en œuvre réalisable. Or ces objectifs contradictoires ne sont pas toujours clairement exposés et les incertitudes qui en résultent, pas toujours entièrement bien décrites. Ces vingt dernières années, une approche d’inférence puissante, qui permet d’atténuer certaines de ces contraintes, est devenue de plus en plus populaire. L’inférence bayésienne non paramétrique (BNP) permet de reconnaître l’incertitude dans un modèle d’échantillonnage donné, tout en maintenant une approche d’inférence réalisable en pratique. Nous pourrions utiliser cette propriété comme une caractérisation pragmatique de l’inférence BNP comme des modèles de probabilité a priori souples qui généralisent les modèles traditionnels, tout en permettant une distribution de probabilité a priori pour une très large gamme de modèles alternatifs et en centrant l’a priori sur un modèle traditionnel parcimonieux. On peut définir formellement l’inférence BNP comme des modèles de probabilité sur des espaces de paramètres de dimension infinie. L’inférence BNP est typiquement appliquée à l’estimation de densité.
Dans ce cours intensif, nous étudierons certains modèles populaires, notamment les modèles de processus de Dirichlet (DP), les modèles par arbres de Pólya, les mélanges de DP et les modèles de DP dépendants (DDP). Nous passerons en revue certains principes de modélisation généraux, dont les modèles d’échantillonnage d’espèces, les a priori à rupture de bâtons, modèles de partition-produit pour partitions aléatoires et mesures aléatoires randomisées avec processus à accroissement indépendant. Nous discuterons brièvement des principaux algorithmes computationnels et des logiciels disponibles. La discussion sera illustrée avec des applications à des problèmes en biostatistique et bio-informatique.
Sujets couverts :
• Définition de l’inférence BNP et introduction
• Estimation de densité : processus de Dirichlet (DP), rupture de bâtons, mélanges de DP, regroupement de DP, mélanges de DP: simulation a posteriori, arbres de Pólya (PT)
• Régression : régression de survie BNP, DP dépendants (DDP), DDP Anova, mélange de DP pondérés, processus de rupture de bâtons à noyau, a priori de processus gaussiens
• A priori hiérarchiques : DP hiérarchiques, DP imbriqués
• Modèles à effets mixtes : Sous-populations multiples et classification des distributions des effets aléatoires
Public cible et prérequis : Toute personne qui apprécie l’analyse de données et qui a une connaissance de base de l’inférence bayésienne, au niveau, par exemple, de Hoff (2009), d’un premier cours sur les modèles statistiques bayésiens ou tout autre manuel de base sur l’inférence bayésienne.
Références : Les points #2–4 sont accessibles gratuitement en ligne, #1 est probablement disponible au format PDF auprès de votre bibliothèque (tout comme Hoff (2009))
1. Le cours suivra le manuel : Müller, P., Quintana, F., Jara, A. et Hanson, T. (2015), Bayesian Nonparametric Data Analysis, Springer.
2. À lire (de préférence avant le cours) : P. Müller et R. Mitra (2013), « Bayesian Nonparametric Inference—Why and How », Bayesian Analysis, 8, 269–302.
3. Notes de cours d’un programme similaire : Müller, P. et Rodriguez, A., (2012) « Nonparametric Bayesian Inference », IMS Lecture Notes, gratuit à https://projecteuclid.org/euclid.cbms/1362163742
4. Notes excellentes par Peter Orbantz, à http://www.gatsby.ucl.ac.uk/~porbanz/papers/porbanz_BNP_draft.pdf