Aller au contenu principal

Analyse des mégadonnées 
Responsable et président: Francois Bellavance (HEC Montreal) 
[PDF]

LUKE BORNN, Simon Fraser University
Des pixels aux points~: comment utiliser les données de poursuite pour mesurer la performance dans le sport professionnel  [PDF]
 
Dans cette présentation, j'explorerai comment les joueurs réagissent, individuellement et en équipe, sur un terrain de basketball. La combinaison de modèles spatiotemporels avancés et d'outils cartographiques inspirés de la géographie nous permet une compréhension de l'habileté du joueur bien meilleure que celle que nous offre l'un ou l'autre de ces outils. Je présenterai ces idées à l'aide de données de poursuite optique consistant en des centaines de millions d'observations, qui permettent de caractériser l'habileté défensive et la prise de décision chez les joueurs de la NBA. 
 
ERSHAD BANIJAMALI, University of Waterloo
Mélange de réseaux générateur  [PDF]
 
Dans cette présentation, j'introduirai un modèle générateur créé par entrainement d'une architecture profonde. Pour commencer, les données d'entrée sont divisées en K grappes et intégrées dans des réseaux distincts. Nous nous retrouvons avec un grand réseau composé de K sous-réseaux. L'entrainement de chaque sous-réseau vise à générer des échantillons dont la distribution est proche de la distribution sous-jacente de son ensemble d'entrainement attitré. L'estimation empirique de la divergence moyenne maximale (MMD) est utilisée comme mesure de la distance entre ces deux distributions. Par la suite, un algorithme est utilisé pour continuer l'entrainement des réseaux, tout en mettant à jour les grappes de l'ensemble d'entrainement par une estimation de la vraisemblance non paramétrique. Nous appelons cet algorithmeMélange de réseaux
 
PAUL D. MCNICHOLAS, McMaster
Regroupement de données de très grande dimension  [PDF]
 
Nous examinons diverses approches de regroupement de données de très grande dimension. Chaque approche est fondée sur un modèle de mélange, dont chaque composante est considérée comme correspondant à un groupe. Certaines approches reposent sur l'hypothèse d'un espace (latent) à faible dimension sous-jacent, tandis que d'autres ont recours au concept du rétrécissement. Nous illustrons ces approches à l'aide de données réelles.