Aller au contenu principal

Date : dimanche 29 mai 2022
Heure : 11h00 - 18h00 (HAE)

Titre : Fournir des statistiques appliquées, du concept à la production

Instructeurs :

Peter Solymos
Peter est un scientifique des données principal avec 20 ans d'expérience dans les secteurs de la faune, de l'environnement et des services publics. Titulaire d'un doctorat en biologie, il est l'auteur de 70 publications revues par des pairs et de plusieurs logiciels statistiques. Il est passionné par l'utilisation des statistiques et de la science des données pour combler le fossé entre les données et les décisions. Il s'attache à faciliter ce processus en aidant les organisations à adopter des pratiques natives en nuage dans leurs opérations.




Khalid Lemzouji
Khalid est un statisticien principal et un scientifique des données. Khalid a 15 ans d'expérience en matière de décision sur les risques liés à l'environnement, à la santé publique et à la fiabilité des pipelines. Khalid est compétent dans l'utilisation d'outils statistiques et d'apprentissage automatique pour transformer les données en connaissances. Ces connaissances sont utilisées pour la prise de décision éclairée par les scientifiques de l'environnement, les chirurgiens cardiaques et les ingénieurs de pipelines. Khalid est un statisticien professionnel accrédité par la Société statistique du Canada (P.Stat.) et l'American Statistical Association (PStat® (ASA)). Khalid est titulaire d'un double baccalauréat en génie chimique et en statistique et d'une maîtrise en statistique de la University of Alberta.


Description :

Les statistiques appliquées modernes impliquent de communiquer les résultats à divers publics. Cette communication se fait de plus en plus par le biais de médias interactifs plutôt que par des rapports périodiques. L'éducation traditionnelle des statisticiens ne prépare pas adéquatement les scientifiques appliqués à gérer efficacement de telles exigences. Toutefois, une saine exposition aux compétences et aux pratiques de l'ingénierie logicielle peut grandement faciliter la livraison des résultats en temps voulu. Cela s'explique par le délai plus court pour obtenir des prototypes fonctionnels, des boucles de rétroaction avec les parties prenantes plus courtes et une communication plus facile avec l'informatique/l'ingénierie en ce qui concerne l'échelle et les performances.

Notre cours d'une journée présente le processus de réflexion permettant de créer un code logiciel modulaire et réutilisable. Un tel code jette les bases d'une construction rapide de prototypes et d'interfaces. Nous introduirons des technologies natives en nuage, telles que Docker, et utiliserons le langage de programmation statistique R. Le langage R permet de créer des applications Web complètes à l'aide du cadre Shiny et de développer des interfaces Web. Nous utiliserons des logiciels libres et gratuits qui s’appuient sur R. Les organisateurs de l'atelier configureront à l'avance des instances en nuage que les participants pourront utiliser, ce qui réduira le temps de préparation et d'installation et supprimera les problèmes liés à la configuration.

Les participants devront être familiarisés avec R mais une connaissance approfondie n'est pas requise. Nous utiliserons l'environnement de développement intégré RStudio pour la programmation et pour l'accès aux serveurs. Les participants auront besoin de leur propre ordinateur portable avec un navigateur Internet moderne et un accès à Internet. L'équipement audiovisuel dépend de la nature en personne/à distance/hybride de l'atelier (projecteur, logiciel de conférence pour les participants à distance).

Grandes lignes :

L'atelier de 6 heures sera structuré en 4 blocs, chacun d'une durée d'environ 1,5 heure.

  • Présentations
  • Transformation d’un concept en un flux de modélisation des données
  • Pause-café
  • Développement d’interfaces de ligne de commande et de prototypes d'application
  • Pause-repas
  • Partage des résultats avec les parties prenantes
  • Déploiement d'applications interactives dans le nuage
  • Pause-café
  • Performance et échelle : découplage de la logique commerciale de la présentation