Concours national d’études de cas de l’INCASS 2019

CANSSI

Prévision des retards dans les horaires des traversiers de la société BC Ferries 

Élargissez vos compétences en statistique, en collaboration et en résolution de problèmes en vous inscrivant au concours national d’études de cas de l’Institut canadien des sciences statistiques (concours de l’INCASS). Ce concours invite les étudiants à mettre leurs connaissances à l’épreuve pour résoudre un problème réel à l’aide d’un ensemble de données sur les activités de la société BC Ferries. Les organisations sont à la recherche d’étudiants qui possèdent des compétences en résolution de problèmes réels. Ce concours vous permettra d’acquérir une expérience précieuse qui vous permettra d’être en meilleure position pour entreprendre une fructueuse carrière en statistique.

À propos du concours :

Le concours national d’études de cas de l’INCASS est un projet destiné aux étudiants inscrits à des programmes de premier cycle ou de deuxième cycle dans des universités canadiennes. Le concours entre les étudiants consistera à établir des prévisions statistiques. Les données à utiliser pour le concours seront accessibles le 3 septembre, et les étudiants pourront soumettre leurs solutions en ligne jusqu’au 3 octobre. Les étudiants peuvent s’inscrire au concours de l’INCASS à compter du 3 septembre. L’Université Carleton, l’Université Concordia, l’Université MacEwan, l’Université Simon-Fraser et l’Université du Nouveau-Brunswick organiseront des concours régionaux. Les meilleures solutions de leurs étudiants participants se verront attribuer des prix en argent. Les gagnants des compétitions régionales seront invités à participer au concours national annoncé par affichage à l’Université Simon-Fraser à Burnaby, en Colombie-Britannique, au siège national de l’INCASS, le 2 novembre.

Pourquoi participer?

Ce marathon d’analyse de données vous offre une occasion unique de perfectionner vos compétences en résolution de problèmes et d’élaborer des solutions créatives à un problème réel, des compétences qui sont grandement recherchées par toutes les organisations. En plus de pouvoir travailler en équipe, vous perfectionnerez vos compétences en présentation lorsque vous présenterez vos solutions à nos juges. Sans oublier que les gagnants se voient offrir une entrevue avec Statistique Canada pour un poste à temps plein ou un poste d’étudiant dans le cadre du programme coopératif, de même qu’un prix en argent.

Prix

  • Les gagnants se verront offrir une entrevue avec Statistique Canada pour un poste à temps plein ou un poste d’étudiant dans le cadre du programme coopératif.
  • Un prix en argent sera remis aux équipes gagnantes.

Dates à retenir

3 septembre 2019— Diffusion de l’ensemble de données et début de la période d’inscription en ligne

2 octobre 2019—Date de remise des prévisions en ligne

30 septembre au 4 octobre 2019—Concours régionaux (Université Carleton, Université Concordia, Université MacEwan, Université du Nouveau-Brunswick et Université Simon-Fraser)

2 novembre 2019—Concours final à l’Université Simon-Fraser

Admissibilité

Tous les étudiants inscrits à un programme de premier cycle ou de deuxième cycle d’une université ou d’un collège canadien peuvent participer à ce concours. Les personnes qui ne sont pas inscrites à un programme de premier cycle ou de deuxième cycle peuvent tout de même participer au concours, mais elles ne seront pas admissibles aux prix en argent ou au processus de sélection des gagnants dans le cadre des concours régionaux ou du concours national annoncé par affichage.

Le défi

Les participants à ce concours national d’études de cas auront pour défi de prévoir les retards dans les horaires des traversiers de la société BC Ferries aux ports de Vancouver et de Victoria. L’ensemble de données comprend 61 880 traversées en mer effectuées entre les mois d’août 2016 et de mars 2018. L’ensemble de données est divisé en un ensemble de données d’entraînement comprenant 80 % des traversées en mer (soit 49 504 traversées entre août 2016 et novembre 2017) et un ensemble de données d’essai comprenant 20 % des traversées (soit 12 376 traversées entre novembre 2017 et mars 2018). La tâche consiste à établir des prévisions de façon à déterminer si chaque traversée de l’ensemble de données d’essai a été retardée ou non. Diverses covariables sont fournies pour chaque traversée (date, heure de départ, port de départ, port d’arrivée, nom du navire, etc.). Ces covariables sont décrites plus en détail dans la section Données ci-dessous. En plus de ces covariables, certaines données sur la météorologie et le trafic sont fournies.

Dans le cadre des concours régionaux et du concours national annoncé par affichage, les étudiants seront jugés en fonction de la précision de leurs prévisions des retards (pourcentage exact), ainsi que d’un rapport dans lequel ils présenteront leurs méthodes et leurs résultats, et d’autres renseignements sur les données découlant de leur analyse. 

Les données

L’ensemble de données sur les traversiers comprend des enregistrements sur 61 880 traversées effectuées entre les mois d’août 2016 et de mars 2018 en provenance et à destination de l’un des ports suivants : Horseshoe Bay, Swartz Bay, Tsawwassen et Departure Bay. Les renseignements suivants sont fournis pour chaque traversée :

  • Nom du navire
  • Heure de départ prévue
  • Port de départ
  • Port d’arrivée
  • Date (y compris le jour de la semaine et le jour de l’année)

Pour les 49 504 traversées des données d’entraînement, la durée réelle de la traversée est fournie, de même qu’un indicateur indiquant si la traversée a été retardée ou non. Pour les 12 376 traversées des données d’essai, la durée réelle de la traversée et l’indicateur de retard ne sont pas fournis; il revient aux participants de prévoir l’indicateur de retard (c.-à-d. si la traversée a été retardée ou non).

Une série chronologique sur la température et l’humidité au port de Vancouver est également fournie, ainsi qu’une série chronologique sur la température, l’humidité, la pression, la vitesse du vent et la direction du vent au port de Victoria. Une série chronologique de données ordinales sur le volume de trafic provenant du pont Lions Gate est également fournie (le trafic étant mesuré en fonction d’une échelle de 1 à 5). Ce pont relie le centre-ville de Vancouver à North Vancouver, et constitue une artère importante vers la gare maritime de Horseshoe Bay.

De plus amples détails sur ces données seront publiés au moment de la diffusion des données le 3 septembre. Ces données sont du domaine public et peuvent être redistribuées ou modifiées.

Règlements du concours

  • Les participants peuvent s’inscrire en équipe d’au plus trois personnes.
  • Vous pouvez utiliser des ressources bibliothécaires, des logiciels, des langages de programmation ou toute autre méthode dans le cadre de ce concours.
  • Vous pouvez utiliser du code que vous trouvez sur Internet, pourvu que vous respectiez les critères suivants :
    • le code est accessible en vertu d’une licence ouverte (p. ex., vous pouvez utiliser tout ce qui provient de http://stackoverflow.com);
    • vous mentionnez les sources externes que vous avez utilisées en commentaire dans votre code.
  • Vous pouvez utiliser du code écrit par d’autres participants qui ne font pas partie de votre équipe, pourvu que vous respectiez les conditions suivantes :
    • vous avez obtenu l’autorisation de ces personnes d’utiliser le code;
    • vous mentionnez ces personnes comme une source que vous avez utilisée en commentaire dans votre code.
  • Vous pouvez demander de l’aide et des conseils à des professeurs, à des superviseurs ou à d’autres personnes externes au concours, mais l’intégralité de votre travail doit être exécutée par votre équipe.
  • Les éducateurs sont libres d’utiliser ce concours comme support de devoirs.

 

 

Mercredi, 14 août, 2019

Liaison Newsletter: