La septième conférence Ottawa Hockey Analytics (#OTTHAC 2022), qui s’est déroulée les 25 et 26 mars 2022, a donné le coup d’envoi de la deuxième itération de la Big Data Cup, #BDC2022. La BDC2022 est animée par Stathletes et parrainée par l’INCASS, Stathletes, la Rotman School de l’Université de Toronto, l’Université Carleton et l’Université St. Lawrence. Il s’agit d’un datathon axé sur les données du hockey. Cette année, l’accent sera mis sur les analyses du jeu des équipes spéciales.
Les ensembles de données mis à la disposition des participants ont été conçus spécifiquement pour la Big Data Cup. Ils ne sont pas au format original mais sont destinés à être une petite partie des données Stathletes qui sont traduites pour la consommation publique. Ils se concentrent sur deux domaines clés du jeu qui ont pris de l’importance au cours de l’année écoulée :
- Jeu de hockey féminin : (échantillon du tournoi de hockey féminin 2018 et 2022 et jeux de la NCAA) L’intérêt pour les sports féminins a augmenté pendant la pandémie. En donnant accès à des données sur le sport joué à son plus haut niveau, nous espérons que les participants travailleront avec cet ensemble de données robustes provenant de tournois internationaux.
- Données de suivi : (échantillon du tournoi de hockey féminin 2022) Le suivi des joueurs est possible dans de nombreuses ligues de sport professionnel. Les données de suivi générées par la caméra de diffusion sont un moyen facile de développer des statistiques avancées pour les ligues qui ont peut-être moins de ressources.
REMARQUE : Comme indiqué dans l’entente juridique, ces données ne peuvent être revendues et ne peuvent être utilisées qu’à des fins de recherche.
Le prix à gagner est de 10 000 $ en argent et en cadeaux de la part des équipes de la LNH. Il y aura deux catégories pour les participants :
- Lycée/collège/université – tous les participants doivent fournir une preuve d’inscription au lycée, au collège ou à l’université.
- Ouvert – Cette catégorie comprend les étudiants diplômés et toute personne intéressée par la recherche sur le hockey.
Les équipes peuvent compter de 1 à 4 participants. Pour participer à ce datathon, vous devez vous INSCRIRE.
Calendrier et dates clés pour 2022
La participation à la compétition Big Data Cup 2022 est ouverte à toute personne, quels que soient ses antécédents, son expérience, ses analyses antérieures ou ses travaux publics. Vous devez vous INSCRIRE au datathon.
- Mars – Les données sont publiées : Lien GitHub
- Avril/mai – Heures de bureau ouvertes
Nous voulons favoriser la capacité de chaque participant à évaluer les données tant du point de vue du processus que de la technique. Pour y parvenir, nous prévoyons des heures de bureau pendant la Big Data Cup (les heures précises seront annoncées en avril). Des experts en la matière, tant dans le domaine du sport que de l’analyse, seront disponibles pour répondre à vos questions et vous fournir des commentaires. Consultez https://www.stathletes.com/big-data-cup/ pour plus de détails et de mises à jour et suivez @meghanchayka sur Twitter pour savoir comment vous inscrire. Toute personne intéressée est encouragée à postuler et les données seront fournies publiquement pour faire avancer la recherche sur le hockey.
- 15 mai – Date limite pour les soumissions à la Big Data Cup
- Semaine du 30 mai – Annonce des finalistes
- Week-end du 11/12 juin – Annonce des gagnants de chaque catégorie (Deux gagnants par catégorie) à la BDC2022
- Hockey féminin
- Lycée/collège/études supérieures
- Ouvert
Les finalistes seront sélectionnés* la semaine du 30 mai et auront l’occasion de présenter leurs résultats à notre panel de dirigeants de la LNH. Des prix seront décernés aux meilleurs qualifiés.
*Les critères d’évaluation comprennent, sans s’y limiter, les éléments suivants : une capacité démontrée à créer des idées concrètes pour un directeur général ou un entraîneur-chef travaillant dans le domaine du hockey et pas seulement dans la recherche; la génération d’idées créatives, ce qui peut signifier emprunter et appliquer des idées d’autres sports, tirer parti de la connaissance du domaine et/ou combler les lacunes créées par les limitations des données publiques; une compréhension performante de la façon de travailler avec de grands ensembles de données.