Stratégie du baseball

2015

Date Source: 

Two R packages: PitchRx, Lehman and Retrosheet (www.retrosheet.org)

Organizer: 

Dave Campbell (dac5@sfu.ca)

 

De tous les sports, le baseball a probablement généré les analyses statistiques les plus vastes et les plus complexes. Albert (2010) propose un nombre de questions à explorer avec les données obtenues en combinant trois ensembles de données qui sont facilement disponibles. Deux de ces ensembles de données sont disponibles via les paquetages en R (R Core Team, 2014): le paquetage Lehman (Friendly, 2014) et le paquetage pitchRx (Sievert, 2014). Un troisième ensemble de données avec des données action-par-action (de l’anglais play-by-play), Retrosheet (Pankin, 2015), peut être téléchargé pour une utilisation dans R en suivant les instructions fournies par Albert (2014).
 

Research Question: 

 

Question 1:Quelle est la valeur relative, pour une équipe, de la moyenne au bâton d’un joueur (non-lanceur) comparé avec sa compétence à la défense? Ce rapport dépendra de la position du joueur en défense. (Green, 2015)


Question 2: Quel est l'impact (sur les points marqués ou victoires) de l'ordre des joueurs au bâton? Traditionnellement, le joueur avec la moyenne au bâton la plus élevée frappe d'abord. Un frappeur de contact fort (avec peu de retraits sur prises) frappe en deuxième place. Les troisième et quatrième frappeurs sont des frappeurs forts qui frappent beaucoup de coups de circuit. Certains se sont prononcés contre cette tradition et ils prétendent que vous devez tout simplement mettre votre "meilleur" frappeur en première position, votre "deuxième meilleur" frappeur en deuxième, et ainsi de suite, sur la justification qu’ainsi vos meilleurs frappeurs passeront au bâton plus souvent, en moyenne, au cours d'une saison. Comment mesurer la qualité des frappeurs suscite une certaine controverse. (Green, 2015).
 

Variables: 

 

Le but de cette étude de cas est d'utiliser ces ensembles de données afin d’explorer une de deux questions proposées dans une communication personnelle par Green (2015).
 

Chaque équipe choisit laquelle des deux questions elle souhaite explorer et elle doit présenter les résultats pour une seule question.
 

References: 

  1. Jim Albert (2010). Baseball data at Season, Play-by-Play, and Pitch-by-Pitch Levels. Journal of Statistics Education, 18, Retrieved from http://www.amstat.org/publications/jse/v18n3/albert.pdf
  2. Jim Albert (2014). Exploring Baseball Data with R, Retrieved from https://baseballwithr.wordpress.com/2014/02/10/downloading-retrosheet-da...
  3. Christopher Green (2015). Personal communication.
  4. Michael Friendly (2014). Lahman: Sean Lahman's Baseball Database. R package version 3.0-1.
  5. Mark Pankin (2015). Retrosheet. Retrieved from www.retrosheet.org
  6. R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL http://www.R-project.org/.
  7. Carson Sievert (2014). Taming PITCHf/x Data with {pitchRx} and {XML2R} The R Journal, 6(1). Retrieved from http://journal.r-project.org/archive/2014-1/sievert.pdf.
  8. Carson Sievert (2014). pitchRx: Tools for Harnessing MLBAM Gameday data and Visualizing PITCHf/x. R package version 1.6.