Aller au contenu principal
Data Source
Two R packages: PitchRx, Lehman and Retrosheet (www.retrosheet.org)
Organizer
Dave Campbell (dac5@sfu.ca)


Of all sports, baseball has probably generated the most extensive and complex statistical analyses. Albert (2010) proposes a number of questions to explore with data obtained by combining three data sets that are readily available. Two data sets are available through packages in R (R Core Team, 2014): the Lehman package (Friendly, 2014) and the pitchRx package (Sievert, 2014). A third data set with play-by-play data, Retrosheet (Pankin, 2015), can be downloaded for use in R following instructions provided by Albert (2014).

 

Research Question

 

Question 1:Quelle est la valeur relative, pour une équipe, de la moyenne au bâton d’un joueur (non-lanceur) comparé avec sa compétence à la défense? Ce rapport dépendra de la position du joueur en défense. (Green, 2015)


Question 2: Quel est l'impact (sur les points marqués ou victoires) de l'ordre des joueurs au bâton? Traditionnellement, le joueur avec la moyenne au bâton la plus élevée frappe d'abord. Un frappeur de contact fort (avec peu de retraits sur prises) frappe en deuxième place. Les troisième et quatrième frappeurs sont des frappeurs forts qui frappent beaucoup de coups de circuit. Certains se sont prononcés contre cette tradition et ils prétendent que vous devez tout simplement mettre votre "meilleur" frappeur en première position, votre "deuxième meilleur" frappeur en deuxième, et ainsi de suite, sur la justification qu’ainsi vos meilleurs frappeurs passeront au bâton plus souvent, en moyenne, au cours d'une saison. Comment mesurer la qualité des frappeurs suscite une certaine controverse. (Green, 2015).
 

Variables

 

Le but de cette étude de cas est d'utiliser ces ensembles de données afin d’explorer une de deux questions proposées dans une communication personnelle par Green (2015).
 

Chaque équipe choisit laquelle des deux questions elle souhaite explorer et elle doit présenter les résultats pour une seule question.
 

References
  1. Jim Albert (2010). Baseball data at Season, Play-by-Play, and Pitch-by-Pitch Levels. Journal of Statistics Education, 18, Retrieved from http://www.amstat.org/publications/jse/v18n3/albert.pdf
  2. Jim Albert (2014). Exploring Baseball Data with R, Retrieved from https://baseballwithr.wordpress.com/2014/02/10/downloading-retrosheet-da...
  3. Christopher Green (2015). Personal communication.
  4. Michael Friendly (2014). Lahman: Sean Lahman's Baseball Database. R package version 3.0-1.
  5. Mark Pankin (2015). Retrosheet. Retrieved from www.retrosheet.org
  6. R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL http://www.R-project.org/.
  7. Carson Sievert (2014). Taming PITCHf/x Data with {pitchRx} and {XML2R} The R Journal, 6(1). Retrieved from http://journal.r-project.org/archive/2014-1/sievert.pdf.
  8. Carson Sievert (2014). pitchRx: Tools for Harnessing MLBAM Gameday data and Visualizing PITCHf/x. R package version 1.6.