But It Works on My Machine: Creating Reusable Compute Environments for Research and Teaching
Code is the foundation of reproducible and replicable research, ensuring transparency in how data is processed, transformed, and analyzed. However, code alone isn't enough. Without the right computational environment, results may not be consistent across different machines, time periods, or collaborators.
Many research and data projects span months, involve multiple people, and run on different systems. A common challenge is ensuring that results can be reliably reproduced, even when software updates or system differences come into play. "It works on my machine" is not a guarantee for the future.
In this talk, we’ll explore tools and techniques for creating shareable, stable computational environments that support reproducibility. We’ll cover renv for managing R packages, Docker for containerized compute environments, and GitHub Actions for automating the reproduction of computational workflows. These tools, beyond just writing code, help make data science projects more reliable and re
Many research and data projects span months, involve multiple people, and run on different systems. A common challenge is ensuring that results can be reliably reproduced, even when software updates or system differences come into play. "It works on my machine" is not a guarantee for the future.
In this talk, we’ll explore tools and techniques for creating shareable, stable computational environments that support reproducibility. We’ll cover renv for managing R packages, Docker for containerized compute environments, and GitHub Actions for automating the reproduction of computational workflows. These tools, beyond just writing code, help make data science projects more reliable and re
Mais ça marche sur ma machine : créer des environnements informatiques réutilisables pour la recherche et l'enseignement
Le code est le fondement de la recherche reproductible et réplicable, garantissant la transparence dans la manière dont les données sont traitées, transformées et analysées. Cependant, le code seul ne suffit pas. Sans un environnement informatique adéquat, les résultats risquent de ne pas être cohérents d'une machine à l'autre, d'une période à l'autre ou d'un collaborateur à l'autre.
De nombreux projets de recherche et de données s'étendent sur plusieurs mois, impliquent plusieurs personnes et tournent sur différents systèmes. Un défi commun consiste à s'assurer que les résultats peuvent être reproduits de manière fiable, même après la mise à jour d'un logiciel et/ou sur un autre système. Le fait que « ça marche sur ma machine » n'est pas une garantie pour l'avenir.
Dans cet exposé, nous explorerons les outils et les techniques permettant de créer des environnements de calcul stables et partageables qui favorisent la reproductibilité. Nous aborderons renv pour la gestion des paquets R, Docker pour les environnements de calcul conteneurisés et GitHub Actions pour l'automatisation de la reproduction des flux de travail informatiques. Ces outils, au-delà de l'écriture de code, aident à rendre les projets de science des données plus fiables, reproductibles et transparents.
De nombreux projets de recherche et de données s'étendent sur plusieurs mois, impliquent plusieurs personnes et tournent sur différents systèmes. Un défi commun consiste à s'assurer que les résultats peuvent être reproduits de manière fiable, même après la mise à jour d'un logiciel et/ou sur un autre système. Le fait que « ça marche sur ma machine » n'est pas une garantie pour l'avenir.
Dans cet exposé, nous explorerons les outils et les techniques permettant de créer des environnements de calcul stables et partageables qui favorisent la reproductibilité. Nous aborderons renv pour la gestion des paquets R, Docker pour les environnements de calcul conteneurisés et GitHub Actions pour l'automatisation de la reproduction des flux de travail informatiques. Ces outils, au-delà de l'écriture de code, aident à rendre les projets de science des données plus fiables, reproductibles et transparents.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English