Atelier du Groupe de biostatistique 2017

Gestion de données manquantes dans R à l’aide de MICE
Instructeur: Stef van Buuren

Dr van Buuren est statisticien à l’Organisation néerlandaise de recherche scientifique appliquée (TNO) à Leiden et professeur spécialisé en données manquantes à l’Université de Utrecht aux Pays-Bas. Pionnier de l’approche des équations enchaînées, Dr van Buuren a développé le progiciel populaire MICE visant à créer de multiples imputations et à les analyser dans R.

Objectif:

Presque toutes les procédures de données analytiques dans R sont conçues pour des données complètes, et plusieurs d’entre elles échoueront en présence de données manquantes. Règle générale, les méthodes ignorent simplement les rangées de données incomplètes ou utilisent des procédures ad hoc comme le remplacement des données manquantes par une « valeur optimale ». Cependant, de telles corrections peuvent introduire des biais dans l’analyse statistique subséquente.
L’imputation multiple constitue une solution raisonnée à ce problème. Cet atelier a pour but de permettre aux participants de réaliser de l’imputation multiple et de l’évaluer à l’aide du progiciel MICE dans R.

Contenu:

L’atelier est constitué de cinq séances, chacune comportant une présentation suivie d’un exercice pratique sur ordinateur à l’aide du logiciel R :

Séance I : Introduction, problèmes liés aux données manquantes et base d’une approche systématique
Séance II : Introduction à l’imputation multiple
Séance III : Données manquantes multivariées (approche de modèle conjoint, équations enchaînées)
Session IV : L’imputation en pratique (grands jeux de données, données hiérarchiques, non-linéarité, interactions)
Session V : Après l’imputation, lignes directives pour l’analyse et la présentation des résultats

Conditions:

Connaissance de base de R.

Matériaux d'atelier:

Les participants recevront des notes de cours, des exercices pratiques et du code informatique. Les participants doivent apporter leurs portables avec R et le package MICE installés.

Textes de référence recommandés / Bibliographie:

Van Buuren, S. and Groothuis-Oudshoorn, C.G.M. (2011). mice: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45(3), 1--67.
Van Buuren, S. (2012). Flexible Imputation of Missing Data. Chapman & Hall/CRC, Boca Raton, FL. Chapters 1--6, 10.

Langue d'enseignement:

Anglais