Atelier du Groupe des méthodes d’enquête

Confidentialité des données statistiques

Dans cet atelier, nous découvrirons la science de la collecte, de l’analyse et du partage de données confidentielles sans divulguer de renseignements personnels. Nous commencerons par un aperçu des objectifs et approches de ce vaste domaine d’étude, en établissant des liens avec les travaux de la communauté des informaticiens, souvent publiés sous une terminologie différente. Nous exploreronss ensuite une approche spécifique connue sous le nom de protection différentielle de la vie privée, qui fait l’objet de nombreuses recherches et est utilisée en pratique par certains organismes statistiques et entreprises privées. Nous expliquerons l’origine de cette mesure de confidentialité formelle, examinerons en détail sa définition mathématique et sa signification, puis montrerons comment la mettre en œuvre pour des tâches simples. Le reste de l’atelier se concentrera sur l’utilisation d’ensembles de données synthétiques à des fins de protection de la vie privée, en examinant comment générer de tels jeux de données et évaluer leur qualité en termes de risque et d’utilité. Nous illustrerons le contenu par du code R et réserverons une partie du temps pour laisser les participants expérimenter les méthodes sur des ensembles de données réels.

Aperçu :

1. Confidentialité des données statistiques
2. Protection différentielle de la vie privée
3. Création d’ensembles de données synthétiques
4. Évaluation et utilisation d’ensembles de données synthétiques

 

Date et l'heure: 

Dimanche, 2 juin, 2024 - 09:00 - 16:00

Room: 

HH 3017

Présentateurs/Conférenciers: 

Anne-Sophie Charest
Université Laval