Aller au contenu principal

Méthodes de contrôle de la divulgation

Les organismes de la statistique cherchent à publier des données statistiques utiles, mais risquent par le fait même de divulguer des données privées. Cet enjeu constitue un problème qui force à faire un compromis entre l’utilité des données publiées et la protection de la vie privée. Le contrôle de la divulgation peut être perçu comme l’utilisation de méthodes qui gèrent ce problème en évaluant et en contrôlant le risque de divulgation de données confidentielles, tout en fournissant aux chercheurs des données statistiques utiles.

Cet atelier a pour but de présenter un aperçu des méthodes de contrôle de la divulgation lors de la publication de données tabulaires. Des méthodes d’évaluation du risque par cellule seront abordées. Celles-ci comprennent les règles classiques de sensibilité des cellules comme les règles de nk et pq, les règles généralisées de sensibilité des cellules utilisant le cadre de « seuil de précision et de bruit » (Precision Threshold and Noise (PTN) framework), ainsi que les méthodes pour identifier des agrégats sensibles de cellules. Il sera aussi question de méthodes de contrôle du risque de divulgation, y compris la suppression de cellules et l’utilisation d’un ajustement tabulaire aléatoire. Enfin, un cadre de contrôle de la divulgation faisant appel à la théorie de la décision bayésienne sera aussi présenté.


Aucun portables ne sont pas requis pour l'atelier.