Mécanismes de confidentialité différentielle globale dans le cadre d’une synthèse bayésienne des données

Nous examinons, proposons et comparons plusieurs synthétiseurs de données bayésiens avec différentes garanties différentielles de confidentialité qui peuvent être utilisées par les gestionnaires de données pour la diffusion de microdonnées avec protection de la confidentialité. Le mécanisme pseudo-postérieur offre une garantie différentielle asymptotique de protection de la confidentialité et une variante de ce mécanisme permet une convergence plus rapide. Le mécanisme de censure nouvellement proposé, intégré au mécanisme pseudo-postérieur, censure la pseudo-vraisemblance de chaque enregistrement dans la plage [exp(-epsilon/2), exp(epsilon/2)], ce qui permet d’obtenir une garantie différentielle de confidentialité non asymptotique plus forte. Grâce à une série d’études de simulation avec des données univariées bornées et à une application à un échantillon de l’enquête sur les titulaires de doctorat dans laquelle un synthétiseur de régression bêta est utilisé, nous démontrons que le mécanisme pseudo postérieur crée des données synthétiques de la plus grande utilité au prix d’une garantie de confidentialité asymptotique plus faible, tandis que le mécanisme de censure intégré dans le mécanisme pseudo postérieur produit des données synthétiques avec une garantie de confidentialité non asymptotique plus forte au prix d’une légère réduction de l’utilité. Nous incluons l’histogramme perturbé à des fins de comparaison.

Date and Time: 

Mercredi, 5 juin, 2024 - 10:50 - 11:20

Additional Authors and Speakers: 

Terrance Savitsky
U.S. Bureau of Labor Statistics
Matthew Williams
RTI International

Langue de la présentation: 

English / Anglais

Langue des supports visuels: 

English / Anglais

Type de présentation: 

Présentation orale

Session: 

Orateur

Prénom Second prénom Nom de famille Affiliation primaire
Jingchen (Monika) Hu Vassar College