Adaptive Confidence Sets for Sobolev Regular Densities Under Local Differential Privacy
Local differential privacy (LDP) is now the tool of choice in the statistics community for protecting individual data without relying on a central, trusted curator. In the density estimation model under non-interactive LDP, we investigate the problem of constructing adaptive honest confidence sets with radius measured in $L^2$-distance for one-dimensional densities with unknown Sobolev regularity. We identify necessary and sufficient conditions for the existence of such adaptive confidence sets. Interestingly, the possibility of adaptation depends on the privacy level $\alpha$. For small privacy levels, the conditions are the same as in the non-private setting. However, for medium to high privacy levels, which are closer to those prescribed in practice, we show that a strictly stronger condition is required. For configurations allowing these adaptive sets to exist, we explicitly construct confidence regions via the method of risk estimation, carefully adapted to the LDP framework.
Ensembles de confiance adaptatifs pour les densités régulières de Sobolev sous confidentialité différentielle locale
La confidentialité différentielle locale (CDL) s'impose aujourd'hui comme l’approche privilégiée par les statisticiens pour protéger les données individuelles sans recourir à un tiers de confiance. Dans le problème d'estimation de densité sous contrainte de CDL non interactive, nous étudions l’existence et la construction d’ensembles de confiance honnêtes et adaptatifs, dont la taille est mesurée en distance $L^2$, pour des densités univariées de régularité de Sobolev inconnue. Nous établissons les conditions nécessaires et suffisantes à l'existence de tels ensembles. Il est alors intéressant de noter que la possibilité d'une telle adaptation dépend fortement du niveau de confidentialité $\alpha$. Pour des protocoles peu confidentiels, nous retrouvons les mêmes conditions que dans le cas non privé. En revanche, pour des niveaux de confidentialité modérés à élevés, qui correspondent aux standards recommandés en pratique, nous démontrons qu'une condition strictement plus forte est requise. Lorsque ces conditions sont réunies, nous proposons une construction explicite de ces régions de confiance via la méthode d'estimation du risque, spécifiquement adaptée au cadre de la CDL.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English