Titre : Modélisation statistique en échantillonnage : pistes de solutions en réponse à la demande croissante pour des données fiables
Conférencier : Gauri S. Datta, Université de Georgia et Bureau de recensement des États-Unis
Contexte :
La société moderne démontre un appétit croissant pour les données fiables et à jour en vue de prendre des décisions éclairées, autant dans les secteurs publics que privés. Réalisés une fois tous les dix ans, les recensements permettent de collecter divers renseignements géographiques et démographiques fiables sur la population, mais chaque année subséquente qui s’écoule les rend rapidement désuets. Pour obtenir un portrait actuel de la population à l’étude, les enquêtes par sondage sont fréquemment utilisées par diverses agences pour collecter des données sur une fraction de la population. En raison de contraintes budgétaires, la taille de ces enquêtes est forcément limitée. Bien que l’information recueillie par ces enquêtes puisse être adéquate pour la population entière, ces mêmes échantillons deviennent démesurément petits lorsque les données sont réparties en fonction de sous-populations géographiques et démographiques, aussi appelées petits domaines.
Les sommaires statistiques fondés sur les estimés directs traditionnels, qui dépendent uniquement de données échantillonnales issues de petits domaines individuels, sont généralement très peu fiables. Des méthodologies statistiques utiles et appropriées ont été développées dans le domaine de l’estimation sur petits domaines afin d’améliorer les estimés directs traditionnels. Cette amélioration peut être obtenue en « exploitant les forces » d’autres sources de données. Des méthodes statistiques fiables sont ainsi développées grâce à l’utilisation de modèles appropriés. Cet atelier sur l’estimation sur petits domaines traitera de cette méthodologie et de ses applications à certains problèmes d’inférence importants auxquels font face les agences gouvernementales et le secteur privé.
Contenu de l’atelier :
Cet atelier se fonde sur le livre « Small Area Estimation » de J.N.K. Rao et Isabel Molina (2015, Wiley), et sur de nombreux articles scientifiques écrits par des chercheurs du domaine. Les sujets abordés comprennent une introduction à l’estimation sur petits domaines, des approches basées sur les modèles pour l’estimation sur petits domaines, des modèles au niveau des domaines et au niveau des unités, la meilleure prédiction linéaire empirique non biaisée pour l’estimation ponctuelle et l’estimation correspondante de l’erreur quadratique moyenne, des applications dans R pour l’estimation sur petits domaines, des méthodes hiérarchiques et empiriques bayésiennes pour l’estimation sur petits domaines, ainsi que d’autres applications à l’aide de R.
Ordre du jour :
- Introduction à l’estimation sur petits domaines : estimateurs directs et indirects en estimation sur domaines.
- Modèles à effets mixtes pour l’estimation sur petits domaines : modèles au niveau des domaines et au niveau des unités.
- Meilleure prédiction linéaire empirique non biaisée : estimation ponctuelle et estimation correspondante de l’erreur quadratique moyenne.
- Applications de l’estimation sur petits domaines à l’aide de R.
- Méthodes hiérarchiques et empiriques bayésiennes pour l’estimation sur petits domaines, ainsi que d’autres applications à l’aide de R.