Skip to main content
Double Machine Learning for the Treatment of Nonresponse in Survey Sampling
Predictive models are increasingly used in survey sampling for various tasks. While modern machine learning methods offer flexibility, their use creates serious challenges for valid inference, especially for variance estimation with black-box methods. I will show that naively plugging machine learning predictions into classical survey estimators can lead to invalid inference, particularly under nonparametric regression. I will then present an extension of the Double Machine Learning framework with cross-fitting to survey sampling, enabling valid inference with arbitrary black-box methods. Under realistic rate conditions, the resulting estimators are square-root-n consistent and asymptotically normal. Finally, I will propose a consistent variance estimators to allow for asymptotically valid confidence intervals.
Double apprentissage automatique pour le traitement de la non-réponse en sondage
Les modèles prédictifs sont de plus en plus utilisés en sondage pour diverses tâches. Si les méthodes modernes d’apprentissage automatique offrent une grande flexibilité, leur utilisation pose des défis majeurs pour une inférence valide, en particulier pour l’estimation de la variance avec des méthodes de type « boîte noire ». Je montrerai que l’insertion naïve de prédictions issues de l’apprentissage automatique dans des estimateurs classiques de sondage peut conduire à une inférence invalide, en particulier en présence de régression non paramétrique. Je présenterai ensuite une extension du cadre de l’apprentissage automatique double, avec validation croisée, au contexte de l’échantillonnage d’enquête, permettant une inférence valide avec des méthodes de machine learning arbitraires. Sous des conditions de vitesses de convergence réalistes, les estimateurs obtenus sont des racines de n consistants et asymptotiquement normaux. Enfin, je proposerai des estimateurs de variance consistants permettant la construction d’intervalles de confiance asymptotiquement valides.
Date and Time
-
Additional Authors and Speakers (not including you)
Haziza David
University of Ottawa
Language of Oral Presentation
English
Language of Visual Aids
English

Speaker

Edit Name Primary Affiliation
Mehdi Dagdoug McGill University