Aller au contenu principal
Deep Neural Networks for Doubly Robust Estimation with Nonprobability Survey Samples
The integration of probability and non-probability samples is an emerging research area in survey sampling. However, nonprobability samples often lack population representativeness, making it challenging to infer finite population characteristics. Traditional inverse propensity score weighting methods, typically reliant on parametric models, fail to capture the complex nonlinear relationships between auxiliary variables and participation rates. To address this, we propose a Deep Neural Network (DNN) model to estimate the propensity score, the weight parameters are optimized via the ADAM algorithm, enabling accurate propensity score estimation for non-probability sample units. Using the DNN estimated propensity score, we construct a doubly robust estimator for the finite population mean. Simulation studies and empirical analyses demonstrate that our method outperforms traditional parametric models and provide a more reliable tool for statistical inference in complex survey settings.
Réseaux neuronaux profonds pour une estimation doublement robuste avec des échantillons d'enquêtes non probabilistes
L'intégration d'échantillons probabilistes et non probabilistes est un domaine de recherche émergent dans le domaine de l'échantillonnage. Cependant, les échantillons non probabilistes ne représentent pas toujours adéquatement la population, ce qui rend difficile l'inférence sur des caractéristiques de la population finie. Les méthodes traditionnelles de pondération par l'inverse du score de propension, qui s'appuient généralement sur des modèles paramétriques, ne parviennent pas à saisir les relations non linéaires complexes entre variables auxiliaires et taux de participation. Pour y remédier, nous proposons un modèle de réseau neuronal profond (RNP) pour estimer le score de propension; les paramètres de pondération sont optimisés via l'algorithme ADAM, ce qui permet une estimation précise du score de propension pour les unités d'échantillonnage non probabilistes. En utilisant le score de propension estimé par le RNP, nous construisons un estimateur doublement robuste pour la moyenne de la population finie. Des études de simulation et des analyses empiriques démontrent que notre méthode surpasse les modèles paramétriques traditionnels et fournit un outil plus fiable pour l'inférence statistique dans des contextes d'enquête complexes.
Date and Time
-
Co-auteurs (non y compris vous-même)
Xuewen Lu
University of Calgary
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
yufang Dai University of Calgary