Aller au contenu principal

Score de propension haute dimension et extensions en apprentissage automatique au contrôle de la confusion résiduelle

L’utilisation d’ensembles de données sur les demandes de remboursement de soins de santé fait souvent l’objet de critiques en raison des problèmes omniprésents de variables omises et d’inexactitudes ou d’erreurs de mesure dans les facteurs de confusion disponibles. Les effets d’un traitement estimés à l’aide de ces sources de données peuvent effectivement souffrir de confusion résiduelle. Les dossiers administratifs électroniques contiennent souvent un grand volume d’informations relatives à la santé, dont beaucoup ne sont pas prises en compte dans les études pharmaco-épidémiologiques conventionnelles. Un algorithme de score de propension haute dimension (hdPS) a été proposé, qui utilise ces informations comme substituts pour les facteurs de confusion mal mesurés et non observés, dans le but de réduire le biais de confusion résiduelle. Depuis lors, de nombreuses extensions semi-paramétriques et en apprentissage automatique de cet algorithme ont été proposées pour mieux exploiter la richesse des informations de substitution en haute dimension. Dans ce tutoriel, nous allons (i) démontrer la logique, les étapes et les directives de mise en œuvre de la méthode hdPS en exploitant une source de données ouverte comme exemple (avec des codes R reproductibles), (ii) familiariser les lecteurs avec la différence clé entre le score de propension et la méthode hdPS, ainsi que les analyses de sensibilité requises, (iii) expliquer la raison d’être de l’utilisation des extensions en apprentissage automatique doublement robustes de la méthode hdPS, et (iv) discuter des avantages, des controverses et des directives de déclaration de la méthode hdPS lors de la rédaction d’un manuscrit.

DOI: https://doi.org/10.1080/00031305.2024.2368794

Presenter(s)
M. Ehsan Karim
University of British Columbia
Date and Time
-