Atelier du Groupe sur les méthodes d’enquête

Méthodes de couplage d’enregistrements : théorie et application


Abdelnasser Saidi, Statistique Canada


Le couplage d’enregistrements est de plus en plus utilisé, et ce, dans plusieurs domaines d’études différents : maintenance électronique des renseignements de registres, santé et épidémiologie, élimination des doublons afin de créer des bases de sondage.


Le couplage d’enregistrements consiste à apparier des enregistrements contenant des renseignements sur des personnes, des entreprises ou des logements lorsqu'on ne dispose pas d'un identificateur unique. Dans ce cadre de travail, les enregistrements sont couplés selon les champs de données communs. Cet atelier de travail s’intéresse plus précisément au couplage d’enregistrements probabiliste fondé sur le modèle théorique de Fellegi-Sunter, où l’on classifie les paires d'enregistrements comme constituant des liens, des non-liens et des liens indéterminés qui seront soumis à une résolution manuelle. Nous présentons en détail les défis associés au traitement des données pour couplage. À Statistique Canada, l’utilisation du couplage probabiliste d’enregistrements est fréquente. Afin d’en faciliter l’utilisation, Statistique Canada a mis au point son propre logiciel de couplage d’enregistrements probabiliste « G-Coup », fondé sur l’algorithme de Fellegi-Sunter. Lors de cet atelier, une revue complète de la méthodologie utilisée sera faite en conjonction avec des exemples concrets bâtis par l’entremise de G-Coup. Finalement, une discussion des plus récentes recherches et innovations en la matière aura lieu.


Abdelnasser Saïdi: Presentation


Abdelnasser Saïdi est méthodologiste principal et dirige le centre de ressource en couplage d’enregistrements à Statistique Canada. Il a travaillé dans différents domaines incluant l’échantillonnage, l’analyse des données d’enquête et le couplage. Il est titulaire d’un PhD en statistiques de l’université de Grenoble (France).