Étude de cas #2 : Risque de malade cardiovasculaire chez les patients souffrant d’arthrose

2019

Data Source: 

Canadian Community Health Survey (CCHS) cycles 1.1, 2.1 and 3.1.

Organizer: 

Dr. Ehsan Karim, School of Population and Public Health, University of British Columbia (UBC)


Remerciements : Tous nos remerciements à François Brisebois (Direction de la méthodologie, Statistique Canada) qui a aidé à organiser l’accès ouvert aux données pour tous les participants. Merci également à Pingzhao Hu (Département de biochimie et de génétique médicale, Université du Manitoba) et à M. Brisebois pour leurs commentaires lors de la préparation de cette étude de cas.

Contexte : L’Enquête sur la santé dans les collectivités canadiennes (ESCC) est une enquête transversale nationale qui vise à recueillir des données sur la santé des Canadiennes et Canadiens âgés d’au moins 12 ans, dans les 10 provinces et 3 territoires, couvrant environ 97 % de la population cible. Dans la présente étude de cas, nous utilisons des Fichiers de microdonnées à grande diffusion (FMGD) des cycles 1.1, 2.1 et 3.1 qui contiennent des données collectées pour les périodes 2000-2001, 2003 et 2005, respectivement. Des mesures ont été prises pour protéger la confidentialité des participants à l’enquête.

Le poids d’échantillonnage indiqué pour l’enquête correspond au nombre d’individus que représente l’individu sondé par rapport à la population. L’inclusion de ces poids garantit une représentation appropriée de la population : ils doivent donc être pris en considération, sinon les estimations statistiques ne seront pas valables. Pour des raisons de confidentialité, les FMGD incluent le poids d’échantillonnage, mais aucune information sur la conception ni le poids bootstrap pour estimer les variances. Le poids d’échantillonnage permet de calculer des estimations ponctuelles correctes, mais en l’absence de poids bootstrap et des informations nécessaires sur la conception, l’hypothèse d’échantillonnage aléatoire simple produira des estimations des mesures de variabilité incorrectes et souvent sous-évaluées.

 

Research Question: 

Cette étude de cas vise à familiariser les participants avec l’analyse de la version FMGD du jeu de données de l’ESCC (données combinées des cycles 1.1, 2.1 et 3.1). À cette fin, ils devront dans un premier temps utiliser ces données FMGD pour créer un « ensemble de données analytique » (qui n’inclura que les variables et enregistrements nécessaires pour analyser tous ces cycles), puis utiliser cet ensemble de données pour estimer des mesures brutes et ajustées de l’association entre l’arthrose et les maladies cardiaques déclarées.

Questions à considérer :

  1. Chez les adultes canadiens (20-64 ans), l’arthrose est-elle associée à la maladie cardiaque? Aux fins de cette étude de cas, vous pourrez assumer que la littérature prouve que les variables suivantes constituent des facteurs de risque pour les résultats et des facteurs de confusion dans la relation susmentionnée : âge, sexe, ethnicité, éducation, revenu du ménage, indice de masse corporelle (IMC), accès à un médecin de famille, tabagisme, consommation d’alcool, hypertension artérielle et diabète. Assumez également que l’activité physique est soupçonnée comme étant un facteur intermédiaire entre l’arthrose et la maladie cardiaque.
  2. La relation entre l’arthrose et la maladie cardiaque varie-t-elle (a) entre les participants vivant dans les régions du Nord et du Sud du Canada, (b) entre les hommes et les femmes, (c) selon l’état matrimonial, ou (d) selon la récence de l’immigration?    
  3. Les résultats changent-ils si l’on impute une valeur manquante (ou réponse invalide) pour le « revenu du ménage »? Quelles suppositions devez-vous formuler pour effectuer une telle analyse?
  4. Avec les informations fournies dans les FMGD, quelle est votre interprétation des résultats de l’analyse? Quelles sont les limites de cette étude? Quelles informations supplémentaires seraient utiles pour arriver à une conclusion plus valable? 

 

Variables: 

Afin de créer un « ensemble de données analytique », il est vivement recommandé de passer en revue la documentation des données correspondantes (dictionnaire de données, index thématique et guide de l’utilisateur associés aux données) pour plus de détails sur les variables suivantes (p. ex., vérifiez « Univers »). Il est souvent judicieux de recouper les variables avec la variable « Âge » (du même cycle) pour vérifier si la question était limitée à certaines tranches d’âge. De même, recoupez avec la variable « Province » pour identifier les variables créées à partir d’un « élément ESCC facultatif ».  Notez que, sauf indication contraire dans la question de recherche, les variables suivantes ne sont pas forcément toutes pertinentes pour la relation étudiée. Par ailleurs, aucune information ne permet de savoir, dans ces données à grande diffusion, si un même individu a été sondé à plusieurs reprises (cycles 1.1, 2.1 et/ou 3.1). Par conséquent, aux fins de cette étude (pour simplifier), nous supposerons que les listes de personnes interrogées pour chaque cycle sont différentes.

 

Noms des variables pour les 3 cycles

 

Concept de variable

CCHS 1.1

CCHS 2.1

CCHS 3.1

Commentaires (voir notes ci-après)

Souffre de maladie cardiaque

CCCA_121

CCCC_121

CCCE_121

Résultat. Seules « Oui » et « Non » sont considérées comme étant des réponses valides. (1)

Souffre d’arthrite ou de rhumatisme

CCCA_051

CCCC_051

CCCE_051

Les réponses « Non » sont considérées comme « SANS OBJET » dans la variable suivante « type d’arthrite ».

Type d’arthrite

CCCA_05A

CCCC_05A

CCCE_05A

Utile pour créer la variable d’exposition. Une réponse « ARTHROSE » crée le groupe exposé et « SANS OBJET » crée le groupe non exposé. (2)

Âge

DHHAGAGE

DHHCGAGE

DHHEGAGE

À recoder en catégories logiques pour les 3 cycles. (3)

Sexe

DHHA_SEX

DHHC_SEX

DHHE_SEX

 

État matrimonial

DHHAGMS

DHHCGMS

DHHEGMS

À recoder en catégories logiques pour les 3 cycles. (1)

Origine culturelle / raciale

SDCAGRAC

SDCCGRAC

SDCEGCGT

(1)

Statut d’immigrant

SDCAFIMM

SDCCFIMM

SDCEFIMM

Les réponses « NON » sont considérées comme « SANS OBJET » dans la variable suivante « Durée de temps au Canada depuis l’immigration ». (4)

Durée de temps au Canada depuis l’immigration

SDCAGRES

SDCCGRES

SDCEGRES

(4)

Plus haut niveau d’éducation - répondant

EDUADR04

EDUCDR04

EDUEDR04

À recoder en catégories logiques pour les 3 cycles. (1)

Revenu total du ménage, de toutes sources

INCAGHH

INCCGHH

INCEGHH

À recoder en catégories logiques pour les 3 cycles. (1)

Indice de masse corporelle

HWTAGBMI

HWTCGBMI

HWTEGBMI

À recoder en 3 catégories : sous-poids (<18,5), poids sain (entre 18,5 et 25), surpoids (>25). (1)

Indice d’activité physique

PACADPAI

PACCDPAI

PACEDPAI

(1)

A un médecin de famille

TWDA_5

HCUC_1AA

HCUE_1AA

(1)

Type de fumeur

SMKADSTY

SMKCDSTY

SMKEDSTY

À recoder en catégories logiques pour les 3 cycles. (1)

Type de consommateur d’alcool

ALCADTYP

ALCCDTYP

ALCEDTYP

À recoder en catégories logiques pour les 3 cycles. (1)

Souffre d’hypertension artérielle

CCCA_071

CCCC_071

CCCE_071

(1)

Souffre de diabète

CCCA_101

CCCC_101

CCCE_101

(1)

Souffre d’emphysème ou de maladie pulmonaire obstructive chronique (MPOD)

CCCA_91B

CCCC_91B

CCCE_91F

(1)

Consommation quotidienne – total de fruits et légumes

FVCADTOT

FVCCDTOT

FVCEDTOT

À recoder en 3 catégories : 0-3, 4-6 et 6+ portions quotidiennes. (1)

Niveau perçu de stress

GENA_07

GENC_07

GENE_07

À recoder en catégories logiques pour les 3 cycles. (1)

Province

GEOAGPRV

GEOCGPRV

GEOEGPRV

Recoder Territoires du Nord-Ouest,
Nunavut et Yukon comme « Nord » et les autres provinces/territoires comme « Sud ». (1)

Poids d’échantillonnage – étalon

WTSAM

WTSC_M

WTSE_M

À diviser par 3 pour obtenir un échantillon représentatif sur le plan national (en moyenne).

 

Notes:

  1. Sauf indication contraire, les réponses suivantes sont considérées invalides et peuvent donc être considérées comme valeurs manquantes : « SANS OBJET », « NE SAIT PAS », « REFUS » ET « NON SPÉCIFIÉ » (« NOT APPLICABLE », « DON'T KNOW », « REFUSAL », « NOT STATED »). Pour une analyse de cas complète, tous ces enregistrements peuvent être exclus de l’étude.
  2. Les réponses « POLYARTHRITE RHUMATOÏDE » et « AUTRE » (« RHEUMATOID ARTHRITIS » et « OTHER ») seront exclues de l’étude.
  3. Conformément aux critères d’éligibilité pour l’étude, cette dernière sera limitée aux participants âgés de 20 à 64 ans.
  4. Utile pour créer le statut d’immigration (catégories potentielles : « non immigrant », « immigrant récent », « immigré depuis plus de 10 ans »)

Data Access: 

Données et fichiers de documentation :  https://www.dropbox.com/sh/dntqkl6wv54ypop/AACPOf6pnGh4sgithHJRQyYYa?dl=1.


Les fichiers compressés (dans le téléchargement) contiennent les fichiers de données publics originaux non édités de Statistique Canada. Les fichiers de données sont également fournis au format RData (convertis à partir des jeux de données d’origine), utilisables sous R. Notez que seul le format des données est modifié, non le contenu ni les documentations correspondantes. Ces fichiers de données devraient être identiques à ceux accessibles via les universités membres de l’Initiative de démocratisation des données. Vous trouverez les documentations associées (dictionnaire de données, index thématique et guide de l’utilisateur associés aux données) et les contrats de licence dans les dossiers « Documentation » contenus dans les fichiers compressés. Enfin, notez que l’utilisation de ces fichiers doit respecter les modalités et conditions de la Licence ouverte de Statistique Canada Open Licence (lien : https://www.statcan.gc.ca/fra/reference/licence). Veuillez consulter les contrats de licence fournis ici avant de les télécharger.


Nombre d’enregistrements et de variables :  

 

CCHS 1.1

CCHS 2.1

CCHS 3.1

Nombre d'enregistrements

130,880

134,072

132,221

Nombre de variables

614

1,068

1,284

Problèmes d’accès aux données : Pour tout problème concernant l’accès aux données, la documentation ou les contrats de licence, veuillez envoyer un courrier à ehsan.karim@ubc.ca (référence « Étude de cas SSC2019 »).