Le site Google Flu Trends peut-il prédire la fréquence et le résultat des tests pour la grippe et autres maladies respiratoires ?

2016

Date Source: 

Google Flu Trends (GTF)

Organizer: 

Dena Schanzer, Public Health Agency of Canada

Aperçu

Pour cette étude de cas, vous allez explorer les tendances dans les tests pour la grippe et autres maladies respiratoires au Canada. Vous allez aussi évaluer l’utilité de l’outil de recherche de données Google pour prédire ces tendances.

Source de données 

Ces données proviennent du programme de surveillance de la grippe de l’Agence de la santé publique du Canada a et de Google Flu Trends (GTF).


Le programme de surveillance de la grippe est un programme national canadien qui surveille en continu la dispersion de la grippe et autre maladie similaire. Les données du programme de détection de virus des voies respiratoires au Canada (DVVR) proviennent de laboratoires sélectionnés à travers le Canada et le Québec sur le nombre de tests faits et le nombre de tests positifs pour la grippe et autres virus des voies respiratoires. Des rapports hebdomadaires sont produits. À ce moment, les laboratoires transmettent les résultats pour la grippe, le virus respiratoire syncytial (RSV), le paramyxovirus, l’adénovirus, le métapneumovirus humain (hMPV), le rhinovirus et le coronavirus. D’autres résultats sont transmis par type de virus ou de par sous-type. Plusieurs de ces virus détectés tout au cours de l’année, mais il y a des variations saisonnières. Le rhinovirus, le paramyxovirus et l’adénovirus comptent pour la grande majorité des infections virales détectées durant l’été tandis que la grippe et le RSV sont majoritaires du point de vue annuel. La grippe est le virus respiratoire le plus souvent détecté parmi les adultes hospitalisés. RSV est principalement relié à la bronchiolite et il est le virus respiratoire le plus souvent détecté chez les enfants hospitalisés. Comme toutes les épidémies, l’activité grippale maximale se produit à différents moments d’une année à l’autre, quoique l’activité maximale soit toujours en hiver. Les étapes d’une épidémie sont :

  • une phase de pré-épidémie durant laquelle le nombre d’infections est petit et la souche en circulation peut disparaître sans produire une épidémie;
  • une période de croissance exponentielle suivie par la période d’activité maximale;
  • et finalement une période où l’épidémie est en déclin.

En 2009, les données concernant la pandémie de grippe H1N1 ont été incluses dans les valeurs de FluApos. Les premiers cas canadiens de la pandémie furent confirmés dans la dernière semaine d’avril 2009 et le dépistage des patients atteints d’infections respiratoires s’est accru significativement durant le printemps. Le virus (H1N1) ayant causé la pandémie de 2009, appelée originellement « grippe porcine », provenait du Mexique et il a été détecté pour la première dans la ville de Mexico le 18 mars 2009. Un graphique des données virologiques canadiennes montre deux vagues de pandémie distinctes (printemps et automne) avec des activités maximales dans les semaines du 7 juin et 1er novembre 2009. Vous voudrez peut-être enlever les données correspondant à la vague printanière lorsque vous voudrez prédire la date de l’activité maximale. À l’exception des périodes de pandémie, la saison grippale va de septembre à août l’année suivante. Par conséquent, une épidémie ne suit pas l’année civile. Plus d’information sur le programme de surveillance de la grippe, vous pouvez consulter le site web du gouvernement du Canada.


Google donne plusieurs jeux de données via son portail de données publiques. Le site GFT fut inauguré en 2008 afin d’explorer l’utilisation potentielle des moteurs de recherche pour surveiller la propagation des maladies infectieuses, incluant la grippe. Même si Google ne publie plus des estimations à jour pour GFT sur leur portail de données public, il permet aux groupes de recherche d’utiliser leurs données.


Les données du programme de surveillance de la grippe couvrent la période du 7 septembre 2003 au 23 août 2015 tandis que les données de GFT couvrent la période du 28 septembre 2003 au 9 août 2015. Les données incluent :

  • Surveillance de la grippe : fréquences hebdomadaires des tests des laboratoires virologiques et des résultats positifs pour le Canada et quelques provinces (Ontario, Québec, Colombie britannique et l’Alberta). Remarquez que seulement une petite proportion des cas suspects est testée chaque semaine. Cette proportion varie en fonction des politiques de santé publique de chaque province et elle ne reflète pas nécessairement la taille de la population de celle-ci.
  • GFT : données hebdomadaires pour l’ensemble du Canada et chacune des provinces (à l’exception de l’Île-du-Prince-Édouard).
     

Research Question: 

  • Est-ce que les tendances saisonnières dans les données de GFT sont plus associées avec le nombre d’infections grippales (c’est-à-dire le nombre de tests positifs) ou le nombre total de tests? Est-ce que GFT devance ou est en retard sur le nombre de tests positifs ?
  • Est-ce que les tendances saisonnières dans les données de GFT sont plus associées avec le nombre de tests ou le nombre de tests positifs pour les autres virus des voies respiratoires.
  • Combien de semaines à l’avance pouvez-vous prédire l’activité maximale pour le nombre de tests positifs de la grippe ? Est-ce que les données de GFT aident à prédire l’activité maximale ?
     

Variables: 


Dictionnaire des données de la surveillance de la grippe
 

Variable
Description
Date
Date du test, basé sur le premier jour de la semaine
FluApos
Nombre de tests positifs pour la grippe de type A
FluBpos
Nombre de tests positifs pour la grippe de type B
FluPos
Nombre de tests positifs pour les grippes de type A et B
FluTest
Fréquence des tests pour la grippe de type A et B
RSVtest
Nombre de tests pour le virus respiratoire syncytial (RSV)
RSVpos
Nombre de tests positifs pour le virus respiratoire syncytial (RSV)
adenot
Nombre de tests pour l’adénovirus
adeno
Nombre de tests positifs pour l’adénovirus
parat
Nombre de tests pour le paramyxovirus
para
Nombre de tests positifs pour le paramyxovirus
Rhinot
Nombre de tests pour le rhinovirus
Rhino
Nombre de tests positifs pour le rhinovirus
hMPVt
Nombre de tests pour le métapneumovirus humain (hMPV)
hMPV
Nombre de tests positifs pour le métapneumovirus humain (hMPV)
Coronat
Nombre de tests pour le coronavirus
Corona
Nombre de tests positifs pour le coronavirus

Data Files: