Modélisation statistique dans les études sur l'environnement et la santé

 


Modélisation statistique dans les études sur l'environnement et la santé
Président: Tim Swartz (Simon Fraser University)
Responsable: Paramjit Gill (British Columbia-Okanogan)


CINDY FENG & MEHDI ROSTAMIFOROOSHANI (University of Saskatchewan)
[Monday May 30 / lundi 30 mai, 13:30]
Modélisation de données de survie spatialement corrélées: impact des erreurs de spécification d'une structure de corrélation sur les estimations de paramètres

Dans les études épidémiologiques et environnementales, les données de durée avant événement sont souvent regroupées en grappes (par exemple les familles, les sites cliniques et les régions géographiques, etc.). Les modèles de survie spatiaux ont été présentés dans la littérature pour modeler des données de survie corrélées géographiquement, ce qui inclut une fonction du risque de base flexible spatialement variable pour contrôler les facteurs de confusion spatiaux non mesurés et pour emprunter de l'information à travers les unités géographiques. Le schéma spatial identifié peut souligner les régions qui requièrent de l'attention, ce qui peut aider les professionnels de la santé dans le processus de prise de décision. Peu d'études ayant été menées pour étudier la conséquence d'ignorer la modélisation de la corrélation spatiale sur les estimations de paramètres, nous avons décidé de mener une étude de simulation pour déterminer le changement dans le biais et dans l'efficacité des estimations de paramètres lorsque la structure de corrélation est mal spécifiée. 


RENJUN MA (University of New Brunswick)
[Monday May 30 / lundi 30 mai, 14:00]
Modèles mixtes pour données environnementales/de santé corrélées avec censure à gauche et asymétrie à droite


Les données environnementales et de santé sont souvent sujettes à une censure à gauche à la limite de détection. Ces données censurées sont généralement asymétriques à droite et continues, mais avec une masse ponctuelle à la limite de détection. C'est le cas par exemple pour les polluants de l'eau dans les poissons, la taille d'une tumeur après traitements radioactifs, la profondeur de la lésion en fonction des ultrasons et des précipitations. Cas spécial de ces données : les données dites semi-continues à surreprésentation de zéros où une quantité négligeable est ignorée. Dans cette présentation, nous proposons des modèles mixtes de Poisson composés pour caractériser simultanément l'occurrence de la limite de détection et l'importance des données corrélées. Nous illustrons notre approche par des applications sur des données réelles.
 

GYANENDRA POKHAREL & ROB DEARDON (University of Calgary)
[Monday May 30 / lundi 30 mai, 14:30]
Inférence basée sur un émulateur à processus gaussien pour les modèles spatiaux de systèmes de maladies infectieuses


L'inférence statistique pour les modèles mécanistes de la propagation de maladies infectieuses est souvent très coûteuse en ressources informatiques. Ces modèles sont généralement ajustés dans un cadre de Monte-Carlo par chaîne de Markov (MCMC) bayésien qui exige des calculs multiples de la fonction de vraisemblance, ce qui est souvent inefficace d'un point de vue computationnel. Ce problème ne fait que s'aggraver en la présence de grands nombres de variables latentes. Ici, nous proposons une méthode d'inférence basée sur des techniques dites d'émulation. Cette méthode s'inscrit aussi dans un contexte de MCMC bayésien, mais elle évite le calcul de la fonction de vraisemblance, si coûteux en ressources, et le remplace par une approximation par processus gaussien. Nous montrons qu'une telle méthode offre un gain computationnel significatif et qu'elle permet d'inférer les paramètres du modèle et les caractérstiques sous-jacentes des systèmes spatiaux de la maladie.