Fusion de données, méta-analyse en réseau et inférence causale


Fusion de données, méta-analyse en réseau et inférence causale
Président: Mireille E. Schnitzer and Russell Steele
Responsable: Mireille E. Schnitzer
Commanditaires: Groupe de biostatistique


[mercredi le 14 juin, 2017 10h20-11h50]
 

10h20-10h42 
Elias Bareinboim (Purdue University) 
Inférence causale à partir de données volumineuses : les fondements théoriques et le problème de la fusion des données​ 


Dans cet article, nous résumons quelques résultats récents dans le domaine de l’inférence causale qui concernent les données volumineuses. Nous adressons le problème de fusion de données – nous regroupons plusieurs ensembles de données recueillies dans des conditions hétérogènes (populations, régimes et méthodes d’échantillonnage différents) dans le but d’obtenir des réponses valides à nos questions d’intérêt. La disponibilité des ensembles de données hétérogènes offre de nouvelles opportunités aux analystes de données volumineuses étant donné que les connaissances qui peuvent être acquises à partir de données combinées ne seraient pas disponibles à partir d’une source individuelle. Par contre, les biais qui émergent dans des environnements hétérogènes nécessitent de nouveaux outils analytiques. Certains de ces biais, dont la confusion, la sélection d’échantillons et les biais inter-populations, ont été adressés de manière isolée, en grande partie dans des modèles paramétriques restreints. Nous présentons ici un cadre général et non paramétrique pour traiter ces biais et, ultimement, une solution théorique au problème de la fusion de données dans les travaux d’inférence causale.


10h42-11h04 
Russell Steele (McGill University), Mireille E. Schnitzer (Université de Montréal), Ian Shrier (Lady Davis Institute, Jewish General Hospital, Montreal and McGill University) 
Détruire le mythe de la détérioration la randomisation : un examen causal de la méta-analyse à volets

Pour l’analyse des essais aléatoires à volets multiples, les méthodes de regroupement des données provenant de divers essais appartiennent à l’une de deux grandes catégories. La première fait appel à des estimateurs fondés sur les contrastes qui évaluent les contrastes de l’effet d’un traitement pour chaque paire de niveaux de traitement et regroupent ensuite les contrastes estimés. La seconde englobe des méthodes à volets qui comparent les estimations marginales pour chaque volet d’un traitement. Des chercheurs émérites ont pourfendu les méthodes à volets, critiquant surtout la « détérioration de la randomisation », sous-entendant une estimation biaisée des effets de causalité d’un traitement. Personne n’a cependant donné une définition causale formelle de cette même « détérioration de la randomisation », ni effectué d’examen critique de la quantité de biais qui en découlerait. Cette allocution porte sur la caractérisation des conditions sous lesquelles le biais des méthodes à volets s’appliquerait aux effets de causalité sur une population donnée et également sur les avantages à l’égard de la précision de celles-ci, comparativement à celles fondées sur les contrastes.


11h04-11h26 
Qinshu Lian (University of Minnesota-Twin Cities), Haitao Chu (University of MinnesotaTwin cities) 
Modèle bayésien de résumé hiérarchique ROC pour la méta-analyse en réseau de tests diagnostiques

L’évaluation de l’exactitude des tests diagnostiques fait appel couramment à trois plans d’étude: (1) plan croisé; (2) plan d’expérience aléatoire; et (3) étude non comparative. Les méthodes actuelles de méta-analyse des tests diagnostiques sont appliquées à des cas simples, lorsque le test de référence dans l’ensemble ou aucune des études peut être vu comme le test-étalon d’or et que toutes les études font appel soit au plan d’expérience aléatoire, soit à l’étude non comparative. Pourtant, la prolifération d’instruments diagnostiques et la diversité des plans d’étude utilisés ont stimulé la demande pour l’élaboration de méthodes plus générales. Nous étendons le modèle bayésien du résumé hiérarchique ROC à une méta-analyse en réseau de tests diagnostiques pour une comparaison simultanée de tests multiples dans un cadre de données manquantes. Notre modèle prend compte des corrélations potentielles entre les tests multiples dans le cadre de l’étude et de leur hétérogénéité dans l’ensemble des études. Il permet également que diverses études fassent appel à différents sous-ensembles de tests diagnostiques. Notre modèle est évalué à l’aide de simulations et illustré par des données réelles tirées de tests pour la thrombose veineuse profonde.


11h26-11h50 
Christopher Schmid (Brown University), Youdan Wang (Brown University)
Modèles hiérarchiques pour combiner des essais individuels (N-de-1)


Les essais individuels (N-de-1) sont des études à croisements multiples avec un seul patient afin de déterminer l’efficacité relative d’un traitement pour un patient donné. Des essais N-de-1 évaluant la même question scientifique peuvent être combinés pour en tirer des inférences sur l’efficacité moyenne d’un traitement et également un renforcement de données empruntées dans l’ensemble de la série pour tirer de meilleures inférences au sujet des patients. Une série comportant plus de deux traitements permettra un modèle de réseau qui peut simultanément évaluer et comparer les différents traitements. Ce sont des modèles complexes, car chaque essai fournit des données sous forme de série temporelle avec des traitements changeants. Par conséquent, les données sont fortement corrélées et potentiellement contaminées par un report. Nous nous sommes servis des données d’une série de 100 essais N-de-1 aux fins d’une étude en cours visant à évaluer divers traitements de la douleur chronique afin d’illustrer divers modèles pouvant être utilisés pour représenter des données de cet ordre.