2016-Analyse, modélisation et tests pour des données de séquençage génomique

 


Analyse, modélisation et tests pour des données de séquençage génomique 
Responsable et président: Brad McNeney (Simon Fraser University) 
[PDF]

ALI KARIMNEZHAD, University of Ottawa
Test d'hypothèses multiples bayésien robuste avec applications aux données d'association génétiques [PDF]
 
Un objectif important de la terminologie des tests d'hypothèses simultanés est le contrôle des fausses découvertes. Dans la plupart des études, le taux de fausses découvertes locales (LFDR) est estimé à partir d'une analyse combinée dans laquelle toutes les caractéristiques présentées sont combinées pour être analysées conjointement. Cependant, la nature des données suggère parfois une analyse séparée où seules les caractéristiques avec une même propriété en commun sont analysées conjointement.

Procéder aux analyses séparées et combinées peut conduire à deux décisions différentes ce qui amène une incertitude dans la prise d'une décision unique. Pour surmonter ce type d'incertitude, nous présentons des approches novatrices dont des approches robustes bayésiennes et théoriques de l'information. Nous analysons un ensemble de données d'association génétiques pour illustrer l'utilité pratique des méthodes proposées. 
 

DAVID A. STEPHENS, McGill University
Modèles de Markov cachés pour l'identification des régions différentiellement méthylées  [PDF]
 
Nous développons des modèles de Markov cachés spécialisés (HMMs) pour traiter du problème de la détection des régions différentiellement méthylées. Ces régions sont potentiellement importantes pour expliquer les différences phénotypiques. Les outils HMM ont rarement été utilisés pour l'analyse de données de méthylation, et notre nouveau modèle tente d'aborder les questions de corruption de données et les différentes sources de variabilité que les profils de méthylation possèdent habituellement. Par contre, ce défi computationnel est vaste et différentes stratégies fondées sur le EM, l'optimisation directe et MCMC sont étudiées. Un ensemble de données test impliquant la région génétique BLK, différents types de cellules, est étudié. 
 
ELENA SZEFER, Simon Fraser University & The EMMES Corporation
Une application d'imagerie génomique multivariée dans les cas de la maladie d'Alzheimer  [PDF]
 
Les variantes génétiques et les anomalies de certaines régions du cerveau sont toutes deux reconnues comme jouant un rôle dans le déclin cognitif. Nous explorons la relation entre la variation pangénomique et les taux de décroissance dans la structure cérébrale en utilisant des données de l'initiative en neuroimagerie de la maladie d'Alzheimer (ADNI). La haute dimensionnalité des données génomiques convient aux méthodes régularisées et nous utilisons des méthodes régularisées multivariées pour estimer les rares relations entre les dizaines de milliers de SNPs et les douzaines de phénotypes d'imageries cérébrales. Parce que la sélection de variables est difficile dans ce cadre à grandes dimensions, des techniques de rééchantillonnage sont incorporées pour estimer l'importance de chaque SNP dans notre échantillon. Nous poursuivons aussi la validation de nos résultats en utilisant des données de la deuxième phase de l'étude ADNI.