Skip to main content
Modeling Microbiome Data: A Zero-Inflated Factor Analysis Approach with Skew-Normal Priors
Advancements on next generation sequencing have transformed our understanding of host-microbe interactions, revealing links between microbial composition and chronic conditions such as obesity, diabetes, IBD, etc. However, analyzing microbiome data presents challenges due to high dimensionality, sparsity, overdispersion, and compositional nature. Existing models, such as ZIPPCA-LNM and ZIPPCA-LPNM offers a rigorous probabilistic framework for composition estimation. However, capturing the high skewness inherent in microbiome data remains a challenge. To address these issues, we propose a novel Zero-Inflated Factor Analysis Skew Normal (ZIFA-SN) model, incorporating a skew-normal distribution as a prior for latent factors, effectively capturing data asymmetry. We employ a Mean-Field Variational Bayes approach to approximate the intractable posterior, offering a computationally efficient alternative to traditional MCMC methods.
Modélisation des données du microbiome : une approche d'analyse factorielle avec excès de zéros avec des amorces normales asymétriques
Les progrès du séquençage de nouvelle génération ont transformé notre compréhension des interactions hôte-microbe, révélant des liens entre la composition microbienne et des maladies chroniques telles que l'obésité, le diabète, les maladies inflammatoires de l'intestin, etc. Cependant, l'analyse des données du microbiome présente des difficultés en raison de leur haute dimensionnalité, de leur éparsité, de leur surdispersion et de leur nature compositionnelle. Les modèles existants, tels que ZIPPCA-LNM et ZIPPCA-LPNM, offrent un cadre probabiliste rigoureux pour l'estimation de la composition. Cependant, la prise en compte de la forte asymétrie inhérente aux données du microbiome reste un défi. Pour résoudre ces problèmes, nous proposons un nouveau modèle "Zero-Inflated Factor Analysis Skew Normal" (ZIFA-SN), qui incorpore une distribution normale asymétrique comme a priori pour les facteurs latents, ce qui permet de capturer efficacement l'asymétrie des données. Nous employons une approche de type Bayes variationnelle à champ moyen pour approximer la distribution a posteriori irréductible, offrant une alternative efficace en termes de calcul aux méthodes MCMC traditionnelles.
Date and Time
-
Additional Authors and Speakers (not including you)
Kevin McGregor
University of Manitoba
Dr. Hanna Jankowski
York University
Language of Oral Presentation
English
Language of Visual Aids
English

Speaker

Edit Name Primary Affiliation
Saurabh Panchasara York University