Aller au contenu principal
Clustering longitudinal microbiome trajectories using a mixture of logistic matrix-normal multinomial distributions
The human microbiome plays a crucial role in health and disease. Clustering microbiome data can uncover meaningful patterns across samples, offering insights into biological variability and disease mechanisms. Microbiome data are typically high-dimensional, over-dispersed, and compositional, which complicates modelling. We propose a model-based clustering framework for longitudinal microbiome data using a mixture of logistic matrix-normal multinomial distributions, which jointly accounts for compositional structure and temporal dependence. Although this distribution provides greater flexibility in capturing complex correlations, it is computationally intensive. To overcome these limitations, we have developed a computationally efficient framework for parameter estimation using variational Gaussian approximations. The proposed approach is illustrated using both simulated and real datasets.
Regroupement des trajectoires longitudinales du microbiome à l'aide d'un mélange de distributions multinomiales logistiques à matrice normale
Le microbiome humain joue un rôle crucial dans la santé et les maladies. Le regroupement des données sur le microbiome permet de mettre en évidence des tendances significatives entre les échantillons, offrant ainsi un aperçu de la variabilité biologique et des mécanismes pathologiques. Les données sur le microbiome sont généralement multidimensionnelles, surdispersées et compositionnelles, ce qui complique leur modélisation. Nous proposons un cadre de regroupement basé sur un modèle pour les données microbiologiques longitudinales utilisant un mélange de distributions multinomiales logistiques à matrice normale, qui tient compte à la fois de la structure compositionnelle et de la dépendance temporelle. Bien que cette distribution offre une plus grande flexibilité pour saisir les corrélations complexes, elle est très gourmande en ressources informatiques. Pour surmonter ces limites, nous avons développé un cadre informatique efficace pour l'estimation des paramètres à l'aide d'approximations gaussiennes variationnelles. L'approche proposée est illustrée à l'aide d'ensembles de données simulées et réelles.
Date and Time
-
Co-auteurs (non y compris vous-même)
Yuan Fang
Old Dominion University
Wenshu Dai
Binghamton University
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Sanjeena Dang Carleton University