Clustering longitudinal microbiome trajectories using a mixture of logistic matrix-normal multinomial distributions
The human microbiome plays a crucial role in health and disease. Clustering microbiome data can uncover meaningful patterns across samples, offering insights into biological variability and disease mechanisms. Microbiome data are typically high-dimensional, over-dispersed, and compositional, which complicates modelling. We propose a model-based clustering framework for longitudinal microbiome data using a mixture of logistic matrix-normal multinomial distributions, which jointly accounts for compositional structure and temporal dependence. Although this distribution provides greater flexibility in capturing complex correlations, it is computationally intensive. To overcome these limitations, we have developed a computationally efficient framework for parameter estimation using variational Gaussian approximations. The proposed approach is illustrated using both simulated and real datasets.
Regroupement des trajectoires longitudinales du microbiome à l'aide d'un mélange de distributions multinomiales logistiques à matrice normale
Le microbiome humain joue un rôle crucial dans la santé et les maladies. Le regroupement des données sur le microbiome permet de mettre en évidence des tendances significatives entre les échantillons, offrant ainsi un aperçu de la variabilité biologique et des mécanismes pathologiques. Les données sur le microbiome sont généralement multidimensionnelles, surdispersées et compositionnelles, ce qui complique leur modélisation. Nous proposons un cadre de regroupement basé sur un modèle pour les données microbiologiques longitudinales utilisant un mélange de distributions multinomiales logistiques à matrice normale, qui tient compte à la fois de la structure compositionnelle et de la dépendance temporelle. Bien que cette distribution offre une plus grande flexibilité pour saisir les corrélations complexes, elle est très gourmande en ressources informatiques. Pour surmonter ces limites, nous avons développé un cadre informatique efficace pour l'estimation des paramètres à l'aide d'approximations gaussiennes variationnelles. L'approche proposée est illustrée à l'aide d'ensembles de données simulées et réelles.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais