Spatial Dirichlet-Multinomial Mixed Model for Multivariate Count Data
Dirichlet-multinomial regression is often used to analyze overdispersed multivariate count data. In this work, we present the Spatial Dirichlet-Multinomial mixed model (SDM-MM), which emerges as a robust tool for modelling overdispersion in non-Gaussian spatial variables observed across sampling locations within a study area. Our data-driven SDM-MM captures the spatial correlation structure within the data through random effects/ latent variables. We introduce a novel hybrid algorithm that nests Integrated Nested Laplace Approximation (INLA) within the Minorization-Maximization (MM) algorithm for parameter estimation. We evaluate the performance of our proposed method using simulated data under two noise-level scenarios and apply it to honeybee gut microbiome data. Results suggest that our novel SDM-MM outperforms Dirichlet-Multinomial regression, which ignores spatial correlations. This research advances spatial modelling techniques, particularly for non-Gaussian spatial variables.
Modèle mixte Dirichlet-Multinomial spatial pour données de comptage multivariées
La régression Dirichlet-multinomiale est souvent utilisée pour analyser les données de comptage multivariées surdispersées. Dans ce travail, nous présentons le modèle mixte Dirichlet-Multinomial Spatial (SDM-MM), qui apparaît comme un outil robuste pour modéliser la surdispersion des variables spatiales non gaussiennes observées à différents lieux d'échantillonnage d'une même zone d'étude. Notre SDM-MM basé sur les données capture la structure de corrélation spatiale des données par le biais d'effets aléatoires/ variables latentes. Nous introduisons un nouvel algorithme hybride qui imbrique l'approximation de Laplace intégrée et imbriquée (INLA) dans l'algorithme de minorisation-maximisation (MM) pour l'estimation des paramètres. Nous évaluons les performances de la méthode proposée sur des données simulées dans deux scénarios de niveau de bruit, puis nous l'appliquons aux données du microbiome intestinal de l'abeille. Les résultats suggèrent que notre nouvelle méthode SDM-MM est plus performante que la régression Dirichlet-Multinomiale, qui ignore les corrélations spatiales. Cette recherche fait progresser les techniques de modélisation spatiale, en particulier pour les variables spatiales non gaussiennes.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais