Aller au contenu principal
Regularized Dirichlet-Tree Multinomial Regression for Gut Microbiome Data
Hispanic and Latino Americans experience higher rates of chronic diseases, potentially due to acculturation negatively impacting their gut microbiome. Identifying associations between lifestyle factors and gut bacterial counts can inform chronic disease prevention and intervention strategies. The Dirichlet-tree multinomial (DTM) regression accommodates tree-structured evolutionary relationships, as seen in multivariate bacterial count data. With many potentially relevant covariates, the sparse group lasso (SGL) can be used for variable selection. Optimization of the SGL-regularized DTM regression can be complex due to the non-convex likelihood function. We introduce dominating hyperplane regularization for this optimization problem via the majorization-minimization algorithm. We show that a majorizing surrogate function is the sum of weighted Poisson regressions with a weighted ridge penalty. We apply our method to data from the Hispanic Community Health Study/Study of Latinos.
Régression multinomiale régularisée par arbre de Dirichlet pour les données du microbiome intestinal
Les Hispano-Américains et les Latino-Américains présentent des taux plus élevés de maladies chroniques, ce qui pourrait être dû à l’impact négatif de l’acculturation sur leur microbiome intestinal. L’identification des associations entre les facteurs liés au mode de vie et le nombre de bactéries intestinales peut contribuer à la prévention des maladies chroniques et à l’élaboration de stratégies d’intervention. La régression multinomiale par arbre de Dirichlet (DTM) prend en compte les relations évolutives structurées en arbre, comme on le voit dans les données multivariées de dénombrement bactérien. En présence de nombreuses covariables potentiellement pertinentes, le lasso de groupe parcimonieux (SGL) peut être utilisé pour la sélection des variables. L’optimisation de la régression DTM régularisée par le SGL peut être complexe en raison de la fonction de vraisemblance non convexe. Nous présentons une régularisation par hyperplan dominant pour ce problème d’optimisation par l’entremise de l’algorithme de minimisation de la majoration. Nous démontrons qu’une fonction de substitution majorée est la somme de régressions de Poisson pondérées avec une pénalité Ridge pondérée. Nous appliquons notre méthode aux données tirées de l’Hispanic Community Health Study/Study of Latinos.


Date and Time
-
Co-auteurs (non y compris vous-même)
Zeny Feng
University of Guelph
Ayesha Ali
University of Guelph
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Alysha Cooper University of Guelph