Skip to main content
Factorized Sparse Linear Mixed Model Incorporating Graphical Structure
Regularized regression models have become essential tools for analyzing high-dimensional data in genome-wide association studies (GWAS) over the past decade. A key challenge in such studies is accounting for confounding factors, particularly population structure. In this paper, we propose a novel regularized mixed model that integrates an overlapping sparse group lasso penalty within a linear mixed model framework. Our approach extends the sparse group lasso by incorporating graphical structures to simultaneously capture group-level and within-group sparsity, while allowing for overlapping groups through a node-based incorporation strategy. To address population structure, we project the data onto a transformed subspace where observations are linearly independent. Simulation studies and real-world data analyses demonstrate that our proposed model achieves competitive performance in both variable selection and prediction accuracy.
Modèle mixte linéaire parcimonieux factorisé incorporant une structure graphique
Les modèles de régression régularisée sont devenus des outils essentiels pour l’analyse de données de grande dimension dans les études d’association pangénomique, ou GWAS, au cours de la dernière décennie. Un défi majeur dans ces études consiste à tenir compte des facteurs de confusion, en particulier de la structure de la population. Dans cet article, nous proposons un nouveau modèle mixte régularisé qui intègre une pénalité lasso de groupes parcimonieux avec chevauchement dans un cadre de modèle mixte linéaire. Notre approche étend le lasso de groupes parcimonieux en incorporant des structures graphiques afin de capter simultanément la parcimonie au niveau des groupes et à l’intérieur des groupes, tout en permettant des groupes se chevauchant grâce à une stratégie d’incorporation fondée sur les nœuds. Pour tenir compte de la structure de la population, nous projetons les données dans un sous-espace transformé où les observations sont linéairement indépendantes. Des études de simulation et des analyses de données réelles montrent que le modèle proposé atteint une performance concurrentielle tant pour la sélection de variables que pour la précision prédictive.
Date and Time
-
Additional Authors and Speakers (not including you)
Language of Oral Presentation
English
Language of Visual Aids
English

Speaker

Edit Name Primary Affiliation
Jia Wei He University of Guelph