Sparse Group LASSO in Finite Mixture Regression Models
Finite mixture regression (FMR) models are useful for analyzing heterogeneous data with latent subpopulations, as they allow regression coefficients to vary across components. Variable selection is needed at two levels: removing irrelevant covariates across all subpopulations (group level) and within each subpopulation (individual level). Existing approaches focus only on individual-level selection via LASSO. We propose a sparse group LASSO regularization method for finite Gaussian mixture regression that enables simultaneous selection at both levels. A novel Majorization–Minimization algorithm is developed for optimization. Simulation studies show improved variable selection and clustering performance. The method is applied to a Chiroptera dataset to identify key environmental and morphological drivers of bat forearm development.
Lasso en groupe clairsemé dans les modèles de régression à mélange fini
Les modèles de régression à mélange fini (FMR) sont utiles pour l'analyse des données hétérogènes avec des sous-populations latentes, car ils permettent aux coefficients de régression de varier d'une composante à l'autre. La sélection des variables est nécessaire à deux niveaux : suppression des covariables non pertinentes dans toutes les sous-populations (niveau du groupe) et au sein de chacune des sous-populations (niveau individuel). Les approches existantes se concentrent uniquement sur la sélection au niveau individuel par LASSO. Nous proposons une méthode de régularisation LASSO par groupes clairsemés pour la régression par mélange gaussien fini qui permet une sélection simultanée aux deux niveaux. Un nouvel algorithme de majorisation-minimisation est développé pour l'optimisation. Des études de simulation montrent une amélioration de la sélection de variables et des performances de regroupement. La méthode est appliquée à un ensemble de données sur les chiroptères afin d'identifier les principaux facteurs environnementaux et morphologiques du développement de l'avant-bras des chauves-souris.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais