Skip to main content
Globally aligned Principal Component Analysis for multi-group data
We propose a novel principal component analysis (PCA) methodology for multi-group data, where multiple numerical variables are measured across different groups. Our method combines group-specific principal components with global ones through an explicit alignment mechanism based on regularized optimization. We introduce the notion of a globally aligned covariance matrix that incorporates weighted contributions from global principal directions. The alignment strength is controlled by regularization parameters that can be tuned to achieve the desired trade-off. Through a comprehensive simulation study, we demonstrate that the aligned approach achieves a favourable compromise between capturing local variation within groups and maintaining interpretability and stability across groups. In an application to the 2021 Canadian Census socioeconomic data, the proposed alignment yields more comparable and stable region-specific components than pooled or purely region-wise PCA.
Analyse en Composantes Principales alignées globalement pour les données multi-groupes
Nous proposons une nouvelle méthodologie d'analyse en composantes principales (ACP) pour les données multi-groupes, où plusieurs variables numériques sont mesurées dans différents groupes. Notre méthode combine les composantes principales spécifiques à chaque groupe avec les composantes globales grâce à un mécanisme d'alignement explicite basé sur l'optimisation régularisée. Nous introduisons la notion de matrice de covariance alignée globalement qui intègre les contributions pondérées des directions principales globales. La force d'alignement est contrôlée par des paramètres de régularisation qui peuvent être ajustés pour obtenir le compromis souhaité. Grâce à une étude de simulation complète, nous démontrons que l'approche alignée permet d'atteindre un compromis favorable entre la capture des variations locales au sein des groupes et le maintien de l'interprétabilité et de la stabilité entre les groupes. Dans une application aux données socio-économiques du recensement canadien de 2021, l'alignement proposé donne des composantes spécifiques à chaque région plus comparables et plus stables que l'ACP groupée ou purement régionale.
Date and Time
-
Additional Authors and Speakers (not including you)
Hedayat Fathi
Université Laval
Marzia A. Cremona
Université Laval
Language of Oral Presentation
English
Language of Visual Aids
English

Speaker

Edit Name Primary Affiliation
Federico Severino Université Laval