A Comparative Study of Bayesian Factor Models under Positive Lower Triangular and Unordered Generalized Lower Triangular Identification Constraints

A fundamental challenge in factor analytic models is structural non-identification due to invariance under orthogonal rotations. We compare two identification constraints that address this problem: the positive lower triangular (PLT) and unordered generalized lower triangular (UGLT) constraints. We implement MCMC algorithms for both in R, incorporating parameter expansion via the generalized inverse Gaussian distribution to accelerate sampling. For the UGLT model, we extend the partially collapsed Gibbs sampler of Frühwirth-Schnatter et al. with post-processing to determine the number of factors. Simulation studies show each model performs best when its assumptions match the data-generating structure. The UGLT model correctly recovers the true number of factors in overfitting settings, whereas the sparse PLT does not. Column sparsity priors also tend to perform poorly when irrelevant variables are included.

Étude comparative de modèles factoriels bayésiens soumis à des contraintes d'identification triangulaires inférieures positives et triangulaires inférieures généralisées non ordonnées

Un défi fondamental dans les modèles d'analyse factorielle est la non-identification structurelle due à l'invariance sous rotations orthogonales. Nous comparons deux contraintes d'identification qui traitent ce problème : les contraintes triangulaires inférieures positives (PLT) et triangulaires inférieures généralisées non ordonnées (UGLT). Nous implémentons des algorithmes MCMC pour les deux dans R, en incorporant l'expansion des paramètres via la distribution gaussienne inverse généralisée afin d'accélérer l'échantillonnage. Pour le modèle UGLT, nous étendons l'échantillonneur Gibbs partiellement effondré de Frühwirth-Schnatter et al. avec un post-traitement pour déterminer le nombre de facteurs. Des études de simulation montrent que chaque modèle fonctionne mieux lorsque ses hypothèses correspondent à la structure de génération des données. Le modèle UGLT récupère correctement le nombre réel de facteurs dans des configurations de surajustement, contrairement au modèle PLT clairsemé. Les a priori de clairsemage des colonnes ont également tendance à donner de mauvais résultats en présence de variables non pertinentes.

Session

Concours pour le Prix de la meilleure présentation par affiche de recherche étudiante

Date and Time