Finite Mixture of Multivariate Poisson Log-normal Factor Regression Models for Clustering Count Data
A family of mixtures of multivariate Poisson log-normal factor analyzers (MPLN-FA), analogous to the family of parsimonious Gaussian mixture of models, has been recently proposed for clustering count data. Both allow constraints across groups on the factor loading and noise terms of the covariance matrix and the distribution of the errors to be isotropic or not. In the mixtures of MPLN-FA, the observed count data are assumed to be modelled using a discrete distribution conditioning on the continuous latent variables. Motivated by clustering high dimensional count data while taking into account a set of predictors in a multivariate regression framework, a mixture of MPLN-FA with the covariance structure assuming unequal noise (UUU) is extended to a mixture of MPLN factor regression models (FRM), where the latent variables, conditional on the predictor variables, are modelled by a multivariate Gaussian distribution with its location parameter assumed to be associated with the predictors.
Mélange fini de modèles de régression factorielle Poisson log-normale multivariée pour le regroupement de données de dénombrement
Une famille de mélanges d'analyseurs factoriels Poisson log-normaux (MPLN-FA), analogue à la famille de mélanges de modèles gaussiens parcimonieux, a été récemment proposée pour le regroupement de données de dénombrement. Les deux permettent d'appliquer des contraintes entre les groupes sur les score des facteurs et les termes de bruit de la matrice de covariance et la distribution des erreurs pour qu'elle soit isotrope ou non. Dans les mélanges de MPLN-FA, on suppose que les données de dénombrement observées sont modélisées à l'aide d'une distribution discrète conditionnée par les variables latentes continues. Motivé par le regroupement des données de dénombrement de grandes dimensions en tenant compte d'un ensemble de prédicteurs dans un cadre de régression multivariée, nous élargissons un mélange de MPLN-FA avec la structure de covariance supposant un bruit inégal (UUU) à un mélange de modèles de régression factorielle (MRF) MPLN, dans lequel les variables latentes, conditionnelles aux prédicteurs, sont modélisées par une distribution gaussienne multivariée dont le paramètre de localisation est supposé associé aux prédicteurs.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Bilingue