Mixture Model Averaging for Clustering Skewed Data
In mixture model-based clustering, there are two approaches for skewed data: directly modelling with asymmetric distributions, and transforming the data to near-normality. Although parsimonious families of asymmetric models exist, little has been done to reduce the complexity of transformation-based models. Moreover, model selection in clustering often relies on an arbitrary choice of selection criteria, which can give similar values across competing models and ignore model uncertainty. An averaging technique for Gaussian mixture models has been proposed to address this issue for symmetric data. We introduce a parsimonious family of the Manly-transformation mixture model using an eigen-decomposition constraint and extend the existing averaging technique to skewed mixture models. Comparisons with a family of variance-gamma mixture models on simulated and real data show that averaging with our family of Manly models consistently yields superior or comparable classification performance.
Moyennage de modèles mixtes pour regroupement de données asymétriques
Dans le regroupement basé sur un modèle de mélange, il existe deux approches courantes pour les données asymétriques : la modélisation directe avec des distributions asymétriques et la transformation des données vers une quasi-normalité. Bien qu'il existe des familles parcimonieuses de modèles asymétriques, peu d'efforts ont été faits pour réduire la complexité des modèles basés sur la transformation. De plus, la sélection de modèles dans le regroupement repose souvent sur un choix arbitraire de critères de sélection, qui peut donner des valeurs similaires entre des modèles concurrents et ignorer l'incertitude des modèles. Une technique de moyennage pour les modèles de mélange gaussiens a été proposée pour remédier à ce problème pour les données symétriques. Nous introduisons une famille parcimonieuse de modèles de mélange à transformation de Manly utilisant une contrainte de décomposition en valeurs propres et étendons la technique de moyennage existante aux modèles de mélange asymétriques. Des comparaisons avec une famille de modèles de mélange variance-gamma sur des données simulées et réelles montrent que le moyennage avec notre famille de modèles de Manly donne systématiquement des performances de classification supérieures ou comparables.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English