A Multivariate Pseudo-Voigt Mixture Model for Outlier Detection
A Voigt profile/distribution is a convolution of Gaussian and Cauchy distributions that is commonly assumed for spectroscopic data. The pseudo-Voigt profile approximates this convolution via a more simple linear combination of Gaussian and Cauchy distributions. In this talk, we consider the multivariate extension of a pseudo-Voigt distribution in a finite mixture model. In the context of outlier detection in model-based clustering, each cluster can be assumed to comprise a 'good' (Gaussian) component and a 'bad' (Cauchy) component. Parsimony and cohesion of each cluster is achieved by enforcing equality between both the location parameters and scale parameters of the Gaussian and Cauchy within each cluster. Parameter estimation is conducted using the expectation–conditional maximization (ECM) algorithm. We compare results on both simulations and real data with competing methods, including mixtures of contaminated normal distributions.
Modèle de mélange pseudo-Voigt multivarié pour la détection des valeurs aberrantes
Un profil/une fonction de Voigt est une convolution des distributions gaussiennes et de Cauchy qui est couramment supposée pour les données spectroscopiques. Le profil pseudo-Voigt approxime cette convolution par une combinaison linéaire plus simple des distributions gaussiennes et de Cauchy. Dans cette présentation, nous considérons l'extension multivariée d'une distribution pseudo-Voigt dans un modèle de mélange fini. Dans le contexte de la détection des valeurs aberrantes dans le regroupement basé sur un modèle, chaque groupe peut être censé comprendre une composante « bonne » (gaussienne) et une composante « mauvaise » (cauchyenne). La parcimonie et la cohésion de chaque groupe sont obtenues en imposant l'égalité entre les paramètres de localisation et les paramètres d'échelle des distributions gaussiennes et cauchyennes au sein de chaque groupe. L'estimation des paramètres est effectuée à l'aide de l'algorithme d'optimisation conditionnelle par espérance (ECM). Nous comparons les résultats obtenus à partir de simulations et de données réelles avec des méthodes concurrentes, y compris des mélanges de distributions normales contaminées.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais