Dirichlet Process Mixture Model for Imbalanced Multi-Class Data
Imbalanced datasets present challenges in classification, as conventional models often fail to capture patterns in minority classes effectively. This study proposes a Bayesian Multinomial Logistic Regression approach with Dirichlet Priors to address these issues. By incorporating Dirichlet priors, the method provides a principled way to account for class imbalance during model estimation. The Bayesian framework naturally integrates prior knowledge of class distributions and uncertainty, leading to more robust parameter estimates and improved generalization, particularly in data-scarce or highly imbalanced settings. Experimental results on synthetic and real-world datasets demonstrate the effectiveness of this approach in enhancing predictive performance while preserving interpretability. This study enhances the potential of Bayesian methods with well-specified priors in tackling imbalanced classification problems.
Modèle de mélange de processus de Dirichlet pour les données à classes multiples déséquilibrées
Les ensembles de données déséquilibrées posent des problèmes pour la classification, car les modèles conventionnels ne parviennent souvent pas à capturer efficacement les tendances dans les classes minoritaires. Cette étude propose une approche bayésienne de régression logistique multinomiale avec des lois a priori de Dirichlet pour résoudre ces problèmes. En incorporant des lois a priori de Dirichlet, la méthode fournit une façon méthode pour tenir compte du déséquilibre des classes pendant l'estimation du modèle. Le cadre bayésien intègre naturellement la connaissance a priori des distributions de classes et l'incertitude, ce qui conduit à des estimations de paramètres plus robustes et à une généralisation améliorée, en particulier dans les contextes où les données sont rares ou fortement déséquilibrées. Des résultats expérimentaux sur des ensembles de données synthétiques et réelles démontrent l'efficacité de cette approche pour améliorer les performances prédictives tout en préservant la capacité d'interprétation. Cette étude renforce le potentiel des méthodes bayésiennes avec des a priori bien spécifiés pour la résolution de problèmes de classification déséquilibrés.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English