Aller au contenu principal
Nonparametric Cluster Weighted Models
Cluster weighted models (CWMs) are a class of finite mixture of regression models that jointly model random covariates and response variables, where the centre of each cluster in a Gaussian mixture model is extended from a single point to a regression model. A challenge in CWMs is specifying the correct parametric functional form of each regression model's data generating process simultaneously with the marginal distribution of covariates. Nonparametric kernel or spline regression estimators can be employed in CWMs to estimate unspecified nonlinear regression functions for each cluster. Model smoothness during estimation is controlled using a roughness penalty on spline coefficients and cross-validated bandwidth selection for kernel functions. Spline and kernel CWMs are applied to simulated and real datasets with various linear and nonlinear cluster shapes, and their performance is compared to that of state-of-the-art CWMs.
Modèles non paramétriques pondérés par grappes
Les modèles pondérés par grappes (CWM pour « cluster weighted models ») sont une classe de modèles de régression à mélange fini qui modélisent conjointement des covariables aléatoires et des variables de réponse, où le centre de chaque grappe dans un modèle de mélange gaussien est étendu d'un point unique à un modèle de régression. L'un des défis des CWM consiste à spécifier la forme fonctionnelle paramétrique correcte du processus de génération des données de chaque modèle de régression simultanément avec la distribution marginale des covariables. Des estimateurs de régression non paramétriques à noyau ou splines peuvent être utilisés dans les CWM pour estimer des fonctions de régression non linéaires non spécifiées pour chaque grappe. La régularité du modèle pendant l'estimation est contrôlée à l'aide d'une pénalité de rugosité sur les coefficients spline et d'une sélection de bande passante validée par recoupement pour les fonctions noyau. Les CWM avec spline et noyau sont appliqués à des ensembles de données simulés et réelles présentant diverses formes de grappes linéaires et non linéaires, et leurs performances sont comparées à celles des CWM de pointe.
Date and Time
-
Co-auteurs (non y compris vous-même)
Ling Xue
The University of Britsh Columbia (Okanagan)
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
John R.J. Thompson The University of British Columbia