Aller au contenu principal
A Pragmatic Method for Comparing Clusterings with Overlaps and Outliers
Clustering algorithms are an essential part of the unsupervised data science ecosystem, and extrinsic evaluation of clustering algorithms requires a method for comparing the detected clustering to a ground truth clustering. In a general setting, the detected and ground truth clusterings may have outliers (objects belonging to no cluster), overlapping clusters (objects may belong to more than one cluster), or both, but methods for comparing these clusterings are currently undeveloped. We define a pragmatic similarity measure for comparing clusterings with overlaps and outliers, show that it has several desirable properties, and experimentally confirm that it is not subject to several common biases afflicting other clustering comparison measures.
Une méthode pragmatique pour la comparaison de regroupements avec chevauchements et valeurs aberrantes
Les algorithmes de regroupement constituent un élément essentiel de l'écosystème de la science des données non supervisées. Or l'évaluation extrinsèque des algorithmes de regroupement nécessite une méthode permettant de comparer le regroupement détecté à un regroupement de référence. En général, les regroupements détectés et de référence peuvent présenter des valeurs aberrantes (objets n'appartenant à aucun regroupement), des chevauchements (les objets peuvent appartenir à plusieurs regroupements) ou les deux, mais il n'existe actuellement pas de méthodes au point pour comparer ces regroupements. Nous définissons une mesure pragmatique de similarité pour comparer les regroupements présentant des chevauchements et des valeurs aberrantes, démontrons qu'elle possède plusieurs propriétés souhaitables et confirmons expérimentalement qu'elle n'est pas sujette à divers biais courants qui affectent d'autres mesures de comparaison de regroupements.
Date and Time
-
Co-auteurs (non y compris vous-même)
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Ryan DeWolfe Toronto Metropolitan University