Que signifie "Objectifs de regroupement"?
Table des matières
Le clustering, c'est une manière de regrouper des points de données qui se ressemblent. Différentes méthodes regardent comment former ces groupes de manières variées. Voici quelques objectifs courants en clustering :
k-median
Dans le clustering k-median, le but est de choisir un ensemble de centres qui représentent bien les groupes. Le coût est basé sur la distance des points de données par rapport aux centres choisis. L'idée, c'est de garder cette distance aussi petite que possible en choisissant un nombre fixe de centres.
k-means
Le clustering k-means est similaire au k-median mais utilise un calcul différent pour le coût. Il ne regarde pas seulement la distance, mais aussi les positions moyennes des points dans un groupe. Ça aide à créer des groupes où les points sont le plus proches les uns des autres.
k-supplier
Le clustering k-supplier se concentre sur le choix de centres qui peuvent fournir un service aux points de données. Cette méthode décide comment mieux servir différents groupes tout en gardant les coûts globaux plus bas.
Fair Clustering
Le fair clustering essaie de s'assurer que tous les groupes sont représentés de manière égale. Ça veut dire que en choisissant les centres, ça prend en compte la taille et les caractéristiques de chaque groupe, pour que aucun groupe ne soit laissé de côté ou sur-représenté.
Explainable Clustering
L'explainable clustering vise à donner des raisons claires pour lesquelles les points de données sont regroupés. Ça utilise des arbres de décision pour montrer comment les groupes sont formés, rendant plus facile de comprendre les choix derrière le clustering. Cependant, simplifier ces explications peut parfois mener à des résultats de clustering moins bons.
Pour résumer, les objectifs du clustering aident à définir comment les points de données sont regroupés. Chaque méthode a sa propre manière de mesurer le succès, en se concentrant sur la distance, la représentation, ou le service.