¿Qué significa "Objetivos de agrupamiento"?
Tabla de contenidos
El clustering es una forma de agrupar puntos de datos que son similares entre sí. Diferentes métodos ven cómo formar estos grupos de diferentes maneras. Aquí hay algunos objetivos comunes en el clustering:
k-median
En el clustering k-median, el objetivo es elegir un conjunto de centros que representen bien los grupos. El costo se basa en qué tan lejos están los puntos de datos de los centros elegidos. La idea es mantener esta distancia lo más pequeña posible mientras se elige un número fijo de centros.
k-means
El clustering k-means es similar al k-median, pero usa un cálculo diferente para el costo. No solo mira la distancia, sino que también promedia las posiciones de los puntos en un grupo. Esto ayuda a crear grupos donde los puntos están lo más cerca posible unos de otros.
k-supplier
El clustering k-supplier se enfoca en elegir centros que puedan ofrecer un servicio a los puntos de datos. Este método decide cómo servir mejor a diferentes grupos mientras mantiene los costos generales más bajos.
Fair Clustering
El Fair Clustering intenta asegurar que todos los grupos estén representados por igual. Esto significa que al elegir los centros, se consideran el tamaño y las características de cada grupo, para que no se quede ningún grupo fuera o se sobre-represente.
Explainable Clustering
El Explainable Clustering tiene como objetivo proporcionar razones claras para la forma en que se agrupan los puntos de datos. Usa árboles de decisión para mostrar cómo se forman los grupos, lo que facilita entender las elecciones detrás del clustering. Sin embargo, simplificar estas explicaciones puede a veces llevar a peores resultados en el clustering.
En resumen, los objetivos del clustering ayudan a definir cómo se agrupan los puntos de datos. Cada método tiene su propia forma de medir el éxito, enfocándose en la distancia, la representación o el servicio.