You are on page 1of 11

Artculo hecho por Bidyut Kr. Patra, Sukumar Nandi, P.

Viswanath

Descripcin del problema


Los problemas de clustering aparecen en muchas reas

tal como minera de datos, reconocimiento de patrones, anlisis estadstico de datos, bio-informatica, etc.
Mtodos basados en distancia utilizan un criterio

sobre la distancia entre patrones.

Single-link

puede encontrar clusters en forma arbitraria que tienen distintas aplicaciones. Construye un dendograma donde cada nivel representa un agrupamiento (clustering) de un conjunto de datos.

Single link

Trabajo relacionado
Dast et al. Propone un mtodo de agrupacin jerrquico

rpido basado en partially overlapping partitions (particiones que se superponen parcialmente)


Este mtodo consta de dos partes, en la primera se

particiona el conjunto de datos en celdas superpuestas, se calcula la distancia de pares para cada celda y si el total de pares ms cercanos es menor que un umbral delta entonces el par es fusionado.
En la segunda fase se utiliza hierrarchical agglomerative

clustering (HAC) sobre los clusters restantes.

Solucin propuesta en el artculo


Se proponen dos tipos de soluciones, la primera es un

mtodo hibrido llamado l-SL, el cual es la combinacin de dos tcnicas (i.e. leaders y el mtodo SL).
Un solo parmetro h (la distancia entre un par de

clusters es ms que h) .

El mtodo propuesto trabaja como sigue:


Se tiene un conjunto de leaders que se obtiene de aplicar el

mtodo de clustering leaders a un conjunto de datos usando = h/2.


El conjunto obtenido se agrupa usando el mtodo SL con

una distancia cortada h.


Cada leader se reemplaza por sus seguidores para producir

el agrupamiento final.

Mtodo al-SL es una extensin del mtodo l-SL en la

cual se incorpora una opcin de fusin de clusters.

Experimentos realizados en el artculo


Experimentos con bases de datos estndar.

Experimentos con bases de datos grandes.

Conclusiones de los autores

Anlisis

You might also like