演讲者:李清勇教授, 北京交通大学计算机与信息技术学院
时间:2016-05-13 16:00-17:00
地点:一教303
对于聚类分析来说,如何在保证算法易用的条件下发现大规模数据集中不同形态(尺度,形状,密度)的簇是一个重大挑战。经典的聚类算法(比如KMeans,DBSCAN,Density Peak等)都难以兼顾数据的不同形态。我们将探讨一种基于K近邻相对密度的聚类算法。该方法首先通过KNN核方法估计出所有点的密度,根据KNN核密度算出相对密度,利用相对密度我们可以发现不同密度、不同尺度的初始簇(簇纯度较高但可能不完全),最后利用K近邻图上的α可达关系对初始簇合并,得到最终聚类结果。 |