聚类分析是非监督模式分类的一个重要分支. DBSCAN算法是基于密度聚类的最常见算法, 且具有可发现任意形状的簇并且对噪声点不敏感等优点而得到广泛研究与应用. 本文首先研究了DBSCAN所存在的一些问题, 以及当前基于DBSCAN算法改进算法所存在的不足. 其次, 对于m pts-HDBSCAN算法处理密度分布不均匀数据聚类效果不理想的情况, 提出了一种新的分区算法. 分区算法根据数据分布的直方图确定分组数据, 根据分区阈值这个标准来确定是否对数据进行划分处理; 然后运用m pts-HDBSCAN算法对划分后的子数据进行聚类, 并对聚类的结果进行合并. 实验结果表明, 改进后的算法对于处理密度不均匀数据具有更好的效果.
韩浩宇 Han Haoyu张元 Zhang Yuan韩燮 Han Xie