期刊文献+

基于K—means的最小生成树聚类算法 预览 被引量:2

MST Clustering Algorithm Based on K-means
在线阅读 下载PDF
分享 导出
摘要 传统的K.means算法只能识别出类似球形的数据集,传统的MST聚类算法虽然能识别任意形状的数据集,但对噪声和异常点十分敏感,由此提出了一种将K-means聚类与MsT聚类相结合的聚类算法。此算法先使用K.means算法将数据分割成多个小的类似球形的数据集,然后对各个小的数据集的均值点采用MST聚类算法进行聚类分析。实验证明此算法具有较好的抗干扰性,并且可以识别出任意形状分布的数据集。为了评价聚类算法的性能,文中同时提出了一种新的聚类质量评价函数,实验证明此评价函数是有效的。 Classical K-means only can distinguish similar sphere-cluster, classical MST clustering algorithm can distinguish arbitrary cluster, but it' s very sensitive to noisy and abnormal data, the paper combine K- means and MST clustering algorithm. Firstly, K-means algorithm divides data to many similar mini sphere- clusters, and then MST clustering algorithm deals with mean points of these mini sphere-clusters. Results show that the new algorithm has good anti-noisy ability, and can distinguish arbitrary cluster. In order to an- alyze the quality of clustering, the paper provides a new quality evaluation function. Results show the func- tion is effective.
作者 欧阳浩 陈波 黄镇谨 王萌 王智文 OUYANG Hao, CHEN Bo, HUANG Zhen-jin, WANG Meng, WANG Zhi-wen ( Computer School, Guangxi University of Science and Technology, Liuzhou Guangxi 545006, China)
出处 《组合机床与自动化加工技术》 北大核心 2014年第4期41-44,52共5页 Modular Machine Tool & Automatic Manufacturing Technique
基金 广西自然科学基金项目(2013GXNSFAA019336) 广西自然科学基金项目(2013GXNSFBA019280) 广西壮族自治区教育厅项目(201203YBl24) 广西科技大学科学基金(校科自1261128)
关键词 聚类分析 K MEANS 最小生成树 质量评价函数 clustering analysis K-means MST quality evaluation function
作者简介 欧阳浩(1979-),男,湖南平江人,广西科技大学讲师,硕士,研究方向为数据挖掘和人工智能等,(E—mial)ouyanghao@tom.com。
  • 相关文献

参考文献13

二级参考文献72

共引文献138

同被引文献41

  • 1李美娟,陈国宏,陈衍泰.综合评价中指标标准化方法研究[J].中国管理科学,2004(z1):45-48. 被引量:127
  • 2孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量:785
  • 3David L Davies, Donald W Bouldin. A cluster separation measure[J]. Transactions on Pattern Analysis and Ma- chine Intelligence, 1979,4 : 224-227. 被引量:1
  • 4Chuanhao Wan,Peter de B Harrington. Self-configuring radial basis function neural networks for chemical pat- tern recognition[J]. Journal of Chemical Information and Computer Sciences, 1999,39 : 1049-1056. 被引量:1
  • 5Amy V Kapp,Robert Tibshirani. Are clusters found in one dataset present in another dataset? [J]. Biostatis- tics,2007,8(1) :9-31. 被引量:1
  • 6Gao Xinbo,Li Jie,Tao Dacheng,et al. Fuzziness meas- urement of fuzzy sets and its application in cluster va- lidity analysis[J]. International Journal of Fuzzy Sys- tem, 2007,9 (4) : 188-197. 被引量:1
  • 7Zhexue Huang,Michael K Ng. A fuzzy k-modes algo- rithm for clustering categorical data[J]. IEEE Trans- actions on Fuzzy Systems, 1999,4(7) :446-452. 被引量:1
  • 8Jiawei Han, Kamber M. Data mining concepts and techniques[M]. Second Edition. Beijing: China Ma-chinePress,2006. 被引量:1
  • 9Park H S,Jun C H. A simple and fast algorithm for K- medoids clustering[J]. Expert Systems with Applica- tions, 2009,36 (2) : 3336-3341. 被引量:1
  • 10Mohanmmad S,Zadegan R,Mirzaie M,et al. Ranked k- medoids: A fast and accurate rank-based partitioning algorithm for clustering large datasets[J]. Knowledge- based Systems, 2013,39 : 133-143. 被引量:1

引证文献2

二级引证文献4

投稿分析

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部 意见反馈