期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进的基于词集距离的FTC聚类算法 预览
1
作者 王秀慧 赵治军 《计算机工程与设计》 北大核心 2019年第11期3175-3179,共5页
针对FTC在实现聚类的过程中忽略了文本词语有序性这一特征,结合算法时间复杂度,提出基于词集距离的WSD-FTC文本聚类算法。在采用FP-Growth挖掘频繁项集的过程中通过限制词集距离得到质量更高、数量更少的频繁项集,以此作为聚类依据。通... 针对FTC在实现聚类的过程中忽略了文本词语有序性这一特征,结合算法时间复杂度,提出基于词集距离的WSD-FTC文本聚类算法。在采用FP-Growth挖掘频繁项集的过程中通过限制词集距离得到质量更高、数量更少的频繁项集,以此作为聚类依据。通过定义簇间相似系数保证多主题文本归入不同簇中,实现一定程度的软聚类。实验结果表明,WSD-FTC具有更好的聚类效果及更优的时间开销。 展开更多
关键词 频繁项集 聚类 词集距离 簇间相似系数 软聚类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈