期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
大数据下的分布式精确模糊KNN分类算法 预览
1
作者 邹劲松 李芳 《计算机应用研究》 CSCD 北大核心 2019年第12期3701-3704,共4页
针对K近邻(KNN)方法处理大数据集的效率问题进行了研究,提出了一种基于Spark框架的分布式精确模糊KNN分类算法,创新性地将Spark框架分布式map和reduce过程与模糊KNN结合。首先对不同分区中训练样本类别信息进行模糊化处理,得到类别隶属... 针对K近邻(KNN)方法处理大数据集的效率问题进行了研究,提出了一种基于Spark框架的分布式精确模糊KNN分类算法,创新性地将Spark框架分布式map和reduce过程与模糊KNN结合。首先对不同分区中训练样本类别信息进行模糊化处理,得到类别隶属度,将训练集转换为添加类隶属度的模糊训练集;然后使用KNN算法对先前计算的类成员测试集计算得到k个最近邻;最后通过距离权重进行分类。针对百万级大数据集样本的实验,以及与其他算法的对比实验表明,所提算法是可行的和有效的。 展开更多
关键词 大数据 分布式Spark框架 类隶属度 模糊KNN算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈