期刊文献+
共找到3,617篇文章
< 1 2 181 >
每页显示 20 50 100
基于随机森林算法的原始土壤图更新研究 预览
1
作者 周紫燕 黄魏 +2 位作者 许伟 傅佩红 望陈运 《华中农业大学学报》 CAS CSCD 北大核心 2019年第3期53-59,共7页
以湖北省黄冈市红安县华家河镇滠水河流域为研究区,利用随机森林算法(randomforest,RF)结合多源环境变量,对研究区原有的土壤图斑进行分解制图,将混合多种土壤类型的复合土壤图斑进行细化,在土壤多边形内部画出新的边界来代表单一土壤类... 以湖北省黄冈市红安县华家河镇滠水河流域为研究区,利用随机森林算法(randomforest,RF)结合多源环境变量,对研究区原有的土壤图斑进行分解制图,将混合多种土壤类型的复合土壤图斑进行细化,在土壤多边形内部画出新的边界来代表单一土壤类型,并通过373个实地采样点验证更新后的土壤图。结果显示,更新后的土壤图其制图精度从原有的63%提高到了76%,展现了更为详细的空间细节和空间变化信息,表明利用随机森林算法进行数字土壤制图的可行性和可靠性。 展开更多
关键词 土壤类型 环境因子 光谱信息 随机森林算法 特征选择 制图精度
在线阅读 下载PDF
基于单类图分类的化合物分类方法 预览
2
作者 王晓东 张阳 王美丽 《计算机工程与设计》 北大核心 2019年第3期748-754,共7页
为减少新药设计过程中化合物筛选与结构优化的成本,提高筛选与优化的精确性,提出一种用于化合物分类的单类图分类方法。对化合物的严格拓扑结构提出优化频繁子图的方法选取特征子图,自适应地挖掘每阶段支持度下信息量表示更全的闭频繁子... 为减少新药设计过程中化合物筛选与结构优化的成本,提高筛选与优化的精确性,提出一种用于化合物分类的单类图分类方法。对化合物的严格拓扑结构提出优化频繁子图的方法选取特征子图,自适应地挖掘每阶段支持度下信息量表示更全的闭频繁子图,将提取的频繁子图作为特征样本输入,通过Adaboost集成一类支持向量机分类算法训练分类模型。实验结果表明,该方法可以明确提取相关性较高的频繁子结构,显著降低频繁子图挖掘后的特征空间,有效提高分类的准确性和泛化性。 展开更多
关键词 图分类 频繁子图挖掘 特征选择 单类分类 自适应增强
在线阅读 下载PDF
基于改进分离阈值法的农作物遥感精细分类特征选择 预览
3
作者 杨惠雯 方俊永 赵冬 《应用科学学报》 CAS CSCD 北大核心 2019年第1期51-63,共13页
为综合利用高空间分辨率可见光和红外遥感影像特征,提高分类处理效率,在分离阈值法的基础上提出一种结合图像二维熵的特征选择方法,解决了分离阈值法在特征选择时未考虑特征信息量的问题.利用随机森林分类器对选取后的特征子集进行农作... 为综合利用高空间分辨率可见光和红外遥感影像特征,提高分类处理效率,在分离阈值法的基础上提出一种结合图像二维熵的特征选择方法,解决了分离阈值法在特征选择时未考虑特征信息量的问题.利用随机森林分类器对选取后的特征子集进行农作物分类,并在同样的分类方法下与改进自适应波段选择方法和基于图像熵的密度峰值聚类波段选择方法进行分类精度对比.结果表明,所提出的方法既可提高分类精度和分类效率,又能降低特征选择的数量,还能进一步量化分析所选取的特征对各地物识别的效果. 展开更多
关键词 航空热红外遥感影像 分离阈值 图像熵 随机森林 精细分类 特征选择
在线阅读 下载PDF
基于随机森林的WebShell检测方法 预览
4
作者 秦英 《计算机系统应用》 2019年第2期240-245,共6页
WebShell根据其功能和大小可以分为多种类型,各种类型的WebShell在基本特征上又有其独有的特征,而现有的WebShell检测大多从单一层面提取特征,无法较全面的覆盖各种类型WebShell全部特征,具有种类偏向性,无差别的检测效果差,泛化能力弱... WebShell根据其功能和大小可以分为多种类型,各种类型的WebShell在基本特征上又有其独有的特征,而现有的WebShell检测大多从单一层面提取特征,无法较全面的覆盖各种类型WebShell全部特征,具有种类偏向性,无差别的检测效果差,泛化能力弱等问题.针对这一问题,提出了一种基于随机森林的WebShell检测方法.该方法在数据预处理阶段分别提取文本层的统计特征和文本层源码与编译结果层字节码(opcode)的序列特征,构成较全面的组合特征,然后通过Fisher特征选择选取适当比例的重要特征,降低特征维度,构成样本的特征集,最后采用随机森林分类器训练样本得到检测模型.通过实验表明,本检测方法能有效地检测WebShell,并在准确率、召回率和误报率上都优于单一层面的WebShell检测模型. 展开更多
关键词 WEBSHELL 随机森林 组合特征 特征选择
在线阅读 下载PDF
基于近邻图正则化的高光谱图像特征选择方法
5
作者 彭艳斌 郑志军 +3 位作者 邱薇薇 李晓勇 潘志刚 金诚 《光电子.激光》 EI CAS CSCD 北大核心 2019年第2期192-199,共8页
高光谱图像分类是近年来的研究热点。其数据的高维性引发了"维度灾难"问题。数据降维成为解决问题的关键。针对高光谱数据有标记训练样本点匮乏的特点,提出用无监督的特征选择方法对高光谱数据进行降维。该方法能够同时保持... 高光谱图像分类是近年来的研究热点。其数据的高维性引发了"维度灾难"问题。数据降维成为解决问题的关键。针对高光谱数据有标记训练样本点匮乏的特点,提出用无监督的特征选择方法对高光谱数据进行降维。该方法能够同时保持原始高光谱数据的判别能力和局部几何结构。为了保持判别能力,用所选特征对原始高光谱数据进行重构,利用重构误差最小化将特征选择问题转化为优化问题。为了保持局部几何结构,建立近邻图,并将其转化为正则项加入目标函数中。通过迭代梯度下降方法解此优化问题,得出优选特征子集参与高光谱图像分类识别任务。在真实数据集上的实验表明,新方法能够提高分类识别的精度。 展开更多
关键词 高光谱图像 分类 降维 特征选择 近邻图
基于模糊互信息的多标签特征选择 预览
6
作者 张毅斌 马盈仓 《河南科学》 2019年第4期521-527,共7页
多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊... 多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊互信息的多标签特征选择算法.最后在同一准则下,将模糊互信息与原先的互信息特征选择算法及其他几种经典的特征选择算法进行比较.实验表明,此方法在一定程度上效果优于其他特征选择算法,是一种有效的多标签分类问题的特征选择方法. 展开更多
关键词 特征选择 互信息 模糊互信息
在线阅读 下载PDF
基于混合ABC和CRO的高维特征选择方法 预览
7
作者 张戈 王建林 《计算机工程与应用》 CSCD 北大核心 2019年第11期93-101,共9页
高维数据集包含了成千上万可用于数据分析和预测的特征,然而这些数据集存在许多不相关或冗余特征,影响了数据分析和预测的准确性。现有分类技术难以准确地识别最佳特征子集。针对该问题,提出了一种基于wrapper模式的特征选择方法 AB-CRO... 高维数据集包含了成千上万可用于数据分析和预测的特征,然而这些数据集存在许多不相关或冗余特征,影响了数据分析和预测的准确性。现有分类技术难以准确地识别最佳特征子集。针对该问题,提出了一种基于wrapper模式的特征选择方法 AB-CRO,该方法结合了人工蜂群算法(ABC)和改进的化学反应算法(CRO)的优点进行特征选择。针对迭代过程中较优的个体可能在化学反应过程中被消耗掉的现象,适当地加入精英策略来保持种群的优良性。实验结果表明,AB-CRO算法在最佳特征子集的识别和分类精度方面相对于基准算法ABC,CRO以及基于GA,PSO和混合蛙跳算法都所有改进。 展开更多
关键词 特征选择 生物数据 人工蜂群算法 化学反应优化算法 精英保留策略
在线阅读 下载PDF
面向序数回归的组合特征提取方法 预览
8
作者 曾庆田 刘晨征 +1 位作者 倪维健 段华 《计算机科学》 CSCD 北大核心 2019年第6期69-74,共6页
序数回归(也称序数分类)是一种监督学习任务,即使用具有自然顺序的标签对数据项进行分类。序数回归与诸多实际问题密切相关,近几年关于序数回归的研究受到越来越多的关注。序数回归与其他监督学习任务(分类、回归等)一样,需要通过特征... 序数回归(也称序数分类)是一种监督学习任务,即使用具有自然顺序的标签对数据项进行分类。序数回归与诸多实际问题密切相关,近几年关于序数回归的研究受到越来越多的关注。序数回归与其他监督学习任务(分类、回归等)一样,需要通过特征提取来提高模型的效率和准确性。虽然特征提取被广泛研究并用于分类学习任务中,但是在序数回归中的研究较少。众所周知,相比单特征,组合特征可以表达更多的数据底层语义,但是加入一般的组合特征很难提高模型的准确性。文中基于频繁模式挖掘,借助K-L散度值来选取最有区分能力的频繁模式进行特征组合,提出了一种新的序数回归组合特征提取方法,并在公开数据集和自有数据集上使用多个序数回归模型进行实验。结果表明,使用最有区分能 展开更多
关键词 序数回归 频繁模式 特征组合 特征选择
在线阅读 免费下载
基于改进集成学习算法的在线空气质量预测 预览
9
作者 夏润 张晓龙 《武汉科技大学学报:自然科学版》 CAS 北大核心 2019年第1期61-67,共7页
为了实现空气质量的在线预测,提出了一种基于XGBoost算法的改进集成学习算法OPGBoost.首先对PI(plant information)实时数据库系统进行二次开发,构成大数据挖掘与分析平台,运用数据融合工具对原始数据进行预处理,并采用Boruta算法进行... 为了实现空气质量的在线预测,提出了一种基于XGBoost算法的改进集成学习算法OPGBoost.首先对PI(plant information)实时数据库系统进行二次开发,构成大数据挖掘与分析平台,运用数据融合工具对原始数据进行预处理,并采用Boruta算法进行特征选择,从而构造出包含更多属性特征量的有效数据集.然后对XGBoost算法中的一阶和二阶导数进行优化,并通过时间滑动窗口和衰减函数机制获取训练数据以及训练模型的权重,最后采用Bagging集成学习策略构成OPGBoost组合模型.实验结果表明,针对基于PM2.5浓度和AQI表征的空气质量预测,本文方法与4种已有算法相比在准确性和实用性方面具有明显的优势,能够较精确地预测未来1、12、24h的空气污染情况. 展开更多
关键词 空气质量预测 XGBoost算法 衰减函数 BAGGING 集成学习 特征选择 PM2.5 AQI
在线阅读 下载PDF
基于深度学习的局部方向人脸识别算法研究 预览
10
作者 公维军 吴建军 +1 位作者 李晓霞 李晓旭 《计算机与数字工程》 2019年第5期1032-1036,1135共6页
论文针对人脸识别中的特征选择和单一算法的局限性问题,提出了一种基于深度学习的局部方向人脸识别算法。首先通过定位和分块选取人脸局部敏感区域,然后依次利用LDP算法良好的局部特征提取能力对精选分块区域进行特征提取并最终连接成... 论文针对人脸识别中的特征选择和单一算法的局限性问题,提出了一种基于深度学习的局部方向人脸识别算法。首先通过定位和分块选取人脸局部敏感区域,然后依次利用LDP算法良好的局部特征提取能力对精选分块区域进行特征提取并最终连接成新的特征脸,然后利用深度学习网络DBN进行逐层贪婪训练,获得良好的网络参数,最后用训练好的网络对测试样本进行人脸测试分类。依次在ORL和MIT-CBCL人脸数据库上进行实验检测,实验结果表明,论文提出的算法与传统单一或融合算法具有更高的识别率,具有良好的局部性能和抗干扰性。 展开更多
关键词 局部方向模式 局部敏感 深度学习 特征选择 人脸识别
在线阅读 下载PDF
基于MPGA的混合特征选择算法在驾驶压力检测中的应用 预览
11
作者 张傲 陈兰岚 魏琛 《华东理工大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期125-132,共8页
针对多源生理信号应用于驾驶压力检测中存在信号种类多、特征维数高以及运算效率低的问题,提出了一种结合特征选择(ReliefF)算法、最大相关最小冗余(MRMR)算法和多种群遗传算法(MPGA)的混合特征选择算法。首先利用ReliefF算法计算特征... 针对多源生理信号应用于驾驶压力检测中存在信号种类多、特征维数高以及运算效率低的问题,提出了一种结合特征选择(ReliefF)算法、最大相关最小冗余(MRMR)算法和多种群遗传算法(MPGA)的混合特征选择算法。首先利用ReliefF算法计算特征信号的权重值,初选出对分类效果影响显著的特征子集;然后利用MRMR算法去掉冗余的特征,进一步精简特征子集;在此基础上采用MPGA挑选出效果最佳的特征子集。将该算法应用于驾驶压力检测,并与其他类似算法进行了对比。实验结果表明,该算法有效地消除了高维特征中的冗余信息,提高了特征选择阶段的运算效率且达到了很好的分类效果。 展开更多
关键词 生理信号 RELIEFF算法 MRMR算法 MPGA算法 特征选择 驾驶压力检测
在线阅读 下载PDF
基于文档结构的特征权重计算方法研究 预览
12
作者 罗衎 马佳佳 《软件导刊》 2019年第5期65-68,共4页
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验... 针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验。结果表明,基于DS的权重算法与原始权重算法相比,能够提高文本分类效果。 展开更多
关键词 文本分类 向量空间模型 文档结构 特征权重 特征选择
在线阅读 免费下载
基于扩展的情感词典和卡方模型的中文情感特征选择方法 预览
13
作者 胡思才 孙界平 +3 位作者 琚生根 王霞 龙彬 廖强 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期37-44,共8页
根据经典的特征选择方法在中文情感评论文本中应用的缺陷和不足,提出了一种改进的中文情感特征选择方法.目前,现有的情感特征选择方法普遍只利用了特征项在褒贬类中的统计信息,忽略了情感极性值对特征选择的影响;同时情感文本中否定词... 根据经典的特征选择方法在中文情感评论文本中应用的缺陷和不足,提出了一种改进的中文情感特征选择方法.目前,现有的情感特征选择方法普遍只利用了特征项在褒贬类中的统计信息,忽略了情感极性值对特征选择的影响;同时情感文本中否定词会带来特征项情感极性反转的情况,为特征选择带来较大的负面影响.针对这些问题,首先对情感文本中的否定词进行了检测和判定,对否定词界定范围内的情感特征词进行反义变换处理,有效的解决了情感文本中极性反转的问题.同时还将特征项的情感极性值和其在类中的频率特点两个因素融入到卡方特征选择模型(CHI)中,从而提升了卡方模型在文本情感特征选择的效果.实验结果表明,本文算法较其他算法在多个领域数据集上的情感分类准确率提高了1.5%左右. 展开更多
关键词 情感词典 卡方模型 特征选择 知网 否定词
在线阅读 免费下载
最大判别特征选择算法在文本分类的优化研究 预览
14
作者 刘云 黄荣乘 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期65-70,共6页
采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一... 采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一个新的特征向量ε用于分类,使得从中选取的部分特征词具有最大的类别区分能力.仿真结果表明,与cMFD,CSFS和CMFS三种特征选择算法相比,MD特征选择算法能在选取较少特征词情况下,获得更高的分类精度. 展开更多
关键词 相对熵 杰弗里斯散度 多项式朴素贝叶斯分类器 特征选择
在线阅读 免费下载
Sentinel-2影像多特征优选的黄河三角洲湿地信息提取
15
作者 张磊 宫兆宁 +2 位作者 王启为 金点点 汪星 《遥感学报》 EI CSCD 北大核心 2019年第2期313-326,共14页
以北方典型河口湿地-黄河三角洲湿地为研究区,采用在特征选择和分类提取等方面具有明显优势的随机森林算法,对研究区内的湿地信息进行提取。首先基于多时相、光谱信息丰富的Sentinel-2数据生成4类不同的特征变量,包括光谱特征、植被指... 以北方典型河口湿地-黄河三角洲湿地为研究区,采用在特征选择和分类提取等方面具有明显优势的随机森林算法,对研究区内的湿地信息进行提取。首先基于多时相、光谱信息丰富的Sentinel-2数据生成4类不同的特征变量,包括光谱特征、植被指数和水体指数、红边指数、纹理特征;再根据以上特征构建6种不同的提取方案,对黄河三角洲湿地信息进行提取并验证不同方案的提取精度,旨在选择最佳方案改善湿地信息提取的效果。结果表明:(1)有效地使用多种特征变量是提高湿地信息提取的关键,就不同特征对湿地信息提取的贡献率而言,红边指数>植被指数和水体指数>光谱特征>纹理特征;(2)基于随机森林算法优选的特征变量提取效果最佳,总体精度高达90.93%,Kappa系数为0.90,表明随机森林算法可以有效地进行特征选择,在特征变量数据挖掘的同时,仍能保证湿地信息提取的精度,提高运行效率。本研究为湿地信息提取在数据源选择、特征选择和方法选择方面提供了一种新思路、方法和技术手段。 展开更多
关键词 河口湿地 信息提取 Sentinel-2 随机森林 特征选择 红边指数 多时相数据
基于样本差异性的多标记特征选择算法 预览
16
作者 唐莉 王晨曦 +2 位作者 胡敏杰 林耀进 郑文彬 《安庆师范大学学报:自然科学版》 2019年第1期64-70,81共8页
在多标记学习中,特征空间的高维性是多标记学习研究的主要问题。文章通过聚类构建由代表性样本组成新多标记数据,定义了多标记决策系统中样本的分类间隔及样本的差异性概念,在此基础上定义了特征权重,提出一种基于样本差异性的多标记特... 在多标记学习中,特征空间的高维性是多标记学习研究的主要问题。文章通过聚类构建由代表性样本组成新多标记数据,定义了多标记决策系统中样本的分类间隔及样本的差异性概念,在此基础上定义了特征权重,提出一种基于样本差异性的多标记特征选择算法,并用4个指标对4个多标记数据集进行实验评价,对比一些当前流行的特征选择算法,验证了本文所提算法的有效性。 展开更多
关键词 特征选择 多标记学习 样本差异性 分类间隔
在线阅读 免费下载
基于ReliefF剪枝的多标记分类算法 预览
17
作者 刘海洋 王志海 张志东 《计算机学报》 EI CSCD 北大核心 2019年第3期483-496,共14页
多标记分类问题需要为每个实例分配多个标记.常见的多标记分类方法主要分为算法转换法和问题转换法两类.合理利用标记间的依赖关系是提升多标记分类性能的关键.在该文中,作者从不同的问题转化方法的角度,将标记间依赖关系的利用方法分... 多标记分类问题需要为每个实例分配多个标记.常见的多标记分类方法主要分为算法转换法和问题转换法两类.合理利用标记间的依赖关系是提升多标记分类性能的关键.在该文中,作者从不同的问题转化方法的角度,将标记间依赖关系的利用方法分为标记分组法和属性空间扩展法两种.作者发现,对于属性空间扩展法,普遍存在的难题在于如何对标记间的依赖关系进行准确度量,并选择合适的标记集合加入到属性空间中.在此基础上,作者提出了一种基于ReliefF剪枝的多标记分类算法(ReliefF based Stacking,RFS).算法从属性选择的角度,利用ReliefF方法对标记间的依赖关系进行度量,进而选择依赖关系较强的标记加入到原始属性空间中.在9个多标记基准数据集上的实验结果显示,RFS算法相较于当下流行的多标记分类算法具有较为明显的优势. 展开更多
关键词 多标记分类 标记间依赖关系 属性选择 RELIEFF Stacking算法
在线阅读 下载PDF
基于机器学习的中压配电网断线不接地故障检测 预览
18
作者 苏运 赵琦 瞿海妮 《电测与仪表》 北大核心 2019年第1期96-101,共6页
由于中压配电网变电站常采用中性点不接地方式,所以当线路单相断线后断口两侧的导线均不接地或是非电源侧导线落地等情况发生时,没有明显的故障特征产生,且无法通过变电站内现有的继电保护装置对故障进行检测。为解决这一难题,我们基于... 由于中压配电网变电站常采用中性点不接地方式,所以当线路单相断线后断口两侧的导线均不接地或是非电源侧导线落地等情况发生时,没有明显的故障特征产生,且无法通过变电站内现有的继电保护装置对故障进行检测。为解决这一难题,我们基于配用电信息系统数据和改进的随机森林算法,用纯数据驱动的方法,提出了一套可用于中压配电网的断线智能检测系统的方法,可应用于实时的故障检测,这是文章的一大创新之处。其次,以华东某地区配用电信息系统中的历史数据为依据进行实际算例分析,该方法在测试集中的分类的准确度高达91.44%,而且找出了电压为判断配电网断线的主要标准,这为配电网断线不接地故障检测的进一步研究提供了科学的依据。 展开更多
关键词 中压配电网 断线故障检测 三相用电 特征选择 随机森林
在线阅读 下载PDF
基于改进空间正则化相关滤波器的运动目标跟踪研究 预览
19
作者 郭克友 胡巍 暴启超 《机床与液压》 北大核心 2019年第2期124-129,共6页
为降低光照、遮挡、尺寸变化等因素对目标跟踪过程的影响,提出在经典空间正则化核相关滤波基础上,增加遮挡检测及处理机制,并分别采用相似度计算与空间距离计算作为遮挡评判标准。在模型更新之前先判断遮挡是否存在,如有遮挡,则不更新模... 为降低光照、遮挡、尺寸变化等因素对目标跟踪过程的影响,提出在经典空间正则化核相关滤波基础上,增加遮挡检测及处理机制,并分别采用相似度计算与空间距离计算作为遮挡评判标准。在模型更新之前先判断遮挡是否存在,如有遮挡,则不更新模型;否则更新模型。提出搜索半径择优处理,分别以6种搜索半径进行目标跟踪,寻找最优搜索半径;进而提出特征择优处理,分别提取HOG特征、PHOG特征、Haar-like特征、LBP特征以及FHOG特征与改进算法结合,选取最佳特征。采用两组实验进行验证:分别采用经典KCF算法、Mean Shift算法、Fragment算法、DSST算法、经典SRDCF算法和改进SRDCF算法对Bolt2和Basketball两个视频中运动目标进行跟踪对比。实验结果表明:FHOG特征与改进空间正则化核相关滤波相结合,且在搜索半径为8个像素点时的跟踪性能最佳,优于其他经典跟踪算法,处理速度可达3. 7 fps。 展开更多
关键词 视频目标跟踪 空间正则化核相关滤波器 遮挡检测 搜索半径 特征选取
在线阅读 下载PDF
基于全球恐怖主义数据库的特征选择方法研究 预览
20
作者 姜国庆 赵梦 +2 位作者 杨涛 彭如香 孔华锋 《计算机应用与软件》 北大核心 2019年第4期51-54,共4页
恐怖主义被称为现代人类社会之癌,是世界各国政府和人民面临着的重大的挑战,应该引起全人类的重视。在使用全球恐怖主义数据库中的数据对恐怖主义活动进行研究时,从高维数据中提取关键的特征,是反恐研究中的重点和难点。针对全球恐怖主... 恐怖主义被称为现代人类社会之癌,是世界各国政府和人民面临着的重大的挑战,应该引起全人类的重视。在使用全球恐怖主义数据库中的数据对恐怖主义活动进行研究时,从高维数据中提取关键的特征,是反恐研究中的重点和难点。针对全球恐怖主义数据库中特征的高维性、冗余性和数据不完整性的特点,分别采用最小冗余最大相关算法(mRMR)、基于支持向量机的递归删除算法(SVM-RFE)和基于随机森林的特征选择算法进行特征筛选与提取。利用K-近邻(KNN)分类器其对上述特征选择方法进行降维结果分析和分类结果比较。实验结果表明,特征选择算法不仅能提高分类性能还能提高分类效率,并且基于支持向量机的递归删除算法(SVM-RFE)选择的特征子集在预测恐怖主义活动时准确率更高。 展开更多
关键词 全球恐怖主义数据库 特征选择 mRMR SVM-RFE 随机森林
在线阅读 下载PDF
上一页 1 2 181 下一页 到第
使用帮助 返回顶部 意见反馈