期刊文献+
共找到3,729篇文章
< 1 2 187 >
每页显示 20 50 100
面向类不平衡问题的“职业举报人”识别方法 预览
1
作者 易成岐 黄倩倩 +3 位作者 王从余 张何灿 靳晓锟 王建冬 《计算机工程与应用》 CSCD 北大核心 2019年第14期1-7,23共8页
“职业举报人”团伙化、规模化、专业化、低龄化作案趋势日趋明显,政府部门对其识别大多采用人工鉴别的方法,造成了大量人力资源的浪费。采用Bootstrapping数据重采样技术,结合文本、时间和举报人属性等特征,在解决类不平衡数据的过拟... “职业举报人”团伙化、规模化、专业化、低龄化作案趋势日趋明显,政府部门对其识别大多采用人工鉴别的方法,造成了大量人力资源的浪费。采用Bootstrapping数据重采样技术,结合文本、时间和举报人属性等特征,在解决类不平衡数据的过拟合问题基础上,实现了“职业举报人”的准确识别。实验结果表明,相比过采样和欠采样技术而言,利用Bootstrapping重采样技术识别准确率更高,采用CFS方法结合BestFirst策略对数据特征进行优化,在保证精度的前提下能够实现更高的计算效率。以全国12358价格监管平台的真实数据为驱动,验证了方法的有效性,对比分析了“职业举报人”和正常消费者的投诉举报行为习惯差异。 展开更多
关键词 职业举报人 类不平衡 特征选择 数据驱动 12358价格监管平台
在线阅读 下载PDF
基于filter+wrapper模式的特征选择算法 预览
2
作者 周传华 柳智才 +1 位作者 丁敬安 周家亿 《计算机应用研究》 CSCD 北大核心 2019年第7期1975-1979,2010共6页
特征选择是数据挖掘、机器学习和模式识别中始终面临的一个重要问题。针对类和特征分布不均时,传统信息增益在特征选择中存在的选择偏好问题,提出了一种基于信息增益率与随机森林的特征选择算法。该算法结合filter和wrapper模式的优点,... 特征选择是数据挖掘、机器学习和模式识别中始终面临的一个重要问题。针对类和特征分布不均时,传统信息增益在特征选择中存在的选择偏好问题,提出了一种基于信息增益率与随机森林的特征选择算法。该算法结合filter和wrapper模式的优点,首先从信息相关性和分类能力两个方面对特征进行综合度量,然后采用序列前向选择(sequential forward selection,SFS)策略对特征进行选择,并以分类精度作为评价指标对特征子集进行度量,从而获取最优特征子集。实验结果表明,该算法不仅能够达到特征空间降维的效果,而且能够有效提高分类算法的分类性能和查全率。 展开更多
关键词 信息增益率 随机森林 特征选择 filter模式 wrapper模式
在线阅读 下载PDF
基于混合ABC和CRO的高维特征选择方法 预览
3
作者 张戈 王建林 《计算机工程与应用》 CSCD 北大核心 2019年第11期93-101,共9页
高维数据集包含了成千上万可用于数据分析和预测的特征,然而这些数据集存在许多不相关或冗余特征,影响了数据分析和预测的准确性。现有分类技术难以准确地识别最佳特征子集。针对该问题,提出了一种基于wrapper模式的特征选择方法 AB-CRO... 高维数据集包含了成千上万可用于数据分析和预测的特征,然而这些数据集存在许多不相关或冗余特征,影响了数据分析和预测的准确性。现有分类技术难以准确地识别最佳特征子集。针对该问题,提出了一种基于wrapper模式的特征选择方法 AB-CRO,该方法结合了人工蜂群算法(ABC)和改进的化学反应算法(CRO)的优点进行特征选择。针对迭代过程中较优的个体可能在化学反应过程中被消耗掉的现象,适当地加入精英策略来保持种群的优良性。实验结果表明,AB-CRO算法在最佳特征子集的识别和分类精度方面相对于基准算法ABC,CRO以及基于GA,PSO和混合蛙跳算法都所有改进。 展开更多
关键词 特征选择 生物数据 人工蜂群算法 化学反应优化算法 精英保留策略
在线阅读 下载PDF
面向序数回归的组合特征提取方法 预览
4
作者 曾庆田 刘晨征 +1 位作者 倪维健 段华 《计算机科学》 CSCD 北大核心 2019年第6期69-74,共6页
序数回归(也称序数分类)是一种监督学习任务,即使用具有自然顺序的标签对数据项进行分类。序数回归与诸多实际问题密切相关,近几年关于序数回归的研究受到越来越多的关注。序数回归与其他监督学习任务(分类、回归等)一样,需要通过特征... 序数回归(也称序数分类)是一种监督学习任务,即使用具有自然顺序的标签对数据项进行分类。序数回归与诸多实际问题密切相关,近几年关于序数回归的研究受到越来越多的关注。序数回归与其他监督学习任务(分类、回归等)一样,需要通过特征提取来提高模型的效率和准确性。虽然特征提取被广泛研究并用于分类学习任务中,但是在序数回归中的研究较少。众所周知,相比单特征,组合特征可以表达更多的数据底层语义,但是加入一般的组合特征很难提高模型的准确性。文中基于频繁模式挖掘,借助K-L散度值来选取最有区分能力的频繁模式进行特征组合,提出了一种新的序数回归组合特征提取方法,并在公开数据集和自有数据集上使用多个序数回归模型进行实验。结果表明,使用最有区分能力的频繁模式组合特征,能够有效提升大多数序数回归模型的训练效果。 展开更多
关键词 序数回归 频繁模式 特征组合 特征选择
在线阅读 免费下载
基于改进集成学习算法的在线空气质量预测 预览
5
作者 夏润 张晓龙 《武汉科技大学学报:自然科学版》 CAS 北大核心 2019年第1期61-67,共7页
为了实现空气质量的在线预测,提出了一种基于XGBoost算法的改进集成学习算法OPGBoost.首先对PI(plant information)实时数据库系统进行二次开发,构成大数据挖掘与分析平台,运用数据融合工具对原始数据进行预处理,并采用Boruta算法进行... 为了实现空气质量的在线预测,提出了一种基于XGBoost算法的改进集成学习算法OPGBoost.首先对PI(plant information)实时数据库系统进行二次开发,构成大数据挖掘与分析平台,运用数据融合工具对原始数据进行预处理,并采用Boruta算法进行特征选择,从而构造出包含更多属性特征量的有效数据集.然后对XGBoost算法中的一阶和二阶导数进行优化,并通过时间滑动窗口和衰减函数机制获取训练数据以及训练模型的权重,最后采用Bagging集成学习策略构成OPGBoost组合模型.实验结果表明,针对基于PM2.5浓度和AQI表征的空气质量预测,本文方法与4种已有算法相比在准确性和实用性方面具有明显的优势,能够较精确地预测未来1、12、24h的空气污染情况. 展开更多
关键词 空气质量预测 XGBoost算法 衰减函数 BAGGING 集成学习 特征选择 PM2.5 AQI
在线阅读 下载PDF
基于深度学习的局部方向人脸识别算法研究 预览
6
作者 公维军 吴建军 +1 位作者 李晓霞 李晓旭 《计算机与数字工程》 2019年第5期1032-1036,1135共6页
论文针对人脸识别中的特征选择和单一算法的局限性问题,提出了一种基于深度学习的局部方向人脸识别算法。首先通过定位和分块选取人脸局部敏感区域,然后依次利用LDP算法良好的局部特征提取能力对精选分块区域进行特征提取并最终连接成... 论文针对人脸识别中的特征选择和单一算法的局限性问题,提出了一种基于深度学习的局部方向人脸识别算法。首先通过定位和分块选取人脸局部敏感区域,然后依次利用LDP算法良好的局部特征提取能力对精选分块区域进行特征提取并最终连接成新的特征脸,然后利用深度学习网络DBN进行逐层贪婪训练,获得良好的网络参数,最后用训练好的网络对测试样本进行人脸测试分类。依次在ORL和MIT-CBCL人脸数据库上进行实验检测,实验结果表明,论文提出的算法与传统单一或融合算法具有更高的识别率,具有良好的局部性能和抗干扰性。 展开更多
关键词 局部方向模式 局部敏感 深度学习 特征选择 人脸识别
在线阅读 下载PDF
FSDNP:针对软件缺陷数预测的特征选择方法 预览
7
作者 李叶飞 官国飞 +3 位作者 葛崇慧 陈翔 倪超 钱柱中 《计算机工程与应用》 CSCD 北大核心 2019年第14期61-68,共8页
软件缺陷预测先前的研究工作主要关注软件缺陷分类问题,即判断一个软件模块是否含有缺陷。如何量化一个软件模块中含有软件缺陷的数量问题还未被很好地研究。针对该问题,提出了一种两阶段的软件模块缺陷数预测特征选择方法FSDNP:特征聚... 软件缺陷预测先前的研究工作主要关注软件缺陷分类问题,即判断一个软件模块是否含有缺陷。如何量化一个软件模块中含有软件缺陷的数量问题还未被很好地研究。针对该问题,提出了一种两阶段的软件模块缺陷数预测特征选择方法FSDNP:特征聚类阶段和特征选择阶段。在特征聚类阶段中,使用基于密度峰聚类的算法将高度相关的特征进行聚类;在特征选择阶段,设计了三种启发式的排序策略从簇中删除冗余的和无关的特征。在PROMISE数据集上,使用平均错误率和平均相对错误率指标,与6个经典的方法进行了比较。实验结果表明,FSDNP能够有效移除冗余的和无关的特征,构建高效的软件缺陷数预测模型。 展开更多
关键词 软件质量保障 软件缺陷数预测 特征选择 实证研究
在线阅读 下载PDF
基于MPGA的混合特征选择算法在驾驶压力检测中的应用 预览
8
作者 张傲 陈兰岚 魏琛 《华东理工大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期125-132,共8页
针对多源生理信号应用于驾驶压力检测中存在信号种类多、特征维数高以及运算效率低的问题,提出了一种结合特征选择(ReliefF)算法、最大相关最小冗余(MRMR)算法和多种群遗传算法(MPGA)的混合特征选择算法。首先利用ReliefF算法计算特征... 针对多源生理信号应用于驾驶压力检测中存在信号种类多、特征维数高以及运算效率低的问题,提出了一种结合特征选择(ReliefF)算法、最大相关最小冗余(MRMR)算法和多种群遗传算法(MPGA)的混合特征选择算法。首先利用ReliefF算法计算特征信号的权重值,初选出对分类效果影响显著的特征子集;然后利用MRMR算法去掉冗余的特征,进一步精简特征子集;在此基础上采用MPGA挑选出效果最佳的特征子集。将该算法应用于驾驶压力检测,并与其他类似算法进行了对比。实验结果表明,该算法有效地消除了高维特征中的冗余信息,提高了特征选择阶段的运算效率且达到了很好的分类效果。 展开更多
关键词 生理信号 RELIEFF算法 MRMR算法 MPGA算法 特征选择 驾驶压力检测
在线阅读 下载PDF
专利价值评估与分类研究--基于自组织映射支持向量机
9
作者 周成 魏红芹 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第5期117-124,共8页
【目的】充分利用专利数据,研究专利价值评估和分类问题。【方法】根据专利的价值指标,设计基于自组织映射(SOM)–支持向量机(SVM)的专利价值评估及分类模型,使用自组织映射方法确定专利的价值类别,采用随机森林(RF)对价值指标进行重要... 【目的】充分利用专利数据,研究专利价值评估和分类问题。【方法】根据专利的价值指标,设计基于自组织映射(SOM)–支持向量机(SVM)的专利价值评估及分类模型,使用自组织映射方法确定专利的价值类别,采用随机森林(RF)对价值指标进行重要性排序,并结合包裹式特征选择方法对价值指标进行约简,以提高SVM的分类性能。【结果】通过SOM确定的价值标签能有效反映专利价值的高低;同时,约简后的指标由初始的14个减少到10个,分类准确率由76.28%提高到86.89%。【局限】对每个类别中的专利价值没有细化,专利价值指标存在进一步约减的可能。【结论】本文方法能够为专利研发活动提供支持,避免过度依赖专家判断。 展开更多
关键词 专利价值评估 数据聚类 专利价值分类 特征选择 自组织映射 支持向量机
用户隐式行为挖掘在抗信誉共谋中的应用研究
10
作者 梁家铭 赵洁 +1 位作者 Jianlong Zhou 董振宁 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第5期125-138,共14页
【目的】探究和验证用户隐式行为数据的挖掘方法及结果对信誉共谋攻击识别模型精度提升的效果。【方法】提出用户融合隐式行为分析的总体框架,提取隐式行为特征;设计两阶段综合特征选择方法,选择多个高辨别力的特征。【结果】利用电子... 【目的】探究和验证用户隐式行为数据的挖掘方法及结果对信誉共谋攻击识别模型精度提升的效果。【方法】提出用户融合隐式行为分析的总体框架,提取隐式行为特征;设计两阶段综合特征选择方法,选择多个高辨别力的特征。【结果】利用电子商务中的大量数据实验验证了用户隐式行为挖掘在抗信誉共谋中的有效性,对共谋者的识别能力优于显式特征。【局限】攻击者和合法用户隐式数据规模仍需要进一步扩大。【结论】融入用户隐式行为挖掘可较大幅度提升信誉共谋识别模型的精度。 展开更多
关键词 隐式行为 特征选择 信誉共谋 攻击识别
基于随机森林算法的原始土壤图更新研究 预览
11
作者 周紫燕 黄魏 +2 位作者 许伟 傅佩红 望陈运 《华中农业大学学报》 CAS CSCD 北大核心 2019年第3期53-59,共7页
以湖北省黄冈市红安县华家河镇滠水河流域为研究区,利用随机森林算法(randomforest,RF)结合多源环境变量,对研究区原有的土壤图斑进行分解制图,将混合多种土壤类型的复合土壤图斑进行细化,在土壤多边形内部画出新的边界来代表单一土壤类... 以湖北省黄冈市红安县华家河镇滠水河流域为研究区,利用随机森林算法(randomforest,RF)结合多源环境变量,对研究区原有的土壤图斑进行分解制图,将混合多种土壤类型的复合土壤图斑进行细化,在土壤多边形内部画出新的边界来代表单一土壤类型,并通过373个实地采样点验证更新后的土壤图。结果显示,更新后的土壤图其制图精度从原有的63%提高到了76%,展现了更为详细的空间细节和空间变化信息,表明利用随机森林算法进行数字土壤制图的可行性和可靠性。 展开更多
关键词 土壤类型 环境因子 光谱信息 随机森林算法 特征选择 制图精度
在线阅读 免费下载
自适应特征选择的相关滤波跟踪算法
12
作者 刘万军 孙虎 姜文涛 《光学学报》 EI CAS CSCD 北大核心 2019年第6期234-247,共14页
针对相关滤波方法对快速运动与快速变形的目标跟踪稳定性较差的问题,提出一种自适应特征选择的相关滤波跟踪算法。利用位置滤波器和颜色概率模型提取候选区域中的基础特征,对基础特征以不同的权重分配方式进行融合,得到多个融合特征。... 针对相关滤波方法对快速运动与快速变形的目标跟踪稳定性较差的问题,提出一种自适应特征选择的相关滤波跟踪算法。利用位置滤波器和颜色概率模型提取候选区域中的基础特征,对基础特征以不同的权重分配方式进行融合,得到多个融合特征。对融合特征进行可信度判定,选择可信度较高的融合特征作为当前帧的跟踪特征,估计出目标的候选位置。若最高可信度低于可信度阈值,启动检测器重新检测目标位置,否则候选位置即为目标最终位置。与此同时,对目标模型进行更新,确保模型对目标描述的准确性。在标准数据集OTB50和OTB100上进行大量实验,测试结果表明,所提出的跟踪方法在运动模糊、光照变化、快速运动等条件下具有较高的跟踪准确率和较好的稳健性。 展开更多
关键词 机器视觉 目标跟踪 相关滤波 颜色统计 尺度变换 特征选择
基于单类图分类的化合物分类方法 预览
13
作者 王晓东 张阳 王美丽 《计算机工程与设计》 北大核心 2019年第3期748-754,共7页
为减少新药设计过程中化合物筛选与结构优化的成本,提高筛选与优化的精确性,提出一种用于化合物分类的单类图分类方法。对化合物的严格拓扑结构提出优化频繁子图的方法选取特征子图,自适应地挖掘每阶段支持度下信息量表示更全的闭频繁子... 为减少新药设计过程中化合物筛选与结构优化的成本,提高筛选与优化的精确性,提出一种用于化合物分类的单类图分类方法。对化合物的严格拓扑结构提出优化频繁子图的方法选取特征子图,自适应地挖掘每阶段支持度下信息量表示更全的闭频繁子图,将提取的频繁子图作为特征样本输入,通过Adaboost集成一类支持向量机分类算法训练分类模型。实验结果表明,该方法可以明确提取相关性较高的频繁子结构,显著降低频繁子图挖掘后的特征空间,有效提高分类的准确性和泛化性。 展开更多
关键词 图分类 频繁子图挖掘 特征选择 单类分类 自适应增强
在线阅读 下载PDF
基于改进分离阈值法的农作物遥感精细分类特征选择 预览
14
作者 杨惠雯 方俊永 赵冬 《应用科学学报》 CAS CSCD 北大核心 2019年第1期51-63,共13页
为综合利用高空间分辨率可见光和红外遥感影像特征,提高分类处理效率,在分离阈值法的基础上提出一种结合图像二维熵的特征选择方法,解决了分离阈值法在特征选择时未考虑特征信息量的问题.利用随机森林分类器对选取后的特征子集进行农作... 为综合利用高空间分辨率可见光和红外遥感影像特征,提高分类处理效率,在分离阈值法的基础上提出一种结合图像二维熵的特征选择方法,解决了分离阈值法在特征选择时未考虑特征信息量的问题.利用随机森林分类器对选取后的特征子集进行农作物分类,并在同样的分类方法下与改进自适应波段选择方法和基于图像熵的密度峰值聚类波段选择方法进行分类精度对比.结果表明,所提出的方法既可提高分类精度和分类效率,又能降低特征选择的数量,还能进一步量化分析所选取的特征对各地物识别的效果. 展开更多
关键词 航空热红外遥感影像 分离阈值 图像熵 随机森林 精细分类 特征选择
在线阅读 下载PDF
基于加权社区检测与增强人工蚁群算法的高维数据特征选择 预览
15
作者 巫红霞 谢强 《计算机应用与软件》 北大核心 2019年第9期285-292,301共9页
为了提高高维数据特征选择的时间效率、降低特征选择的冗余度与不相关性,提出一种基于加权社区检测与增强人工蚁群算法的高维数据特征选择算法。设计加权的社区检测算法,将特征相似性作为社区划分的模块度,根据特征判别力为社区分配不... 为了提高高维数据特征选择的时间效率、降低特征选择的冗余度与不相关性,提出一种基于加权社区检测与增强人工蚁群算法的高维数据特征选择算法。设计加权的社区检测算法,将特征相似性作为社区划分的模块度,根据特征判别力为社区分配不同的权重;通过人工蚁群算法并行地处理每个特征分类,将每个特征分类按优劣程度组成队列;选出每个队列的top-k特征子集做全局比较,提取全局最优的特征子集。仿真实验结果表明,该算法对于高维数据集实现了较好的特征提取结果,并且实现了合理的时间成本。 展开更多
关键词 高维数据 大数据 特征选择 数据分析 社区检测 人工蚁群算法
在线阅读 下载PDF
基于随机森林的WebShell检测方法 预览
16
作者 秦英 《计算机系统应用》 2019年第2期240-245,共6页
WebShell根据其功能和大小可以分为多种类型,各种类型的WebShell在基本特征上又有其独有的特征,而现有的WebShell检测大多从单一层面提取特征,无法较全面的覆盖各种类型WebShell全部特征,具有种类偏向性,无差别的检测效果差,泛化能力弱... WebShell根据其功能和大小可以分为多种类型,各种类型的WebShell在基本特征上又有其独有的特征,而现有的WebShell检测大多从单一层面提取特征,无法较全面的覆盖各种类型WebShell全部特征,具有种类偏向性,无差别的检测效果差,泛化能力弱等问题.针对这一问题,提出了一种基于随机森林的WebShell检测方法.该方法在数据预处理阶段分别提取文本层的统计特征和文本层源码与编译结果层字节码(opcode)的序列特征,构成较全面的组合特征,然后通过Fisher特征选择选取适当比例的重要特征,降低特征维度,构成样本的特征集,最后采用随机森林分类器训练样本得到检测模型.通过实验表明,本检测方法能有效地检测WebShell,并在准确率、召回率和误报率上都优于单一层面的WebShell检测模型. 展开更多
关键词 WEBSHELL 随机森林 组合特征 特征选择
在线阅读 下载PDF
基于近邻图正则化的高光谱图像特征选择方法
17
作者 彭艳斌 郑志军 +3 位作者 邱薇薇 李晓勇 潘志刚 金诚 《光电子.激光》 EI CAS CSCD 北大核心 2019年第2期192-199,共8页
高光谱图像分类是近年来的研究热点。其数据的高维性引发了"维度灾难"问题。数据降维成为解决问题的关键。针对高光谱数据有标记训练样本点匮乏的特点,提出用无监督的特征选择方法对高光谱数据进行降维。该方法能够同时保持... 高光谱图像分类是近年来的研究热点。其数据的高维性引发了"维度灾难"问题。数据降维成为解决问题的关键。针对高光谱数据有标记训练样本点匮乏的特点,提出用无监督的特征选择方法对高光谱数据进行降维。该方法能够同时保持原始高光谱数据的判别能力和局部几何结构。为了保持判别能力,用所选特征对原始高光谱数据进行重构,利用重构误差最小化将特征选择问题转化为优化问题。为了保持局部几何结构,建立近邻图,并将其转化为正则项加入目标函数中。通过迭代梯度下降方法解此优化问题,得出优选特征子集参与高光谱图像分类识别任务。在真实数据集上的实验表明,新方法能够提高分类识别的精度。 展开更多
关键词 高光谱图像 分类 降维 特征选择 近邻图
基于模糊互信息的多标签特征选择 预览
18
作者 张毅斌 马盈仓 《河南科学》 2019年第4期521-527,共7页
多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊... 多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊互信息的多标签特征选择算法.最后在同一准则下,将模糊互信息与原先的互信息特征选择算法及其他几种经典的特征选择算法进行比较.实验表明,此方法在一定程度上效果优于其他特征选择算法,是一种有效的多标签分类问题的特征选择方法. 展开更多
关键词 特征选择 互信息 模糊互信息
在线阅读 下载PDF
缺失数据的维数增量式特征选择 预览
19
作者 刘吉超 王锋 宋鹏 《计算机工程与应用》 CSCD 北大核心 2019年第17期95-99,共5页
现如今生活当中的数据大多都是动态变化的,并且在数据动态增加的过程中,许多特征中包含有缺失数据。如何处理动态变化的含有缺失数据的数据集的特征选择成为一个亟需解决的问题。为此,基于粗糙集理论,通过更新互补信息熵在含有缺失数据... 现如今生活当中的数据大多都是动态变化的,并且在数据动态增加的过程中,许多特征中包含有缺失数据。如何处理动态变化的含有缺失数据的数据集的特征选择成为一个亟需解决的问题。为此,基于粗糙集理论,通过更新互补信息熵在含有缺失数据的数据集维数增加时的更新机制,进而提出一种缺失数据维数增量式特征选择算法,并通过实验进一步验证了算法的可行性与高效性。 展开更多
关键词 缺失数据 粗糙集 互补信息熵 特征选择
在线阅读 下载PDF
基于互信息和半监督学习的入侵检测研究 预览
20
作者 石凯 《现代计算机》 2019年第23期18-23,共6页
针对不同攻击需要检测的数据量较大而有标记数据较少导致检测效率低,特征定性分析不准确而导致检测精度较低的问题,提出一种新型的基于相关性和冗余度的半监督入侵检测方案。在标记流量数据样本较少的情况下,采用半监督学习方法。该方... 针对不同攻击需要检测的数据量较大而有标记数据较少导致检测效率低,特征定性分析不准确而导致检测精度较低的问题,提出一种新型的基于相关性和冗余度的半监督入侵检测方案。在标记流量数据样本较少的情况下,采用半监督学习方法。该方法利用少量已标记样本得到其他未标记大量样本的标记,从而获得大量有标记样本;由于标签数据包的特征隐含信息多样,不同特征包含的分类信息量不同,导致准确率降低。引入相关性和冗余度的度量,尽可能保留有效特征,增加对已知和未知攻击的检测效率。实验结果表明:该方案能够利用少量标记的数据,在网络流量中区分未知攻击和已知攻击,并且有较高的检测准确率和检测效率。 展开更多
关键词 入侵检测 特征选择 半监督学习 最大相关最小冗余
在线阅读 免费下载
上一页 1 2 187 下一页 到第
使用帮助 返回顶部 意见反馈