期刊文献+
共找到552篇文章
< 1 2 28 >
每页显示 20 50 100
加权朴素贝叶斯算法在消防检测中的应用 预览
1
作者 童威 黄启萍 《西安工程大学学报》 CAS 2019年第1期111-115,共5页
针对当前建筑物消防检测受干扰影响较大,导致火灾预测精度较低的问题,给出一种用于消防检测的改进朴素贝叶斯算法。基于消防检测数据分析,通过信息增益计算加权值,将特征属性附加权重系数对朴素贝叶斯算法进行改进,并在此基础上通过Wek... 针对当前建筑物消防检测受干扰影响较大,导致火灾预测精度较低的问题,给出一种用于消防检测的改进朴素贝叶斯算法。基于消防检测数据分析,通过信息增益计算加权值,将特征属性附加权重系数对朴素贝叶斯算法进行改进,并在此基础上通过Weka平台,设计并实现了改进朴素贝叶斯算法框架,将其用于消防检测。实验验证,比较朴素贝叶斯算法和其他分类预测方法,改进的朴素贝叶斯算法能有效解决每个特征属性对类别变量影响的关联度量化问题,降低了分类干扰,提高了消防隐患检测准确率。 展开更多
关键词 消防检测 属性加权 朴素贝叶斯算法 信息增益 权重
在线阅读 下载PDF
基于概率分布的相机内参优化方法 预览
2
作者 刘文庆 冯锋 《现代电子技术》 北大核心 2019年第5期48-52,共5页
相机参数的准确性决定后续视觉任务的实现结果,为了提高相机校准的准确性,提出一种基于概率分布异常值去除和信息增益的内参确定方法。首先用一个摄像机对某个确定规格的棋盘图获取一组图片集,从图片集中随机选取一定数量的图片,使用张... 相机参数的准确性决定后续视觉任务的实现结果,为了提高相机校准的准确性,提出一种基于概率分布异常值去除和信息增益的内参确定方法。首先用一个摄像机对某个确定规格的棋盘图获取一组图片集,从图片集中随机选取一定数量的图片,使用张氏标定法做N组标定实验;然后将标定结果集按照其服从的概率分布进行异常值去除,将剩余的数据集中各个内参因素值分为3类,并且选择当前根节点下信息增益最大的参数类为最优节点,即以信息增益最大为主线选择最优路线;最后通过对最优路线中标定精度较高的结果集使用中值来估计相机参数。实验结果证明该方法与原始方法比较,提高了准确性。 展开更多
关键词 相机校准 概率分布 3D重建 相机内参 信息增益 最优路线
在线阅读 下载PDF
步态识别特征的提取和重要性排序 预览
3
作者 王浩伦 朱业安 +3 位作者 徐唯祎 徐苒 黄月姑 卢巍 《中国医学物理学杂志》 CSCD 2019年第7期811-817,共7页
提出一种基于骨骼关键点检测技术的步态识别方法,并讨论常见的步态特征在障碍诊断时的重要性排序,以期为步态障碍的及时检查和识别提供参考。首先,根据不同的步态模式设立试验组和对照组,受试者按照要求分别完成规定的范式动作,经由深... 提出一种基于骨骼关键点检测技术的步态识别方法,并讨论常见的步态特征在障碍诊断时的重要性排序,以期为步态障碍的及时检查和识别提供参考。首先,根据不同的步态模式设立试验组和对照组,受试者按照要求分别完成规定的范式动作,经由深度相机实时获取受试者骨骼关键点的运动轨迹数据;然后,从获取的数据中提取步态识别特征;最后,采用以信息增益为依据的模糊二元对比决策方法对步态识别特征的重要度进行排序。通过对每个特征的重要性进行排序,为步态障碍的诊断和自动识别提供参考。研究结果表明3种步态模式下所有步态识别特征的平均值之间均有显著差异,特征的优先排序为步频、膝关节最大屈曲角度、足偏角、髋关节最大屈曲角度、步幅、支撑相、步速、髋关节最大伸展角度、质心左右移动、膝关节最大伸展角度、质心上下移动、步长、步宽。 展开更多
关键词 步态障碍 步态识别 深度相机 信息增益 特征排序
在线阅读 免费下载
基于属性相容性的随机森林算法 预览
4
作者 刘毓 刘陆 +1 位作者 高尹 杨柳 《西安邮电大学学报》 2019年第3期71-75,共5页
针对基分类器算法偏向选择多值属性以及大量对数运算引起运算复杂的问题,提出一种基于属性相容性的随机森林算法。引入粗糙集中的属性相容性,计算各个条件属性的相容度,利用宽相容度辅助严相容度构建分割属性的划分规则,重建基分类器的... 针对基分类器算法偏向选择多值属性以及大量对数运算引起运算复杂的问题,提出一种基于属性相容性的随机森林算法。引入粗糙集中的属性相容性,计算各个条件属性的相容度,利用宽相容度辅助严相容度构建分割属性的划分规则,重建基分类器的信息增益或信息增益率表达式。实验结果表明,改进算法在保持对数据量较多时有较高分类准确率前提下,对数据量较少时的分类准确率有显著提升,且降低了运算复杂度。 展开更多
关键词 决策树 随机森林 相容度 信息增益
在线阅读 下载PDF
基于无线访问节点选择的煤矿井下定位方法 预览
5
作者 季鹏 赵培培 +1 位作者 宋明智 张柯楠 《工矿自动化》 北大核心 2019年第6期69-72,共4页
针对量子粒子群优化-基于阶次序列定位(QPSO-SBL)方法定位精度较低的问题,采用基于信息增益的无线访问节点(AP)选择算法对其进行优化,由此提出了一种基于无线AP选择的煤矿井下定位方法。该方法根据AP的综合可辨识性按照降序对所有AP进... 针对量子粒子群优化-基于阶次序列定位(QPSO-SBL)方法定位精度较低的问题,采用基于信息增益的无线访问节点(AP)选择算法对其进行优化,由此提出了一种基于无线AP选择的煤矿井下定位方法。该方法根据AP的综合可辨识性按照降序对所有AP进行排列,选取前k个AP组成可用AP集合,将可用AP集合作为QPSO-SBL方法的输入量,通过QPSO-SBL方法得出定位结果。试验结果表明,基于无线AP选择的煤矿井下定位方法较QPSO-SBL方法的平均定位误差降低了约10.2%,整体稳定性较强,定位效果较好。 展开更多
关键词 煤矿井下定位 无线传感网络 信息增益 AP选择 QPSO-SBL方法
在线阅读 下载PDF
基于Logistic回归模型的P2P借款人信用违约风险评估模型研究 预览
6
作者 陈雪莲 潘美芹 《上海管理科学》 2019年第3期7-10,共4页
针对P2P网络信贷平台信用风险特点,以借款人违约情况为被解释变量,运用Logistic回归方法建立借款人信用违约风险评估模型。原始数据从人人贷网站抓取获得,选取的原始评估变量有24个,通过信息增益进行指标降维,得到19个解释变量,并以此... 针对P2P网络信贷平台信用风险特点,以借款人违约情况为被解释变量,运用Logistic回归方法建立借款人信用违约风险评估模型。原始数据从人人贷网站抓取获得,选取的原始评估变量有24个,通过信息增益进行指标降维,得到19个解释变量,并以此建立了Logistic回归模型。通过五步逐次回归得出,性别、逾期次数、逾期金额、身份认证和学历认证等5个因素作为评价个人信用风险的主要依据,并建立了Logistic回归模型。回归模型的判别准确率表明所构建的借款人信用风险评估模型预测效果较好。 展开更多
关键词 P2P网络借贷 信用违约风险 LOGISTIC回归模型 信息增益
在线阅读 下载PDF
基于改进信息增益特征选择法的SVM中文情感分类算法 预览
7
作者 王根生 黄学坚 +1 位作者 吴小芳 胡向亮 《成都理工大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期105-110,共6页
为文本情感分类提出一种改进的机器学习算法。在分析当前主要文本特征选择方法后,把词频和词语情感表现程度融入到信息增益特征选择方法中,从全局和局部2个方面进行特征权重衡量,使用特征空间向量模型对文本进行统一表示,然后利用SVM算... 为文本情感分类提出一种改进的机器学习算法。在分析当前主要文本特征选择方法后,把词频和词语情感表现程度融入到信息增益特征选择方法中,从全局和局部2个方面进行特征权重衡量,使用特征空间向量模型对文本进行统一表示,然后利用SVM算法进行训练学习。通过实验发现该算法的查准率和查全率比传统的机器学习算法有所提高,并且得到的分类器具有较好的泛化能力。 展开更多
关键词 情感分类 机器学习 SVM 信息增益
在线阅读 下载PDF
基于模糊粗糙集属性约简与GMM-LDA最优聚类簇特征学习的自适应网络入侵检测
8
作者 刘金平 张五霞 +2 位作者 唐朝晖 何捷舟 徐鹏飞 《控制与决策》 EI CSCD 北大核心 2019年第2期243-251,共9页
网络入侵方式已日趋多样化,其隐蔽性强且变异性快,开发灵活度高、适应性强的实时网络安全监测系统面临严峻挑战.对此,提出一种基于模糊粗糙集属性约简(FRS-AR)和GMM-LDA最优聚类簇特征学习(GMM-LDA-OCFL)的自适应网络入侵检测(ANID)方法... 网络入侵方式已日趋多样化,其隐蔽性强且变异性快,开发灵活度高、适应性强的实时网络安全监测系统面临严峻挑战.对此,提出一种基于模糊粗糙集属性约简(FRS-AR)和GMM-LDA最优聚类簇特征学习(GMM-LDA-OCFL)的自适应网络入侵检测(ANID)方法.首先,引入一种基于模糊粗糙集(FRS)信息增益率的属性约简(AR)方法以实现网络连接数据最优属性集选择;然后,提出一种基于GMM-LDA的最优聚类簇特征学习方法,以获得正常模式特征库和入侵模式库的最优特征表示,同时引入模式库自适应更新机制,使入侵检测模型能够适应网络环境动态变化. KDD99数据集和基于Nidsbench的网络虚拟仿真实验平台的入侵检测结果表明,所提出的ANID方法能有效适应网络环境动态变化,可实时检测出真实网络连接数据中的各种入侵行为,其性能优于当前常用的入侵检测方法,应用前景广阔. 展开更多
关键词 入侵检测 高斯混合模型聚类 模式匹配 模糊粗糙集 信息增益 模式更新
基于IG-DNN混合决策算法的糖尿病预测研究 预览
9
作者 卢春城 黄理灿 刘靖雯 《软件导刊》 2019年第8期21-25,共5页
糖尿病患者人数众多,对人的健康危害极大,尽早预测是否患有糖尿病是降低糖尿病死亡率的关键。基于IG-DNN混合决策算法进行糖尿病预测模型研究,其中糖尿病数据集来源于UCI机器学习库-PIDD。PIDD包括768个记录,每条记录包含8个属性。首先... 糖尿病患者人数众多,对人的健康危害极大,尽早预测是否患有糖尿病是降低糖尿病死亡率的关键。基于IG-DNN混合决策算法进行糖尿病预测模型研究,其中糖尿病数据集来源于UCI机器学习库-PIDD。PIDD包括768个记录,每条记录包含8个属性。首先应用信息增益方法(IG)将属性减少到5个,然后将其应用于DNN作为输入。该方法分类准确度达到88.3%,效果优于之前的大部分研究成果。 展开更多
关键词 糖尿病预测模型 PIDD 信息增益(IG) 深度神经网络(DNN)
在线阅读 免费下载
基于决策树算法的空气质量预测系统 预览
10
作者 徐旭冉 涂娟娟 《电子设计工程》 2019年第9期39-42,共4页
针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污... 针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污染指数固定数值区间的划分来评估空气质量。而基于决策树算法的空气质量评估模型通过采用自顶向下的递归方式对数据进行处理,把一个无序、无规则的实例集合归纳成一组树形结构表示的分类规则,得到了将所有污染参数作为评估空气质量因素的评估模型,可以有效的避免传统的空气质量预报模型的不灵活、边界值不准确的特点。同时可以根据季节和地区等外部因素构建不同的空气质量预测模型以应对外部因素的变化,从而可以构建完整,精确,现代化的空气质量智能预测系统。 展开更多
关键词 机器学习 决策树 空气质量预测 C4.5算法 信息增益 PYTHON
在线阅读 下载PDF
一种基于改进信息增益特征选择的最大熵模型文本分类方法 预览
11
作者 何明 《西南师范大学学报:自然科学版》 CAS 北大核心 2019年第3期113-118,共6页
针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分... 针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分类精度,并将该改进IG特征选择算法用于最大熵模型(ME)对文本进行分类.实验结果表明:该文所提方法在进行文本分类时F1值高于传统IG算法.该文方法的ME分类精度高于K最近邻KNN(K-Nearest Neighbor)算法,说明本文方法是可行的、有效的. 展开更多
关键词 信息增益 均衡比 词频参数 最大熵模型
在线阅读 免费下载
融合GINI指数的ID3改进算法 预览
12
作者 罗计根 杜建强 +2 位作者 聂斌 李欢 贺佳 《南昌大学学报:工科版》 CAS 2019年第1期80-84,共5页
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的GINI指数算术平均值,筛选GINI指数低于算术平均值的属性记为... 针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的GINI指数算术平均值,筛选GINI指数低于算术平均值的属性记为候选属性集;从候选属性集中选择信息增益最大的属性建立分支,用递归方法构建决策树。实验使用6组UCI数据集进行验证。结果表明:该决策树的准确率均有所提高,对多值偏向问题有很好的克服作用。 展开更多
关键词 决策树 ID3算法 信息增益 GINI指数
在线阅读 下载PDF
基于信息增益的中医体质多标记分类方法研究 预览
13
作者 吕庆莉 《中国中医药信息杂志》 CAS CSCD 2019年第6期97-100,共4页
目的为降低中医体质传统分类方法主观性误差,兼顾兼夹体质,提出基于信息增益的中医体质多标记分类方法。方法采用多标记方法进行中医体质分类。为解决多标记分类方法中不同特征对分类标签的影响不同的问题,通过体质分类数据计算各特征... 目的为降低中医体质传统分类方法主观性误差,兼顾兼夹体质,提出基于信息增益的中医体质多标记分类方法。方法采用多标记方法进行中医体质分类。为解决多标记分类方法中不同特征对分类标签的影响不同的问题,通过体质分类数据计算各特征项的信息增益,计算体质分类特征对分类标签的权重,进而通过加权的多标签分类器,得出体质数据多标记分类。结果与传统判别分析法相比,基于信息增益的多标记分类方法在1-错误率(16.33%)、汉明损失(15.44%)、平均准确率(82.61%)方面均有一定优势。结论基于信息增益的多标记分类方法在保证准确率同时可兼顾兼夹体质,实现对体质特征差异性及趋同性的更好描述。 展开更多
关键词 中医体质分类 信息增益 多标记分类
在线阅读 下载PDF
基于改进Grassberger熵随机森林分类器的目标检测
14
作者 马娟娟 潘泉 +3 位作者 梁彦 胡劲文 赵春晖 郭亚宁 《中国激光》 EI CAS CSCD 北大核心 2019年第7期230-238,共9页
对Grassberger熵进行改进,采用改进的Grassberger熵计算信息增益,选择分裂节点的最优分裂属性训练随机森林分类器,利用经过训练的随机森林分类器预测选择性搜索生成的子窗口是否包含目标。对每个训练样本及子窗口提取1个归一化梯度幅值... 对Grassberger熵进行改进,采用改进的Grassberger熵计算信息增益,选择分裂节点的最优分裂属性训练随机森林分类器,利用经过训练的随机森林分类器预测选择性搜索生成的子窗口是否包含目标。对每个训练样本及子窗口提取1个归一化梯度幅值、3个LUV颜色通道和6个梯度方向直方图的特征。在SenseAndAvoid数据集上测试了所提方法的性能,取得了73.2%的平均检测准确率。结果表明:安全包络范围内的平均检测准确率高于98%。利用改进的Grassberger熵计算信息增益,能提高目标检测的准确率。 展开更多
关键词 测量 目标检测 改进的Grassberger熵 随机森林分类器 信息增益
面向中文短文本情感分析的改进特征选择算法 预览
15
作者 王荣波 沈卓奇 +1 位作者 黄孝喜 谌志群 《杭州电子科技大学学报:自然科学版》 2019年第1期45-50,共6页
在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取短文本特征,为此,提出了一种改进特征选择算法ITFIDF-IG。根据短文本语料特点提高更具分类效果的特征词权... 在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取短文本特征,为此,提出了一种改进特征选择算法ITFIDF-IG。根据短文本语料特点提高更具分类效果的特征词权重,降低了无关词的干扰,并考虑特征词在分布上体现的分类效果,有效提取出更具分类贡献度的特征词,更适应中文短文本的情感分析,取得较好的分类性能。 展开更多
关键词 特征选择 情感分析 词频逆文本频率指数 信息增益 中文短文本
在线阅读 下载PDF
基于深度置信网络的恶意代码检测方法研究 预览
16
作者 强晗 郭亚兰 田礼明 《计算机技术与发展》 2019年第7期93-97,共5页
随着互联网的普及、信息技术的飞速发展,信息安全的问题也日益严重,恶意代码是其中主要威胁之一。当前恶意代码呈现出数量巨大,技术不断更新的现状,恶意代码检测技术面临严峻挑战。因此,文中提出了基于指令序列特征和深度置信网络的恶... 随着互联网的普及、信息技术的飞速发展,信息安全的问题也日益严重,恶意代码是其中主要威胁之一。当前恶意代码呈现出数量巨大,技术不断更新的现状,恶意代码检测技术面临严峻挑战。因此,文中提出了基于指令序列特征和深度置信网络的恶意代码检测方法,它包括三个部分:样本预处理模块、特征构造与约简模块以及深度置信网络分类模块。数据预处理模块使用PEID、VMUNPACKER对恶意代码样本进行查壳、脱壳处理并用IDApro对样本进行反汇编获取操作码;特征提取模块使用n-gram窗口滑动获取特征并采用信息增益的方法对特征进行选择;深度置信网络模块使用深度置信网络(DBN)在训练集上进行训练生成深度学习网络,再使用训练好的网络对样本进行分类与检测。实验结果表明,该方法相较于传统的恶意代码检测方法,检测速度和效率有较大的提高。 展开更多
关键词 恶意代码检测 反汇编 N-GRAM 信息增益 深度置信网络
在线阅读 下载PDF
基于决策树与单元距离抽取新闻网页内容 预览
17
作者 王晓 罗永莲 《晋中学院学报》 2019年第3期66-71,共6页
针对新闻网页文本处理问题,提出了一种基于决策树抽取新闻标题并利用单元距离识别正文的方法.该方法将文本相似度、网页标记和属性作为决策树节点选择的测试属性项,各属性项的信息熵计算同时考虑了与标题相关和不相关的因素,在此基础上... 针对新闻网页文本处理问题,提出了一种基于决策树抽取新闻标题并利用单元距离识别正文的方法.该方法将文本相似度、网页标记和属性作为决策树节点选择的测试属性项,各属性项的信息熵计算同时考虑了与标题相关和不相关的因素,在此基础上建立决策树,并根据规则定位新闻标题.利用网页标记的嵌套特征,缩小查找范围,根据网页各信息块间的显著边界定位新闻正文.实验结果表明,该方法抽取新闻标题的准确率在87%以上,抽取正文的平均准确率达到76%,对其他网页文本处理具有一定借鉴意义. 展开更多
关键词 信息增益 决策树 新闻网页 内容抽取 网页信息块
在线阅读 下载PDF
混合CHI与IG的特征选择方法研究 预览
18
作者 唐康 汪海涛 +1 位作者 姜瑛 陈星 《信息技术》 2019年第2期53-57,共5页
随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择... 随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择方法选择后的特征子集可能差别较大,进而导致不稳定的分类结果。文中提出了一种混合CHI与IG的特征选择方法,引入了融合特征的指标SOM(Score of Mixed),将特征根据SOM值排序,通过预定的阈值进行特征筛选,得出相对稳定且具代表性的特征子集。实验结果表明,使用该方法进行特征选择,文本分类的效果相比使用其他特征选择方法有一定的提升。 展开更多
关键词 特征选择 卡方统计 信息增益 混合方法
在线阅读 下载PDF
几何平均参与评价划分属性的决策树 预览
19
作者 王卓 聂斌 罗计根 《计算机工程与设计》 北大核心 2018年第7期1877-1882,共6页
针对信息增益偏向于多值属性,信息增益率倾向于少值属性的特点,研究几何平均参与评价划分属性的决策树。从候选划分属性中,筛选高于信息增益算术平均水平的属性;分别计算这些属性的信息增益与信息增益率的几何平均值,从中选择几何平均... 针对信息增益偏向于多值属性,信息增益率倾向于少值属性的特点,研究几何平均参与评价划分属性的决策树。从候选划分属性中,筛选高于信息增益算术平均水平的属性;分别计算这些属性的信息增益与信息增益率的几何平均值,从中选择几何平均值最大的属性,建立分支决策;用递归方法建立决策树。对4份不同规模数据进行实验验证,验证结果表明,该决策树准确性较好,运行时间较低,可行有效。 展开更多
关键词 信息增益 信息增益率 筛选 几何平均 决策树 中医药信息
在线阅读 下载PDF
基于段落信息增益的政策文本主题识别研究 预览
20
作者 赵一方 裴雷 康乐乐 《数字图书馆论坛》 CSSCI 2018年第11期2-10,共9页
综合性政策文本通常具有多种政策主张的表述,而现有的基于特征词向量的政策主题识别方法一直无法有效分配特定特征词对相似政策主题的“贡献度”。本文提出一种基于段落信息增益的半监督化政策文本主题识别方法,在不损耗基本词向量信息... 综合性政策文本通常具有多种政策主张的表述,而现有的基于特征词向量的政策主题识别方法一直无法有效分配特定特征词对相似政策主题的“贡献度”。本文提出一种基于段落信息增益的半监督化政策文本主题识别方法,在不损耗基本词向量信息的同时,显著降低了矩阵计算的复杂度,平衡了不同主题间的贡献差异。基于该方法,本文进一步通过对2018年31个省级行政机构的政府工作报告的政策主题强度差异和政策倾向进行测算,测算结果与人工标注结果具有一定的秩相关性。 展开更多
关键词 政策文本 主题识别 政策倾向 信息增益
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部 意见反馈