期刊文献+
共找到1,384篇文章
< 1 2 70 >
每页显示 20 50 100
基于Stacking算法的员工离职预测分析与研究 预览
1
作者 李强 翟亮 《重庆工商大学学报:自然科学版》 2019年第1期117-123,共7页
针对员工离职会增加企业运营成本,降低企业盈利能力的问题,提出使用机器学习的离职员工预测算法;通过Stacking集成学习算法组合Adaboost和Random Forest基本算法构建LRA预测模型,实现对某企业的员工离职预测;实验结果显示,LRA模型的预... 针对员工离职会增加企业运营成本,降低企业盈利能力的问题,提出使用机器学习的离职员工预测算法;通过Stacking集成学习算法组合Adaboost和Random Forest基本算法构建LRA预测模型,实现对某企业的员工离职预测;实验结果显示,LRA模型的预测准确率为89.09%,相对于单一算法所构建验证的模型预测准确率明显提高,LRA模型的查准率、查全率以及F1度量指标证实模型的可行性与可靠性,通过对输入LRA模型的特征进行重要性排序,得到影响员工离职的主要因素有加班、工龄(0-3年)、收入、职业级别等,丰富已有研究的结论,有利于企业决策者,针对离职行为进行合理决策。 展开更多
关键词 ADABOOST RANDOM FOREST STACKING 员工离职预测 主要因素
在线阅读 免费下载
基于深度森林的交通标志识别方法研究 预览
2
作者 李志军 崔利娟 《工业控制计算机》 2019年第5期114-115,120共3页
针对模板匹配法识别率低、泛化能力弱,卷积神经网络法模型复杂等问题,提出一种基于深度森林的交通标志识别方法。该方法首先采用感兴趣区域提取、尺寸归一化等图像处理方法对交通标志数据集进行预处理;然后利用多粒度滑动窗口的方式把... 针对模板匹配法识别率低、泛化能力弱,卷积神经网络法模型复杂等问题,提出一种基于深度森林的交通标志识别方法。该方法首先采用感兴趣区域提取、尺寸归一化等图像处理方法对交通标志数据集进行预处理;然后利用多粒度滑动窗口的方式把交通标志数据切分为多实例特征向量;最后采用深度级联森林对转换后的特征进行逐层表征学习。实验结果表明,提出的方法在测试集上达到了93%的准确率,相比于随机森林法和模板匹配法,在交通标志测试集的识别率及系统泛化能力上都得到了较好的提升。 展开更多
关键词 交通标志识别 深度森林 随机森林 机器学习 图像处理 深度学习
在线阅读 下载PDF
基于核典型RF的过程故障诊断
3
作者 曹玉苹 卢霄 +1 位作者 田学民 邓晓刚 《控制工程》 CSCD 北大核心 2019年第4期746-751,共6页
基于主元分析的旋转森林没有考虑特征的时序相关性,为此,提出一种基于核典型旋转森林的故障诊断方法,以提高非线性动态过程的故障诊断精度。所提方法通过未知非线性映射将随机森林特征投影到高维线性再生核Hilbert空间,利用典型变量分... 基于主元分析的旋转森林没有考虑特征的时序相关性,为此,提出一种基于核典型旋转森林的故障诊断方法,以提高非线性动态过程的故障诊断精度。所提方法通过未知非线性映射将随机森林特征投影到高维线性再生核Hilbert空间,利用典型变量分析提取变量的动态相关信息,得到不相关特征。采用核函数解决非线性映射未知的问题,为了避免传统核典型变量分析存在的核矩阵奇异问题,该研究在核主元空间提取典型变量,以训练决策树。该方法考虑了随机森林特征的非线性相关性和动态相关性,增加了决策树之间的差异性,有助于提高故障诊断精度。以田纳西-伊斯曼过程为例对所提方法的有效性进行了验证。 展开更多
关键词 故障诊断 随机森林 旋转森林 典型变量分析 核主元分析
基于Sentinel-1A雷达影像的思茅松林蓄积量估测 预览
4
作者 杨明星 徐天蜀 +2 位作者 牛晓花 霍鹏 岳彩荣 《西部林业科学》 CAS 北大核心 2019年第2期52-58,共7页
探讨C波段雷达影像估测森林蓄积量的应用潜力,建立思茅松林蓄积量遥感估测模型,为利用遥感技术快速、准确、大面积的估测森林蓄积量提供参考。以云南省普洱市思茅区思茅松林为研究对象,采用C波段双极化合成孔径雷达Sentinel-1A影像为数... 探讨C波段雷达影像估测森林蓄积量的应用潜力,建立思茅松林蓄积量遥感估测模型,为利用遥感技术快速、准确、大面积的估测森林蓄积量提供参考。以云南省普洱市思茅区思茅松林为研究对象,采用C波段双极化合成孔径雷达Sentinel-1A影像为数据源,提取影像不同极化方式下的后向散射系数,并分别计算4个窗口(5×5、7×7、9×9、11×11)下的9种纹理特征,共计提取75维影像特征作为备选自变量,结合45块地面蓄积量调查样地,采用随机森林算法,进行建模因子重要性分析,选择最优特征,即选取VH极化方式、5×5窗口下VH极化方式的均值和异质性、7×7和9×9窗口下VH极化方式的最大概率、11×11窗口下VH极化方式的最大概率和协同性,共7个特征因子,建立随机森林蓄积量估测模型,R~2达到0.64,RMSE为30.35m~3/hm~2,模型的估测精度达到75.46%,森林蓄积量估测效果较好。研究表明,基于C波段双极化雷达影像提取纹理特征,利用随机森林算法进行特征选择,建立的森林蓄积量估测模型具有一定的可行性和推广性。 展开更多
关键词 森林蓄积量 Sentinel-1A 随机森林 纹理 特征选择 思茅松
在线阅读 免费下载
天然杜鹃林林窗扰动对土壤重金属含量的影响 预览
5
作者 唐凤华 全文选 +4 位作者 李朝婵 黄先飞 吴先亮 杨荞安 许塔艳 《西北林学院学报》 CSCD 北大核心 2019年第3期28-36,共9页
林窗扰动是森林更新和演替过程的重要干扰类型,影响土壤的物质循环。为了解林窗扰动对贵州百里杜鹃国家森林公园天然杜鹃林土壤重金属分布的影响,以自然形成小林窗表层土壤(0~10cm)为对象,林下土壤为对照,测定土壤重金属(As、Cd、Cr、Fe... 林窗扰动是森林更新和演替过程的重要干扰类型,影响土壤的物质循环。为了解林窗扰动对贵州百里杜鹃国家森林公园天然杜鹃林土壤重金属分布的影响,以自然形成小林窗表层土壤(0~10cm)为对象,林下土壤为对照,测定土壤重金属(As、Cd、Cr、Fe、Hg、Mn、Ni、V、Pb和Zn)含量,采用随机森林模型和冗余分析等方法对土壤重金属的空间分布、污染源识别及其影响因素进行研究,运用潜在生态风险指数法评价杜鹃林潜在生态风险。结果表明:1)小林窗表层土壤中Hg、Cd的平均含量分别超过国家Ⅱ级标准2.78、1.53倍,而林下分别超过2.52、1.45倍;小林窗样点土壤Cd含量超标率高于林下27%。小林窗扰动对天然杜鹃林[6]下坡位表层土Cr含量影响显著,下坡位小林窗土壤Cr含量显著>林下。中坡位、上坡位、中坡和缓坡小林窗土壤Pb、Zn含量均>林下,不同坡位和坡度小林窗土壤Mn和Ni含量均>林下;2)冗余分析表明,Mg、海拔、Ca是解释天然杜鹃林土壤重金属分布最重要的环境因子。随机森林模型重要性分析表明,Ni是影响天然林小林窗与林下土壤重金属分布最重要的重金属因子,Cr次之;3)小林窗土壤重金属单项(除Ni外)与综合潜在生态风险>林下,小林窗与林下土壤Hg和Cd风险均较高,其余重金属处于低生态风险。所以,在百里杜鹃天然杜鹃林的保护和管理过程中,应重视Hg、Cd污染的防治以及小林窗扰动对重金属分布的影响。 展开更多
关键词 小林窗扰动 天然杜鹃林 重金属 随机森林 潜在生态风险
在线阅读 下载PDF
基于多粒度级联森林的骨质疏松性骨折预测研究 预览
6
作者 徐辉煌 张海宇 林勇 《北京生物医学工程》 2019年第4期384-391,共8页
目的骨质疏松性骨折(osteoporotic fracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grained cascade forest,gcForest)并结合... 目的骨质疏松性骨折(osteoporotic fracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grained cascade forest,gcForest)并结合遗传因子来预测OF。方法首先基于 t 分布邻域嵌入( t -distributed stochastic neighbor embedding, t -SNE)算法对OF关联基因位点进行非线性降维,降维后的基因位点与临床因素构成特征组。然后构建gcForest模型对OF进行预测。最后通过10次十折分层交叉验证与logistic、梯度提升决策树、随机森林进行对比。结果基于gcForest的模型分类精度为0.892 7,AUC值为0.92±0.05,泛化性能最优。结论在考虑遗传因素的条件下,gcForest分类效果优于其他模型,验证了本文方法的高效性和实用性。 展开更多
关键词 机器学习 骨质疏松性骨折 t分布邻域嵌入 随机森林 多粒度级联森林
在线阅读 下载PDF
多分类器组合森林类型精细分类 预览
7
作者 王怀警 谭炳香 +2 位作者 王晓慧 房秀凤 李世明 《遥感信息》 CSCD 北大核心 2019年第2期104-112,共9页
针对高光谱遥感数据树种识别精度不高,现有多分类器组合策略难以避免人为因素干扰的问题,利用自适应权值模型组合2种机器学习算法,有效改善森林类型精细识别精度。研究综合利用影像的光谱和纹理特征、地形特征及森林类型外业调查样本数... 针对高光谱遥感数据树种识别精度不高,现有多分类器组合策略难以避免人为因素干扰的问题,利用自适应权值模型组合2种机器学习算法,有效改善森林类型精细识别精度。研究综合利用影像的光谱和纹理特征、地形特征及森林类型外业调查样本数据,采用分层分类的策略,分别利用支撑向量机(support vector machine,SVM)和随机森林算法(random forest classifier,RFC)对森林类型进行精细识别;为进一步提高森林类型识别精度,采用自适应权值组合模型综合2种分类器,并采用分层随机抽样的独立检验样本进行精度验证。结果表明,自适应权值组合模型可综合不同分类器的优势,避免人为因素干扰且提高识别精度和稳定性,对高分五号(GF-5)星载高光谱遥感数据应用具有借鉴意义和参考价值。 展开更多
关键词 HYPERION 支持向量机 随机森林 自适应权值 分层分类 森林类型分类 高光谱
在线阅读 下载PDF
水库型饮用水水源地水质综合评价RDPSO-RF模型及应用 预览
8
作者 伏吉祥 《人民珠江》 2019年第3期101-106,127共7页
提出一种基于随机漂移粒子群(RDPSO)算法优化的随机森林(RF)水质综合评价方法,利用RDPSO算法优化RF决策树数量和分裂属性个数2个关键参数,构建RDPSO-RF评价模型,并与基于RDPSO算法优化的回归支持向量机(SVR)评价模型作对比,以红河州17... 提出一种基于随机漂移粒子群(RDPSO)算法优化的随机森林(RF)水质综合评价方法,利用RDPSO算法优化RF决策树数量和分裂属性个数2个关键参数,构建RDPSO-RF评价模型,并与基于RDPSO算法优化的回归支持向量机(SVR)评价模型作对比,以红河州17个水库型饮用水水源地水质综合评价为例进行实例研究。通过评价因子各分级阈值构建样本对RDPSO-RF、RDPSO-SVR模型进行训练及测试,利用测试好的模型对实例水质进行综合评价。结果表明:RDPSO-RF模型对训练、测试样本模拟的平均相对误差绝对值分别为0.33%、0.90%,拟合-测试精度远优于RDPSO-SVR模型的1.12%、3.07%,具有较好的评价精度和泛化能力。RDPSO-RF、RDPSO-SVR模型对实例17个水源地水质评价结果基本相同,但有3个水源地水质评价结果存在差异。提出的RDPSO-RF模型及方法可为相关水质评价研究提供参考。 展开更多
关键词 水质评价 随机漂移粒子群算法 随机森林 参数优化 饮用水水源地
在线阅读 免费下载
基于随机漂移粒子群优化的随机森林预测模型及水文应用实例 预览
9
作者 崔东文 郭荣 《三峡大学学报:自然科学版》 CAS 北大核心 2019年第2期6-10,共5页
提出一种基于随机漂移粒子群(RDPSO)算法优化的随机森林(RF)预测方法,利用RDPSO算法优化RF决策树数量和分裂属性个数两个关键参数,构建RDPSO-RF预测模型,并与基于RDPSO算法优化的支持向量机(SVM)、BP神经网络预测模型作对比,以某水文站... 提出一种基于随机漂移粒子群(RDPSO)算法优化的随机森林(RF)预测方法,利用RDPSO算法优化RF决策树数量和分裂属性个数两个关键参数,构建RDPSO-RF预测模型,并与基于RDPSO算法优化的支持向量机(SVM)、BP神经网络预测模型作对比,以某水文站枯水期1~3月月径流预测为例,利用实例前43年和后10年资料对3种模型进行训练和预测.结果表明,RDPSO-RF模型对实例1~3月月径流训练、预测的平均相对误差绝对值分别为4.28%、3.88%、5.67%和3.74%、4.57%、4.88%,训练、预测精度均优于RDPSO-SVM、RDPSO-BP模型,具较好的预测精度和泛化能力,可为相关预测研究提供参考和借鉴. 展开更多
关键词 径流预测 随机漂移粒子群算法 随机森林 参数优化
在线阅读 下载PDF
基于改进随机森林算法的文本分类研究与应用 预览
10
作者 刘勇 兴艳云 《计算机系统应用》 2019年第5期220-225,共6页
传统随机森林分类算法采用平均多数投票规则不能区分强弱分类器,而且算法中超参数的取值需要调节优化.在研究了随机森林算法在文本分类中的应用技术及其优缺点的基础上对其进行改进,一方面对投票方法进行优化,结合决策树的分类效果和预... 传统随机森林分类算法采用平均多数投票规则不能区分强弱分类器,而且算法中超参数的取值需要调节优化.在研究了随机森林算法在文本分类中的应用技术及其优缺点的基础上对其进行改进,一方面对投票方法进行优化,结合决策树的分类效果和预测概率进行加权投票,另一方面提出一种结合随机搜索和网格搜索的算法对超参数调节优化.Python环境下的实验结果表明本文方法在文本分类上具有良好的性能. 展开更多
关键词 随机森林 文本分类 加权投票 超参数优化 随机搜索 网格搜索
在线阅读 下载PDF
水利工程灌浆大数据平台设计与实现 预览
11
作者 饶小康 《长江科学院院报》 CSCD 北大核心 2019年第6期139-145,170共8页
随着云计算、大数据、物联网的发展,水利工程各类采集数据与日俱增,面对如此大规模的数据集,传统存储、计算相关的理论和方法已不能满足海量、多源、异构数据的存取与处理。针对水利工程灌浆大数据,设计平台总体架构,搭建Hadoop分布式集... 随着云计算、大数据、物联网的发展,水利工程各类采集数据与日俱增,面对如此大规模的数据集,传统存储、计算相关的理论和方法已不能满足海量、多源、异构数据的存取与处理。针对水利工程灌浆大数据,设计平台总体架构,搭建Hadoop分布式集群,设计并行化数据挖掘算法,实现水利工程灌浆大数据平台,并基于B/S服务模式进行平台展现、应用和管理。平台功能模块主要包括数据资源下载、数据集上传与运行、自定义算法、运行状态及结果和大数据可视化等,并结合白鹤滩水利工程建立基于随机森林的灌浆工程单位注入量预测模型和基于K-Means聚类的灌浆成果异常检测模型进行应用示范。平台的设计与实现融合水利工程结构化与非结构化数据,将大数据集群并行计算和数据挖掘技术应用到水利工程中,改变传统随机抽样和单一挖掘分析模型,采用多粒度、多层次、多渠道的分析模型对数据全量进行挖掘分析,从海量数据中挖掘分析出于管理、决策和生产有用的信息,实现了数据资源的集成共享、业务的高效处理、数据信息的知识发现,提高了数据存储和处理效率和精度,为当前水利工程大数据的存储与计算提供一种新的解决思路。 展开更多
关键词 大数据平台 水利工程 灌浆 HADOOP SPARK 随机森林 K-MEANS
在线阅读 免费下载
基于机器学习的马尾松毛虫发生面积预测模型 预览
12
作者 庞永华 冀小菊 《江西农业学报》 CAS 2019年第5期55-58,共4页
为了提高马尾松毛虫预测预报的准确性,分别采用随机森林、支持向量机和深度学习3种机器学习模型,应用气象因子预测马尾松毛虫发生面积,并将模型预测结果与实际发生面积进行比较。结果表明:3个机器学习模型的拟合效果均优于多元线性模型... 为了提高马尾松毛虫预测预报的准确性,分别采用随机森林、支持向量机和深度学习3种机器学习模型,应用气象因子预测马尾松毛虫发生面积,并将模型预测结果与实际发生面积进行比较。结果表明:3个机器学习模型的拟合效果均优于多元线性模型,其中深度学习对马尾松毛虫发生面积的预测最为稳健,拟合决定系数(R2)和预测准确率(PA)最高(R^2=0.9901,PA=99.27%),均方根误差(RSME)最低(RSME=0.1711);支持向量机模型预测效果也较好(R^2=0.9617,RSME=0.3275,PA=92.13%)。深度学习可用于马尾松毛虫发生面积与气象因子非线性模型的构建。 展开更多
关键词 马尾松毛虫 深度学习 支持向量机 随机森林 多元线性回归 模型预测
在线阅读 下载PDF
基于集成特征选择的点击欺诈检测方法 预览
13
作者 郭汉 帅仁俊 +1 位作者 张欣 李鑫 《计算机工程与应用》 CSCD 北大核心 2019年第17期246-251,共6页
网络在线广告中以套取广告费为目的的点击欺诈已经严重影响了网络广告的稳定发展。从FDMA2012竞赛提供的欺诈发布商检测的真实数据集出发,针对冗余特征会降低训练效率以及不平衡数据会使决策边界发生偏倚的问题,提出了一种基于集成特征... 网络在线广告中以套取广告费为目的的点击欺诈已经严重影响了网络广告的稳定发展。从FDMA2012竞赛提供的欺诈发布商检测的真实数据集出发,针对冗余特征会降低训练效率以及不平衡数据会使决策边界发生偏倚的问题,提出了一种基于集成特征选择的网络在线广告点击欺诈检测方法。采用Bagging方法和合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)相结合的方法将多数的正常点击广告发布商样本与少数的欺诈点击广告发布商样本构造为多个袋装子集,利用基于相关性度量的特征选择算法对每个袋装子集中筛选出特征子集,设置阈值得到特征合集,利用随机森林算法构建点击欺诈检测模型。实验结果表明该方法能够有效识别出实施欺诈点击行为的非法发布商,达到网络在线广告中点击欺诈检测的要求。 展开更多
关键词 点击欺诈 不平衡 集成特征选择 BAGGING 随机森林
在线阅读 下载PDF
结合风功率预测及储能能量状态的模糊控制策略平滑风电出力
14
作者 刘颖明 王维 +1 位作者 王晓东 彭朝阳 《电网技术》 EI CSCD 北大核心 2019年第7期2535-2543,共9页
在风电并网处加入储能系统,可以有效地平滑风力发电系统的并网功率,满足电网规定的波动范围。而基于储能荷电能量反馈的储能控制策略,可以在保证并网功率要求的同时,尽量避免储能电池过度充/放。在此基础上,提出一种基于相空间重构–随... 在风电并网处加入储能系统,可以有效地平滑风力发电系统的并网功率,满足电网规定的波动范围。而基于储能荷电能量反馈的储能控制策略,可以在保证并网功率要求的同时,尽量避免储能电池过度充/放。在此基础上,提出一种基于相空间重构–随机森林风功率预测模型和储能荷电能量反馈的模糊控制策略。基于预测未来风功率变化评估功率波动水平,并结合储能当前荷电状态,利用模糊控制器调节储能系统出力。在保证风电平滑前提下,减少储能电池进入平抑能力死区时间,维持储能系统平抑波动水平。最后,通过将仿真算例结果和传统方法对比,验证了所提控制策略的优越性,即可以在相同储能配置比例下达到更低的功率波动指标要求和更少的储能死区时间。 展开更多
关键词 风电功率波动 风功率预测 模糊控制 相空间重构 随机森林 能量状态
典型机器学习算法在脂肪肝分类预测研究中的实现与比较 预览 被引量:1
15
作者 余秋燕 赵莹 +1 位作者 孙继佳 邵建华 《数理医药学杂志》 2019年第1期1-3,共3页
目的:实现和比较5种常见的机器学习算法在脂肪肝分类预测研究中的应用。方法:通过主成分分析对数据的体检指标进行降维,然后应用决策树、神经网络、支持向量机、贝叶斯网络和随机森林算法,分别构建脂肪肝分类预测模型,对1956例体检数据... 目的:实现和比较5种常见的机器学习算法在脂肪肝分类预测研究中的应用。方法:通过主成分分析对数据的体检指标进行降维,然后应用决策树、神经网络、支持向量机、贝叶斯网络和随机森林算法,分别构建脂肪肝分类预测模型,对1956例体检数据进行脂肪肝的分类预测。结果:决策树分类模型在脂肪肝分类预测上的准确率最高,达到70.14%,其次是支持向量机和神经网络模型,处于68%左右的水平。结论:本文所研究的典型算法在脂肪肝分类的预测上具有较为可靠分类预测能力,但决策树模型在应用小样本数据上表现出了优势;同时,还发现臀围(HIP)和甘油三酯(TG)可能与脂肪肝分类关联密切。 展开更多
关键词 脂肪肝 主成分分析 决策树 神经网络 支持向量机 贝叶斯网络 随机森林
在线阅读 下载PDF
基于LSTM神经网络的风机齿轮带断裂故障预测 预览
16
作者 曹渝昆 巢俊乙 王晓飞 《电气自动化》 2019年第4期92-95,共4页
风电是可再生能源的一种重要存在形式,齿形带是风机变桨系统的核心传动零部件,风机中的齿轮带由于应力疲劳会产生断裂现象,从而导致风机故障。提出一种基于LSTM深度学习神经网络的风机齿轮带断裂故障预测方法,结合风电厂SCADA系统的风... 风电是可再生能源的一种重要存在形式,齿形带是风机变桨系统的核心传动零部件,风机中的齿轮带由于应力疲劳会产生断裂现象,从而导致风机故障。提出一种基于LSTM深度学习神经网络的风机齿轮带断裂故障预测方法,结合风电厂SCADA系统的风机运行状态监控数据,在随机森林算法的数据特征筛选基础之上,采用LSTM神经网络对齿轮带故障进行预测。通过基于某风电厂实际运行数据集的故障预测模型验证和对比试验。结果表明,模型的应用能够有效提高风机齿轮带断裂故障预测的精度。 展开更多
关键词 齿轮带断裂预测 LSTM 随机森林 深度学习 神经网络
在线阅读 下载PDF
基于贝叶斯模型组合的随机森林预测方法 预览
17
作者 董娜 常建芳 吴爱国 《湖南大学学报:自然科学版》 EI CAS CSCD 北大核心 2019年第2期123-130,共8页
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森... 为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性. 展开更多
关键词 K均值聚类 交叉验证 随机森林 贝叶斯模型组合 太阳能辐照度
在线阅读 下载PDF
RS-BART:一种提升贝叶斯可加回归树预测性能的新方法 预览
18
作者 王冠伟 张春霞 殷清燕 《工程数学学报》 CSCD 北大核心 2019年第4期461-477,共17页
在有监督学习的任务中,任何方法的主要目标是对未来数据进行准确的预测.作为梯度boosting算法的贝叶斯版本,贝叶斯可加回归树(Bayesian additive regression trees,BART)模型在此方面具有巨大潜力.但是,BART得到的关注远远低于随机森林... 在有监督学习的任务中,任何方法的主要目标是对未来数据进行准确的预测.作为梯度boosting算法的贝叶斯版本,贝叶斯可加回归树(Bayesian additive regression trees,BART)模型在此方面具有巨大潜力.但是,BART得到的关注远远低于随机森林和梯度boosting算法.为扩展BART的应用范围,文中首先对BART模型作了较为详尽的综述.考虑到BART在高维情况下会出现过拟合,本文提出了RS-BART方法以提高其预测性能.RS-BART首先对所有预测变量根据其相对重要性排序,然后使用重要性度量训练一些低维或中等维度的BART模型,将其预测结果平均或投票来得到最终的预测结果.基于模拟和实际数据的试验结果表明,与一些最先进的方法(如随机森林、boosting和BART)相比,RS-BART具有更好或基本相当的预测性能.因此,RS-BART可以作为用于解决实际应用中高维且稀疏预测任务的一种有效工具. 展开更多
关键词 集成学习 贝叶斯可加回归树 预测精度 随机森林 GIBBS采样
在线阅读 下载PDF
基于XGBoost算法模型的金融客户信用评估研究 预览
19
作者 陆健健 江开忠 《软件导刊》 2019年第4期133-136,共4页
针对银行客户信用评估模型不健全不完善等问题,在对比随机森林(RF)、GBDT和XGBoost三种集成算法基础上,提出基于XGBoost算法的金融客户信用评估模型。从知名的UCI数据库中选取德国某银行客户信用数据集,在对数据进行缺失值、标准化等预... 针对银行客户信用评估模型不健全不完善等问题,在对比随机森林(RF)、GBDT和XGBoost三种集成算法基础上,提出基于XGBoost算法的金融客户信用评估模型。从知名的UCI数据库中选取德国某银行客户信用数据集,在对数据进行缺失值、标准化等预处理后,分别对随机森林(RF)、GBDT算法和XGBoost三种集成算法建立个人信用评估模型,然后依据计算得到的相关多元评价指标对个人信用评估进行对比研究。实证结果表明,建立在XGBoost集成算法上的个人信用评估模型性能最优,在准确率指标上比随机森林(RF)高出6%,比GBDT算法高0.8%。 展开更多
关键词 信用评估 XGBoost算法 随机森林(RF) GBDT算法 ROC曲线
在线阅读 免费下载
基于局部二值特征和BP神经网络的头部姿态估计 预览
20
作者 陆清正 周宇 +1 位作者 叶庆卫 陆志华 《传感器与微系统》 CSCD 2019年第2期45-48,58共5页
针对头部姿态估计(HPE)通常会受到人脸姿态、表情和遮挡以及特征提取不准确等因素影响导致识别率不高的问题,提出一种鲁棒的头部姿态估计方法。生成局部二值特征(LBF),通过训练随机森林回归出人脸68个关键特征点提取模型,结合反向传播(... 针对头部姿态估计(HPE)通常会受到人脸姿态、表情和遮挡以及特征提取不准确等因素影响导致识别率不高的问题,提出一种鲁棒的头部姿态估计方法。生成局部二值特征(LBF),通过训练随机森林回归出人脸68个关键特征点提取模型,结合反向传播(BP)神经网络训练分类器识别头部姿态。在CASPEAL-R1和Pointing’04数据集上的实验结果表明:所提方法的头部姿态估计准确率达到了98. 57%,平均绝对误差为3. 90°,解决了人脸关键特征点定位不准确的问题,进一步提高了头部姿态的识别精度。 展开更多
关键词 头部姿态估计 局部二值特征 随机森林 人脸关键点 反向传播神经网络
在线阅读 下载PDF
上一页 1 2 70 下一页 到第
使用帮助 返回顶部 意见反馈