期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Logistic回归和XGBoost的钓鱼网站检测方法 预览
1
作者 杨鹏 曾朋 +1 位作者 赵广振 吕培培 《东南大学学报:自然科学版》 EI CAS CSCD 北大核心 2019年第2期207-212,共6页
为兼顾钓鱼网站检测的速度和准确率,提出一种基于Logistic回归和XGBoost的钓鱼网站检测方法.根据网页的URL提取HTML特征、URL特征和基于TF-IDF的文本向量特征,结合Logistic回归将高维和稀疏的文本特征转换为概率特征.基于以上融合特征,... 为兼顾钓鱼网站检测的速度和准确率,提出一种基于Logistic回归和XGBoost的钓鱼网站检测方法.根据网页的URL提取HTML特征、URL特征和基于TF-IDF的文本向量特征,结合Logistic回归将高维和稀疏的文本特征转换为概率特征.基于以上融合特征,构建了XGBoost分类模型,给出了方法的时间复杂度分析,采集了真实数据作为实验数据集.实验结果表明,Logistic回归方法降低了融合特征的维度,检测速度优于直接融合方法;融合特征方法比单方面特征方法含有更多有效的信息,可供分类器进行学习,检测精度高于单方面特征方法,精确度达到96.67%,召回率为96.6%. 展开更多
关键词 钓鱼网站 LOGISTIC回归 集成学习 XGBoost
在线阅读 下载PDF
基于XGBoost算法的异常用户识别 预览
2
作者 宋晓宇 孙向阳 赵阳 《测试科学与仪器:英文版》 CAS CSCD 2018年第4期339-346,共8页
电力行业是国民经济中的基础性产业, 日益严重的电力异常行为给国家经济造成了巨大损失。 XGBoost(eXtreme gradient boosting)算法用于异常客户的识别。 首先, 对原始数据进行清洗; 然后, 从不同角度构建用户用电特征; 最后, 使用XGBo... 电力行业是国民经济中的基础性产业, 日益严重的电力异常行为给国家经济造成了巨大损失。 XGBoost(eXtreme gradient boosting)算法用于异常客户的识别。 首先, 对原始数据进行清洗; 然后, 从不同角度构建用户用电特征; 最后, 使用XGBoost分类器分别在平衡样本集和非平衡样本集下进行异常客户识别。 与之对比, 在相同特征下, 分别使用KNN( k -nearest neighbor)分类器、 BP(back-propagation)神经网络分类器和和随机森林分类器在这两个样本集下进行异常客户识别。 实验结果表明, XGBoost分类器有更高的识别率和更快的运行速度, 特别是在不平衡数据集下, 性能改进尤为明显。 展开更多
关键词 用户识别 用电特征 XGBoost 随机森林
在线阅读 下载PDF
基于CSI-XGBoost的高精度WiFi室内定位算法
3
作者 张玄黎 修春娣 +1 位作者 王延昭 杨东凯 《北京航空航天大学学报》 CSCD 北大核心 2018年第12期2536-2544,共9页
考虑到室内环境的复杂性和多径效应对Wi Fi指纹定位性能的影响从Intel 5300无线网卡中提取信道状态信息(CSI),利用修正后的CSI幅值和相位信息作为指纹特征,使用极限梯度提升(XGBoost)算法构建高精度指纹库,实现分米级的高精度室内定位... 考虑到室内环境的复杂性和多径效应对Wi Fi指纹定位性能的影响从Intel 5300无线网卡中提取信道状态信息(CSI),利用修正后的CSI幅值和相位信息作为指纹特征,使用极限梯度提升(XGBoost)算法构建高精度指纹库,实现分米级的高精度室内定位。进一步通过实测数据分析了采样间隔、室内视距(LOS)和非视距(NLOS)环境、缺失值和数据维度等因素对所提算法定位性能的影响。实际室内环境下的实验结果表明,本文算法受NLOS影响较小,对室内复杂环境有很强的鲁棒性;此外,该算法能够很好地处理高维稀疏数据,解决CSI指纹特征的"误匹配"问题,且对缺失数据不敏感,定位准确度优于90%。 展开更多
关键词 室内定位 信道状态信息(CSI) 指纹匹配 极限梯度提升(XGBoost) 相位延拓
基于经验模态分解-自回归组合模型的网络舆情预测 预览 被引量:1
4
作者 莫赞 赵冰 黄艳莹 《计算机应用》 CSCD 北大核心 2018年第3期615-619,共5页
随着大数据时代的到来,网络舆情数据呈现信息量大和领域覆盖广等特征。面对复杂的网络舆情数据时,传统单一模型预测能力有限,不能对舆情趋势进行有效预测。针对此问题,提出一种基于经验模态分解一自回归(EMD.AR)改进的组合模型—... 随着大数据时代的到来,网络舆情数据呈现信息量大和领域覆盖广等特征。面对复杂的网络舆情数据时,传统单一模型预测能力有限,不能对舆情趋势进行有效预测。针对此问题,提出一种基于经验模态分解一自回归(EMD.AR)改进的组合模型——EMD.ARXG模型,应用于复杂网络舆情的预测。该模型利用经验模态分解算法对时间序列进行分解,然后通过自回归模型对分解后的时间序列进行各自趋势拟合,建立子模型。最后再对各个子模型进行重构,完成建模。另外,在利用自回归(AR)模型拟合过程中,为了减少拟合误差,采用极限梯度提升算法对残差进行学习,并使预测模型迭代更新,提高各个子模型预测精度。为验证EMD-ARXG模型的预测效果,该模型与小波神经网络模型和基于经验模态分解的神经网络模型进行实验对比。实验结果表明,在均方根误差(RMSE)、平均绝对百分误差(MAPE)和希尔不等系数(TIC)三项指标上,EMD—ARXG模型获得的结果均优于小波神经网络模型和基于经验模态分解的神经网络模型的结果。 展开更多
关键词 趋势拟合 网络舆情预测 经验模态分解 自回归 极限梯度提升 残差学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈