期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于数据分布特征的线性孪生支持向量机 预览
1
作者 宋瑞阳 孟华 龙治国 《计算机科学》 CSCD 北大核心 2019年第B06期407-411,共5页
孪生支持向量机(TWSVM)目前已在众多领域取得了成功的应用,但标准TWSVM模型在处理具有分布特征的数据分类问题时鲁棒性差,尤其当数据的不确定性程度较大时,不考虑样本点分布特征的标准分类模型已不能满足分类准确率的要求。为此,文中提... 孪生支持向量机(TWSVM)目前已在众多领域取得了成功的应用,但标准TWSVM模型在处理具有分布特征的数据分类问题时鲁棒性差,尤其当数据的不确定性程度较大时,不考虑样本点分布特征的标准分类模型已不能满足分类准确率的要求。为此,文中提出了基于数据分布特征的加权线性孪生支持向量机(TWSVM-U)模型,它在TWSVM的基础上考虑数据的分布特征对分类超平面位置的影响,根据数据在分类超平面法方向的分散程度定量构造距离权重。事实上,TWSVM-U是TWSVM的推广,当训练样本数据不具有分布特征时,TWSVM-U模型将退化为标准TWSVM模型。十折交叉验证的实验结果表明,TWSVM-U模型在处理波动范围较大的不确定性数据分类问题时比SVM和TWSVM表现更优。 展开更多
关键词 二分 孪生支持向量机 不确定信息 加权距离
在线阅读 免费下载
一种基于梯度提升回归树的系外行星宜居性预测方法 预览
2
作者 朱维军 王鑫 +2 位作者 钟英辉 樊永文 陈永华 《计算机科学》 CSCD 北大核心 2019年第B06期71-73,79共4页
系外行星的宜居性是近年来探索宇宙的一个热点研究课题,机器学习为系外行星宜居性分类提供了一种可行的手段。然而,现有的宜居性分类效果面临严重不足与局限。为此,给出一种基于梯度提升回归树的系外行星宜居性分类预测方法。首先,使用... 系外行星的宜居性是近年来探索宇宙的一个热点研究课题,机器学习为系外行星宜居性分类提供了一种可行的手段。然而,现有的宜居性分类效果面临严重不足与局限。为此,给出一种基于梯度提升回归树的系外行星宜居性分类预测方法。首先,使用梯度提升回归树算法对系外潜在宜居行星与非宜居行星的相关物理学与天文学数据集进行训练;然后,利用训练好的模型对相关测试集进行预测。仿真实验结果表明,新方法在测试集上的预测准确率高达100%。 展开更多
关键词 梯度提升回归树 系外行星 宜居性 二分
在线阅读 免费下载
面向不均衡医学数据集的疾病预测模型研究 预览
3
作者 陈旭 刘鹏鹤 +5 位作者 孙毓忠 沈曦 张磊 王晓青 孙晓平 程伟 《计算机学报》 EI CSCD 北大核心 2019年第3期596-609,共14页
基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然... 基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然而,在医疗领域往往存在着样本数据集不均衡的问题,导致模型的预测效果降低.欠采样技术是目前解决样本不均衡问题的常用手段.其主要采用一定的方法从多数类样本中抽取部分样本,与少数类样本组成平衡数据集后再构建模型.现有的欠采样方法往往可以显著提高模型对少数类样本的召回率,然而其通常也会造成模型准确率的降低,从而限制了预测模型的整体提升效果.为此,该文提出了一种新的基于迭代提升欠采样的集成分类方法(Under-Sampling with Iteratively Boosting,USIB),该方法迭代地从多数类样本中进行欠抽样,构建多组弱分类器,并采用加权组合方式将这些弱分类器构成一个强分类器,从而提升样本不平衡条件下单种疾病预测效果.另外,医学病例样本数据集通常是多类别、多标签的,为此,该文将多个单种疾病的预测模型进行组合构成一个多标签疾病预测模型,以满足临床意义上的多病种以及并发症的诊断.为了进一步提升多标签预测模型的效果,该文设计了一种基于标签最大互信息生成树的标签选择方法(Labels Selection method based on Maximum Mutual Information Spanning Tree,LS-MMIST),该方法根据原始数据集的分布构建标签之间的最大互信息生成树,在每一次的样本预测阶段,借助树中疾病标签之间的关系确定最终的预测标签集合.实验方面,该文首先选择三种公开的不均衡二分类数据集和我们私有的四种稀有疾病的数据集,对该文提出的迭代提升欠采样方法进行性能评估.其次,分别对比了该文提出的多标签预测模型与现有的多标签预测技术在 展开更多
关键词 疾病预测 不均衡数据集 欠采样 二分 多标签分
在线阅读 下载PDF
基于堆叠自编码器的恶意域名检测 预览
4
作者 张生顺 《网络安全和信息化》 2019年第5期120-122,共3页
本文提出了一种基于堆叠自编码器的恶意域名检测模型,通过域名生成算法(DGA)生成C&C域名作为恶意域名集合,最后再将堆叠自编码器和识别分类的功能结合起来进行测试,检测精度达到97.3%。
关键词 二分 检测模型 隐藏层
在线阅读 下载PDF
基于FTRL和XGBoost算法的产品故障预测模型 预览
5
作者 杨正森 《计算机系统应用》 2019年第3期179-184,共6页
随着智能化设备的日益更新和计算机储存数据能力的提升,制造业企业在其产品制造过程中产生了大量的流水线数据,如何充分利用这些数据一直是工业界的一个难题.本文根据制造业企业的真实大规模生产数据,通过对其进行细致的探索性数据分析... 随着智能化设备的日益更新和计算机储存数据能力的提升,制造业企业在其产品制造过程中产生了大量的流水线数据,如何充分利用这些数据一直是工业界的一个难题.本文根据制造业企业的真实大规模生产数据,通过对其进行细致的探索性数据分析,建立了一种基于FTRL和XGBoost算法的二分类产品故障预测模型,并根据适用于非平衡数据集的MCC (Matthews Correlation Coefficient)评价指标采用交叉验证方法对其进行优化.实验结果表明,该模型对于大规模(不仅样本量大,特征量也很大)正负样本非平衡的生产流水线数据集具有运行效率高,故障预测精度高的效果.基于此模型我们可以构建更智能的产品故障检测系统,有效降低企业运营成本的同时也带来了可观的利润增长. 展开更多
关键词 FTRL XGBoost 故障检测 二分 大数据
在线阅读 下载PDF
基于GAN-AdaBoost-DT不平衡分类算法的信用卡欺诈分类 预览
6
作者 莫赞 盖彦蓉 樊冠龙 《计算机应用》 CSCD 北大核心 2019年第2期618-622,共5页
针对传统单个分类器在不平衡数据上分类效果有限的问题,基于对抗生成网络(GAN)和集成学习方法,提出一种新的针对二类不平衡数据集的分类方法——对抗生成网络自适应增强决策树(GAN-AdaBoost-DT)算法。首先,利用GAN训练得到生成模型,生... 针对传统单个分类器在不平衡数据上分类效果有限的问题,基于对抗生成网络(GAN)和集成学习方法,提出一种新的针对二类不平衡数据集的分类方法——对抗生成网络自适应增强决策树(GAN-AdaBoost-DT)算法。首先,利用GAN训练得到生成模型,生成模型生成少数类样本,降低数据的不平衡性;其次,将生成的少数类样本代入自适应增强(AdaBoost)模型框架,更改权重,改进AdaBoost模型,提升以决策树(DT)为基分类器的AdaBoost模型的分类性能。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在信用卡诈骗数据集上的实验分析表明,该算法与合成少数类样本集成学习相比,准确率提高了4.5%,受测者工作特征曲线下面积提高了6.5%;对比改进的合成少数类样本集成学习,准确率提高了4.9%,AUC值提高了5.9%;对比随机欠采样集成学习,准确率提高了4.5%,受测者工作特征曲线下面积提高了5.4%。在UCI和KEEL的其他数据集上的实验结果表明,该算法在不平衡二分类问题上能提高总体的准确率,优化分类器性能。 展开更多
关键词 对抗生成网络 集成学习 不平衡分 二分 自适应增强 决策树 信用卡欺诈
在线阅读 下载PDF
SUCE:基于聚类集成的半监督二分类方法 预览
7
作者 闵帆 王宏杰 +1 位作者 刘福伦 王轩 《智能系统学报》 CSCD 北大核心 2018年第6期974-980,共7页
半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚... 半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚类算法生成大量的弱学习器;利用已有的类标签信息,对弱学习器进行评价和选择;通过集成弱学习器对测试集进行预分类,并将置信度高的样本放入训练集;利用扩展的训练集,使用ID3、Nave Bayes、kNN、C4.5、OneR、Logistic等基础算法对其他样本进行分类。在UCI数据集上的实验结果表明,当训练样本较少时,本方法能稳定提高多数基础算法的准确性。 展开更多
关键词 集成学习 集成 半监督 二分
在线阅读 下载PDF
智能化网格电信系统的故障预测方法 预览 被引量:1
8
作者 蔡珩 戈磊 《电信科学》 2018年第6期183-191,共9页
尝试用基于深度学习的相关人工智能技术,分析服务器集群上的进程和端口网络,并对网络节点进行状态预测。具体地,结合运维过程中的先验知识对网络节点的特征进行细致选择,预测网络中各个进程和端口的异常(崩溃)状态。实验结果表明,进... 尝试用基于深度学习的相关人工智能技术,分析服务器集群上的进程和端口网络,并对网络节点进行状态预测。具体地,结合运维过程中的先验知识对网络节点的特征进行细致选择,预测网络中各个进程和端口的异常(崩溃)状态。实验结果表明,进程节点的运行信息(如CPU和内存使用率)、进程间的通信情况以及进程节点在整个网络中的结构特征对于判断该节点的状态具有一定的指导价值,而这些特征在时间维度上的变化量同样反映了进程/端口的状态。 展开更多
关键词 故障预测 深度学习 二分
在线阅读 下载PDF
基于CNN深度学习模型的交通图像拥堵识别 预览 被引量:1
9
作者 崔华 刘云飞 +1 位作者 宋鑫鑫 李盼侬 《科技创新与应用》 2018年第4期19-20,22共3页
卷积神经网络(CNN)在诸多图像分类(如数字识别,人脸识别)方面都被证明有着非常出色的表现,复杂图像的分类识别需要经过多个层次的信息特征认识整合以及加工.另一方面对交通状态进行准确识别,是科学制定主动交通管理决策的基础,有利... 卷积神经网络(CNN)在诸多图像分类(如数字识别,人脸识别)方面都被证明有着非常出色的表现,复杂图像的分类识别需要经过多个层次的信息特征认识整合以及加工.另一方面对交通状态进行准确识别,是科学制定主动交通管理决策的基础,有利于及时疏导拥诸,提高道路运行效率.文章在TensorFlow上使用了基于CNN的分类模型对图片进行交通拥诸识别,其是在国际大赛上较为出名的Cifar-10模型,并对网络结构和参数进行了调整优化,有较高的准确率和效率. 展开更多
关键词 CNN 交通图像分 TensorFlow Cifar-10 二分
在线阅读 下载PDF
Logistic回归模型在北京市空气质量等级预测中的应用 预览
10
作者 于海姝 李宪波 《中国环境管理干部学院学报》 CAS 2018年第1期7-9,共3页
针对空气质量等级的分类变量,选取北京市对空气质量有影响的污染指标,确定其权重,代入具体的空气等级数据,运用Logistic回归模型进行分析,得到北京市Logistic回归模型。通过对得出的模型进行检验,对比准确率,得出二分类Logistic回归方... 针对空气质量等级的分类变量,选取北京市对空气质量有影响的污染指标,确定其权重,代入具体的空气等级数据,运用Logistic回归模型进行分析,得到北京市Logistic回归模型。通过对得出的模型进行检验,对比准确率,得出二分类Logistic回归方法适合建立空气质量等级预测模型。 展开更多
关键词 空气质量 等级预测 污染指标 LOGISTIC回归模型 二分
在线阅读 免费下载
类比社交网络的进程故障检测方法研究 预览
11
作者 程自强 黄荣 杨洋 《中文信息学报》 CSCD 北大核心 2018年第8期103-110,共8页
我们周围充满了各种网络;按照相似的内在机理,可以将它们分为物理网络和信息网络。对于具有明显物理特征的网络,我们可以运用物理常识解释其内部结构或节点的性质;而对于信息网络,我们往往需要结合一些先验知识去理解,社交网络正是这样... 我们周围充满了各种网络;按照相似的内在机理,可以将它们分为物理网络和信息网络。对于具有明显物理特征的网络,我们可以运用物理常识解释其内部结构或节点的性质;而对于信息网络,我们往往需要结合一些先验知识去理解,社交网络正是这样一个例子。然而,对于那些并非具有显著物理或社交背景的网络,以往并没有明确的分析思路和方法。该文将尝试运用类似于分析社交网络的方法去分析电信CSB业务系统服务器集群上的进程网络;具体地预测进程网络中节点的崩溃(故障)状态。在这个特定的进程网络上,这种建模和分析思路得到了较为可信的结果;研究表明,进程节点的运行信息(如CPU和内存使用率)、进程间的通信情况以及进程节点在整个网络中的结构特征对于判断该节点的状态具有一定的指导价值,而上述特征在时间维度上的变化量同样反映了进程/端口的状态。 展开更多
关键词 故障检测 社交网络 统计学习 二分
在线阅读 下载PDF
基于无人机遥感影像的水稻种植信息提取 预览 被引量:3
12
作者 李明 黄愉淇 +2 位作者 李绪孟 彭冬星 谢景鑫 《农业工程学报》 CSCD 北大核心 2018年第4期108-114,共7页
水稻是中国南方最主要的粮食作物,种植面积波动对国家粮食稳定有很大影响。通过无人机遥感试验获取多幅有重叠区域的图像,使用Agisoft photoscan软件拼接重构试验区的完整图像,利用多尺度分割方法将试验区域分割成若干对象,并基于统计... 水稻是中国南方最主要的粮食作物,种植面积波动对国家粮食稳定有很大影响。通过无人机遥感试验获取多幅有重叠区域的图像,使用Agisoft photoscan软件拼接重构试验区的完整图像,利用多尺度分割方法将试验区域分割成若干对象,并基于统计方法提取对象的光谱特征、几何特征和纹理特征;然后,建立识别水稻地块的二分类Logistic回归模型,特征指标为形状指数、红色均值、红色标准偏差、最大化差异度量、灰度共生矩阵同质性和灰度共生矩阵非相似性。结果表明:模型辨识训练样本集的正确率为100%,辨识检验样本的正确率为97%,模型应用于辨识验证区域水稻田块,总体正确率为98%。最后基于累计像素方法测算水稻田块的面积,并与目视解译测算的结果对比,面积误差小于3.5%,研究方法识别水稻田块效果好,面积测算准确率高。因此,该研究对利用无人机遥感影像普查水稻种植信息具有一定的适用性。 展开更多
关键词 无人机 遥感 农作物 可见光 水稻 二分
在线阅读 下载PDF
不平衡数据度量指标优化的提升分类方法 预览
13
作者 闫建红 《计算机工程与应用》 CSCD 北大核心 2018年第21期128-132,共5页
为提高不平衡数据的分类性能,提出了基于度量指标优化的不平衡数据Boosting算法。该算法结合不平衡数据分类性能度量标准和Boosting算法,使用不平衡数据分类性能度量指标代替原有误分率指标,分别采用带有权重的正类和负类召回率、F-meas... 为提高不平衡数据的分类性能,提出了基于度量指标优化的不平衡数据Boosting算法。该算法结合不平衡数据分类性能度量标准和Boosting算法,使用不平衡数据分类性能度量指标代替原有误分率指标,分别采用带有权重的正类和负类召回率、F-measure和G-means指标对Boosting算法进行优化,按照不同的度量指标计算Alpha值进行迭代,得到带有加权值的弱学习器组合,最后使用Boosting算法进行优化。经过实验验证,与带有权重的Boosting算法进行比较,该算法对一定数据集的AUC分类性能指标有一定提高,错误率有所下降,对F-measure和G-mean性能指标有一定的改善,说明该算法侧重提高正类分类性能,改善不平衡数据的整体分类性能。 展开更多
关键词 不平衡数据集 二分 曲线下面积(AUC) 度量指标优化 BOOSTING算法
在线阅读 下载PDF
基于半参数估计的非随机缺失样本分类 预览
14
作者 夏利宇 王蕾 刘赛可 《统计与决策》 CSSCI 北大核心 2018年第8期17-20,共4页
因变量非随机缺失是指样本中因变量的缺失机制与其自身特征高度相关,由于样本缺失具有选择性而不再适合推断总体特征。文章借鉴非随机缺失数据均值泛函估计的思想,运用基于指数倾斜的半参数模型解决非随机缺失样本的二分类问题,结合8类... 因变量非随机缺失是指样本中因变量的缺失机制与其自身特征高度相关,由于样本缺失具有选择性而不再适合推断总体特征。文章借鉴非随机缺失数据均值泛函估计的思想,运用基于指数倾斜的半参数模型解决非随机缺失样本的二分类问题,结合8类因变量缺失情形进行数值模拟研究,将半参数模型对非随机缺失样本的分类效果与Logit模型、SVM模型、决策树模型进行比较,实证结果表明,半参数方法的分类效果具有明显优势。 展开更多
关键词 非随机缺失 二分 半参数 指数倾斜
在线阅读 下载PDF
基于脉搏波数学模型的运动员运动状态判别方法 预览
15
作者 施瀚 赵海 +1 位作者 陈星池 李大舟 《东北大学学报:自然科学版》 CSCD 北大核心 2018年第12期1697-1701,共5页
针对利用运动员脉搏波信息对其运动状态(高强度运动、平静)进行判别,并减少身体状态的随机性对脉搏波特征信息的影响问题,提出了一种对原始脉搏波信号进行建模进而提取特征信息进行状态判别的方法.利用训练-测试的二分类分析方式,对运... 针对利用运动员脉搏波信息对其运动状态(高强度运动、平静)进行判别,并减少身体状态的随机性对脉搏波特征信息的影响问题,提出了一种对原始脉搏波信号进行建模进而提取特征信息进行状态判别的方法.利用训练-测试的二分类分析方式,对运动员的心率状态进行判别,以分析运动员的运动状态,辅助其进行运动训练工作.实验通过对10名运动员志愿者在不同状态下进行脉搏波采集,对预处理后的原始信号进行函数建模并提取生理信息,利用SVM进行监督训练和测试.结果表明,该方法能够对运动员心率状态进行有效判别,得到运动员的运动状态. 展开更多
关键词 脉搏波 函数建模 二分 状态判别
在线阅读 下载PDF
基于信息值的相关属性约减——加权二分类朴素贝叶斯算法研究 预览
16
作者 杨立洪 李琼阳 李兴耀 《统计与决策》 CSSCI 北大核心 2018年第2期23-26,共4页
在经典的朴素贝叶斯分类算法中,往往假设各属性之间相互独立,且对目标变量的影响程度一致,但实际问题几乎不可能满足此假设。实际应用中的二分类问题最多,在二分类问题中考虑到属性相关、样本分布不平衡、各属性影响程度的不一致性对模... 在经典的朴素贝叶斯分类算法中,往往假设各属性之间相互独立,且对目标变量的影响程度一致,但实际问题几乎不可能满足此假设。实际应用中的二分类问题最多,在二分类问题中考虑到属性相关、样本分布不平衡、各属性影响程度的不一致性对模型性能的影响,文章提出一种基于信息值的相关属性约减—加权二分类朴素贝叶斯模型,同时在判定样本类别归属时,采用自适应学习选择合适的阈值,以此削弱不平衡样本集的影响。实证结果表明,通过引入信息值,进行相关属性的约减—加权,模型结果在准确率上较之传统朴素贝叶斯算法有极大提升。 展开更多
关键词 信息值 属性约减 加权 二分 贝叶斯算法 自适应
在线阅读 下载PDF
一种新颖的识别酶EC编号的计算方法 预览
17
作者 崔浩 《现代计算机:上下旬》 2018年第16期43-49,共7页
识别酶的EC编号对于理解生成足够能量来维持生命的代谢过程非常重要。提出一种二分类器来识别酶的完整EC编号。通过集成酶和EC编号之间的关系评估样本之间的关系,采用支持向量机作为预测引擎。将酶和它们已知的EC编号配对作为正样本,并... 识别酶的EC编号对于理解生成足够能量来维持生命的代谢过程非常重要。提出一种二分类器来识别酶的完整EC编号。通过集成酶和EC编号之间的关系评估样本之间的关系,采用支持向量机作为预测引擎。将酶和它们已知的EC编号配对作为正样本,并且随机产生与正样本数量一样多的负样本。通过将此分类器与基于其他经典机器学习算法的分类器进行比较,详细地阐述基于支持向量机分类器的有效性。 展开更多
关键词 EC编号 二分 支持向量机
在线阅读 免费下载
基于样本噪声检测的AdaBoost算法改进 预览
18
作者 张子祥 冻优广 《计算机系统应用》 2017年第12期186-190,共5页
针对传统的AdaBoost算法中,存在的噪声样本造成的过拟合问题,提出了一种基于噪声检测的AdaBoost改进算法,本文称为NAdaBoost(nois-detection AdaBoost). NAdaBoost算法创新点在于针对传统的AdaBoost算法在错误分类的样本中,噪声... 针对传统的AdaBoost算法中,存在的噪声样本造成的过拟合问题,提出了一种基于噪声检测的AdaBoost改进算法,本文称为NAdaBoost(nois-detection AdaBoost). NAdaBoost算法创新点在于针对传统的AdaBoost算法在错误分类的样本中,噪声样本在某些属性上存在很大差异,根据这一特性来确定噪声样本,再重新使用算法对两类样本进行分类,最终达到提高分类准确率的目的. 本文对二分类问题进行实验结果表明,本文提出的算法和传统的AdaBoost算法,以及相关改进的算法相比,有较高的分类准确率. 展开更多
关键词 过拟合 噪声检测 ADABOOST算法 二分
在线阅读 下载PDF
基于Adaboost的动物二分类识别方法 预览 被引量:2
19
作者 张公伯 谷昱良 朱和贵 《计算机与数字工程》 2017年第4期720-726,767共8页
针对动物图像的分类识别问题,提出了一种基于Adaboost分类器的动物二分类识别方法。首先对样本图片进行边缘特征提取,选取八种具有显著形状不变性的特征描绘子,并对其合理性和优越性进行验证。后用Adaboost分类器对所得特征矩阵进行训练... 针对动物图像的分类识别问题,提出了一种基于Adaboost分类器的动物二分类识别方法。首先对样本图片进行边缘特征提取,选取八种具有显著形状不变性的特征描绘子,并对其合理性和优越性进行验证。后用Adaboost分类器对所得特征矩阵进行训练,得到最有效的分类特征,并对从Shape Database形状图片库中选取三组动物图像进行十折交叉验证实验。狗和牛、牛和象、青蛙和牛的正确分类识别率分别达到85%、90%和92.5%。实验表明该分类识别方法能较准确进行二分类识别,是一种较有效的动物图像二分类识别方法。 展开更多
关键词 动物分识别 ADABOOST分 特征描绘子 十折交叉验证 二分
在线阅读 下载PDF
随机森林算法在生物信息学中的应用研究 预览
20
作者 冯洁 《电脑知识与技术:学术交流》 2017年第4期186-187,203共3页
在生物信息学的研究过程当中,经常会遇到二分类的问题。例如RNA甲基化预测、蛋白质相互作用预测、蛋白质中二硫键的预测等都属于二分类问题。要解决二分类问题,目前在机器学习中提到了很多算法。比较常用的有支持向量机(SVM)和随机森... 在生物信息学的研究过程当中,经常会遇到二分类的问题。例如RNA甲基化预测、蛋白质相互作用预测、蛋白质中二硫键的预测等都属于二分类问题。要解决二分类问题,目前在机器学习中提到了很多算法。比较常用的有支持向量机(SVM)和随机森林(RF)算法。文章在研究一般RF算法的同时,进一步讨论了集成RF算法对于处理非平衡数据起到的突出作用,最后分析总结了一般随机森林算法和集成随机森林算法的优缺点。 展开更多
关键词 生物信息学 二分 随机森林 集成随机森林 非平衡数据
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部 意见反馈