期刊文献+
共找到537篇文章
< 1 2 27 >
每页显示 20 50 100
时间相依协变量Cox模型的变量选择 预览
1
作者 韦新星 《黑龙江科学》 2019年第6期34-35,共2页
结合R软件对时间相依协变量Cox模型进行变量选择研究。介绍了时间相依协变量Cox模型的一般形式。分析了时间相依协变量Cox模型的数据来源和建模过程。结果表明,时间相依协变量Cox模型就是一种对Cox模型的扩展和改进。当数据中存在伴随... 结合R软件对时间相依协变量Cox模型进行变量选择研究。介绍了时间相依协变量Cox模型的一般形式。分析了时间相依协变量Cox模型的数据来源和建模过程。结果表明,时间相依协变量Cox模型就是一种对Cox模型的扩展和改进。当数据中存在伴随时间而发生变化的变量时,时间相依协变量Cox模型能弥补时间独立协变量Cox模型的不足,使分析更加全面合理。 展开更多
关键词 时间相依协变量 COX模型 变量选择
在线阅读 下载PDF
主因子逼近方法在变量选择中的应用 预览
2
作者 许健 崔靓然 +1 位作者 李雅芝 张祎璠 《湖南理工学院学报:自然科学版》 CAS 2019年第1期8-12,59共6页
当数据中变量个数远大于样本个数时,变量之间的共线性问题变得尤其突出.偏最小二乘方法作为一种潜变量方法,将原始变量通过线性组合的方式转化为几个新的潜变量用于对响应变量的建模解释,但变量之间复杂共线性的存在使得变量选择困难重... 当数据中变量个数远大于样本个数时,变量之间的共线性问题变得尤其突出.偏最小二乘方法作为一种潜变量方法,将原始变量通过线性组合的方式转化为几个新的潜变量用于对响应变量的建模解释,但变量之间复杂共线性的存在使得变量选择困难重重.本文采用主因子近似方法分离出原始变量之间的共线性信息,再进行变量选择.模拟研究表明主因子逼近方法能有效地提高变量选择的精度. 展开更多
关键词 变量选择 主因子近似 偏最小二乘 变量共线性
在线阅读 下载PDF
广义线性模型下ERIC方法的调节参数选择 预览
3
作者 王亚荣 白永昕 田茂再 《统计与信息论坛》 CSSCI 北大核心 2019年第2期19-27,共9页
变量选择是处理高维统计模型的基本方法,在回归模型的变量选择中SCAD惩罚函数不仅可以很好地选择出正确模型,同时还可以对参数进行估计,而且还具有oracle性质,但这些良好的性质是基于选择出一个合适的调节参数。目前国内关于调节参数选... 变量选择是处理高维统计模型的基本方法,在回归模型的变量选择中SCAD惩罚函数不仅可以很好地选择出正确模型,同时还可以对参数进行估计,而且还具有oracle性质,但这些良好的性质是基于选择出一个合适的调节参数。目前国内关于调节参数选择方面大多是对于变量选择问题的研究,针对广义线性模型基于SCAD惩罚使用新方法ERIC准则进行调节参数的选择,并证明在一定条件下经过该准则选择的模型具有一致性。模拟与实证分析结果表明,ERIC方法在选择调节参数方面优于传统的CV准则、AIC准则和BIC准则。 展开更多
关键词 SCAD惩罚 ERIC信息准则 广义线性模型 变量选择 调节参数选择
在线阅读 下载PDF
基于变量选择的网络直播影响因素分析 预览
4
作者 张亚伦 许明月 +2 位作者 邵星铭 吴棣 刘聪 《通信技术》 2019年第6期1436-1442,共7页
作为一种新兴的社交媒体,网络直播在近年来的发展愈演愈烈。网络直播何以有如此巨大的发展规模和潜力,有哪些影响因素促进和加速了它的发展?基于子集选择法和系数压缩法的变量选择方法可以对此问题做详细的定量分析以筛选出显著变量。... 作为一种新兴的社交媒体,网络直播在近年来的发展愈演愈烈。网络直播何以有如此巨大的发展规模和潜力,有哪些影响因素促进和加速了它的发展?基于子集选择法和系数压缩法的变量选择方法可以对此问题做详细的定量分析以筛选出显著变量。根据数据特征,选定运用Cp准则、AIC准则、BIC准则和LARS、AdaptiveLASSO等方法进行变量选择,通过横向比较变量选择结果得出影响网络直播火爆发展的关键因素,以对网络直播行业提供合理的产业导向信息。 展开更多
关键词 变量选择 子集选择 系数压缩 网络直播
在线阅读 下载PDF
基于纵向数据与生存时间数据联合建模的变量选择
5
作者 胡亚南 王春雨 田茂再 《数理统计与管理》 CSSCI 北大核心 2019年第3期483-494,共12页
纵向数据和生存时间数据联合建模能减少由单独建模所引起的偏差,本文研究了基于纵向数据和生存时间联合建模的变量选择问题。对于生存时间数据,把生存时间做离散化处理,引入离散风险函数的Probit模型;对于纵向数据,利用线性混合效应模... 纵向数据和生存时间数据联合建模能减少由单独建模所引起的偏差,本文研究了基于纵向数据和生存时间联合建模的变量选择问题。对于生存时间数据,把生存时间做离散化处理,引入离散风险函数的Probit模型;对于纵向数据,利用线性混合效应模型建模。采用共享随机效应的方法对纵向数据和生存时间进行联合建模,通过利用多元高斯隐截断分布,构造出联合模型的精确似然。然后对似然函数加惩罚,重新构造目标函数,得到回归系数的稀疏估计量。理论证明以及数值模拟研究展示了稀疏估计量的良好性质。 展开更多
关键词 纵向数据 生存数据 变量选择 联合建模
基于Logistic回归模型的高维数据变量选择方法比较研究 预览
6
作者 廖丹 《统计学与应用》 2019年第3期553-559,共7页
高维数据已成为现代大数据分析中的热点研究领域。变量选择是一种被广泛用于高维数据分析问题的方法。文献中已出现大量高维变量选择方法,为研究其中有影响的几种方法的适用范围和利弊,本文考虑了lasso、自适应lasso等变量选择方法来研... 高维数据已成为现代大数据分析中的热点研究领域。变量选择是一种被广泛用于高维数据分析问题的方法。文献中已出现大量高维变量选择方法,为研究其中有影响的几种方法的适用范围和利弊,本文考虑了lasso、自适应lasso等变量选择方法来研究logistic回归模型中的变量选择问题。首先,通过随机模拟实验研究,分别在低维和高维的情况下比较不同变量选择方法的预测和变量选择效果。然后,在实际数据集中做进一步地实证比较研究。研究结果表明:在同等条件下,自适应lasso在模型预测和可解释性方面均比lasso更具优势。 展开更多
关键词 高维数据 变量选择 LOGISTIC回归模型
在线阅读 下载PDF
基于近红外的红茶发酵中TFs/TRs评价模型研究 预览
7
作者 邓余良 胡强 +2 位作者 夏康炎 陈伟东 董春旺 《现代农业装备》 2019年第4期64-70,共7页
基于近红外光谱和化学计量学方法,建立了红茶发酵过程中茶黄素和茶红素比值(TFs/TRs)的预测模型,为发酵品质的快速评价提供方法。本研究以标准正态变量变换法(SNVT)预处理的光谱数据作为输入变量,采用Si和CARS联合方法筛选出11个特征变... 基于近红外光谱和化学计量学方法,建立了红茶发酵过程中茶黄素和茶红素比值(TFs/TRs)的预测模型,为发酵品质的快速评价提供方法。本研究以标准正态变量变换法(SNVT)预处理的光谱数据作为输入变量,采用Si和CARS联合方法筛选出11个特征变量,使变量压缩率达98.6%。基于特征变量,分别构建了TFs/TRs值的线性(PLS,Si-PLS,Si-CARS-PLS)和非线性(Si-CARS-ELM,Si-CARS-ELMAdaBoost预测模型。通过模型性能比较表明,Si-CARS-ELM-AdaBoost强预测器模型,其预测性能高于ELM模型和线性模型,并明显优于全光谱的PLS模型,校正集和预测集的相关系数为0.957和0.934,均方根误差分别为0.004 1和0.004 4。近红外光谱可用于红茶TFs/TRs值的快速预测方法,结合特征变量选择算法能有效简化模型,提高预测精度。 展开更多
关键词 红茶 发酵 近红外光谱 变量选择 模型
在线阅读 下载PDF
面板数据复合分位数回归模型的渐进相对效率 预览
8
作者 刘燕 范永辉 《哈尔滨商业大学学报:自然科学版》 CAS 2019年第1期105-108,共4页
针对面板数据个体固定效应复合分位数回归模型,研究回归系数估计的渐进相对效率.采用计算复合分位数回归估计和最小二乘法估计的协方差矩阵的迹的比值,计算结果表明复合分位数回归相对于最小二乘法的渐进相对效率的比值大于70%.还将Zou... 针对面板数据个体固定效应复合分位数回归模型,研究回归系数估计的渐进相对效率.采用计算复合分位数回归估计和最小二乘法估计的协方差矩阵的迹的比值,计算结果表明复合分位数回归相对于最小二乘法的渐进相对效率的比值大于70%.还将Zou在2008年提出的适应性lasso的想法应用于此面板数据个体固定效应复合分位数回归模型,构造出适应性lasso惩罚复合分位数回归估计,并在适当条件下证明其估计的渐进性质. 展开更多
关键词 面板数据 复合分位数回归 渐进相对效率 适应性lasso 变量选择 渐进正态
在线阅读 下载PDF
基于Spatial AIC准则的空间自回归模型变量选择研究
9
作者 王周伟 陶志鹏 张元庆 《数理统计与管理》 CSSCI 北大核心 2019年第1期69-80,共12页
变量选择直接决定着空间计量经济模型的有效程度与实证研究结果。为有效解决空间自回归模型(即SAR模型)的变量选择问题,本文利用Kullback-Laible信息量最大化,把AIC准则运用到SAR模型构建,推导出Spatial AIC统计量,提出Spatial AIC准则... 变量选择直接决定着空间计量经济模型的有效程度与实证研究结果。为有效解决空间自回归模型(即SAR模型)的变量选择问题,本文利用Kullback-Laible信息量最大化,把AIC准则运用到SAR模型构建,推导出Spatial AIC统计量,提出Spatial AIC准则。然后利用统计理论证明Spatial AIC准则选择SAR模型变量的渐近最优性;利用蒙特卡洛模拟方法,比较Spatial AIC准则、经典AIC准则和Lasso方法用于SAR模型变量选择的有限大样本性质;利用空间相关的沪深300成分股股票收益率数据,采用Spatial AIC准则和Lasso方法,分别构建股票收益率财务因素的空间自相关模型,实证比较其相对有效性。三种结果均表明Spatial AIC准则能够更好地解决SAR模型变量选择问题。 展开更多
关键词 空间自回归模型 变量选择 SPATIAL AIC准则 渐进最优性 有限大样本性质
高维混料模型的LASSO变量选择
10
作者 冷薇 李俊鹏 张崇岐 《数理统计与管理》 CSSCI 北大核心 2019年第1期81-86,共6页
变量选择是统计建模中重要的问题。当试验数据维数很高时,传统变量选择方法的应用受到了很多制约。本文以高维混料试验为基础,比较了AIC准则和LASSO在变量选择问题上的优良性。通过实例验证,LASSO可以快速且准确地对高维混料模型中的变... 变量选择是统计建模中重要的问题。当试验数据维数很高时,传统变量选择方法的应用受到了很多制约。本文以高维混料试验为基础,比较了AIC准则和LASSO在变量选择问题上的优良性。通过实例验证,LASSO可以快速且准确地对高维混料模型中的变量进行筛选,从而得出最优模型,达到降低成本、提高利益的目的。 展开更多
关键词 高维混料模型 变量选择 LASSO
高维广义线性模型的拟似然自适应Lasso估计 预览 被引量:1
11
作者 陈夏 崔艳 《陕西师范大学学报:自然科学版》 CAS CSCD 北大核心 2019年第2期1-9,共9页
利用惩罚拟似然方法,讨论高维广义线性模型的拟似然自适应Lasso估计。该方法能同时进行变量选择和参数估计。在适当的条件下,证明了所得估计的相合性和Oracle性质,并利用数据模拟和实例分析说明了所提方法的优良性质。
关键词 广义线性模型 惩罚拟似然 变量选择 Oracle性质
在线阅读 下载PDF
Ensemble-SISPLS近红外光谱变量选择方法 预览
12
作者 李四海 赵磊 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第4期1047-1052,共6页
近红外光谱具有高维小样本的特点,变量选择是提高定量分析模型稳健性和可解释性的一种有效方法。确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法,广泛用于基因微阵列数据的变量选择。SIS具有将数据维度降低至样本大小... 近红外光谱具有高维小样本的特点,变量选择是提高定量分析模型稳健性和可解释性的一种有效方法。确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法,广泛用于基因微阵列数据的变量选择。SIS具有将数据维度降低至样本大小规模的能力,其降维能力与LASSO相当,在相当宽泛的近似条件下,由于具有安全筛选性质,所有重要变量被保留的概率趋于1。基于确定独立筛选偏最小二乘(SIS-SPLS)的变量选择是一种迭代式的SIS变量选择方法,首先利用SIS方法完成光谱重要变量的初选;然后根据重要变量的边际相关性大小进行逐步前向选择:建立偏最小二乘回归模型,依据贝叶斯信息准则(BIC)确定最终的变量选择结果。SIS-SPLS以逐步前向选择的方式实现对重要变量的增量式筛选,随着潜变量个数的增加及因变量残差的逐步减小, SIS-SPLS方法选择的变量个数将趋于稳定。然而仅以边际相关性对变量重要性进行评价,当光谱变量个数远大于样本数时,该方法也存在选择的变量过多、变量选择结果不够稳健等问题。为进一步提高小样本情况下变量选择的稳健性,将集成学习引入SIS-SPLS方法之中,提出了一种集成SIS-SPLS变量选择方法(Ensemble-SISPLS)。该方法首先对校正集样本进行自助重采样,对采样得到的每一个校正子集分别使用SIS-SPLS方法进行变量筛选,通过投票机制并设置频次阈值对所有校正子集的变量选择结果进行集成,选择出现频次大于给定阈值的变量并建立偏最小二乘回归模型,计算5折交叉验证均方根误差。对频次阈值和潜变量个数两个关键参数使用网格搜索法进行优选,根据子模型的交叉验证均方根误差和变量个数对子模型性能进行综合评价,以最优子模型包含的变量作为最终的变量选择结果。分别在Corn数据集和当归数据集上进行变量选择实验,比较Ense 展开更多
关键词 近红外光谱 变量选择 确定独立筛选 偏最小二乘 集成学习
在线阅读 下载PDF
基于EXP罚的浙江省经济增长影响因素研究 预览
13
作者 孙金金 黄文武 +2 位作者 李杨 林芬芳 王延新 《宁波工程学院学报》 2019年第1期72-77,共6页
通过最小二乘估计、逐步回归、Lasso估计和EXP罚估计来实证分析浙江省经济增长的15个影响因素,结果发现EXP变量选取方法对经济领域的研究有积极作用,从而进一步认识各要素对浙江省经济增长的影响程度。
关键词 变量选择 Lasso EXP罚 经济增长 影响因素
在线阅读 下载PDF
成分数据的logistic回归模型研究
14
作者 李玉莹 张景肖 《数理统计与管理》 CSSCI 北大核心 2019年第3期442-449,共8页
由于成分数据的定和约束,使得不能直接用经典的统计方法对其进行回归建模。本文基于log-ratio等一系列变换,建立了带有等式约束的成分数据的logistic回归模型,并将其应用于肠道菌群和2型糖尿病的关系的研究中。数值模拟与实证结果表明,... 由于成分数据的定和约束,使得不能直接用经典的统计方法对其进行回归建模。本文基于log-ratio等一系列变换,建立了带有等式约束的成分数据的logistic回归模型,并将其应用于肠道菌群和2型糖尿病的关系的研究中。数值模拟与实证结果表明,本文所提出的模型有良好的表现。 展开更多
关键词 成分数据 变量选择 LOGISTIC回归 ADMM算法 微生物学
探究变量选择的常见方法 预览
15
作者 鄂琳 《通讯世界》 2019年第3期205-206,共2页
变量选择是统计建模的重要环节,选择合适的变量可以对数据进行更有效的分析,从而建立更准确的模型。本文主要介绍几种变量选择的常见方法包括主成分回归、偏最小二乘方法、AIC准则以及BIC准则,同时分类比较不同方法的统计共性和优缺点,... 变量选择是统计建模的重要环节,选择合适的变量可以对数据进行更有效的分析,从而建立更准确的模型。本文主要介绍几种变量选择的常见方法包括主成分回归、偏最小二乘方法、AIC准则以及BIC准则,同时分类比较不同方法的统计共性和优缺点,明确不同方法适合的条件。最终本文归纳研究内容,并研究的最新发展方向和所面临的挑战。 展开更多
关键词 变量选择 主成分回归 偏最小二乘 AIC准则 BIC准则
在线阅读 下载PDF
随机前沿模型变量选择研究 预览
16
作者 蒋青嬗 钟世川 《统计与决策》 CSSCI 北大核心 2019年第7期5-9,共5页
变量选择可降低模型复杂度、提高模型解释能力且避免多重共线性问题,目前暂无对随机前沿模型进行变量选择的研究。文章开创性地使用Alasso惩罚方法对随机前沿模型进行变量选择,该法为连续最优化过程,具有较好的稳定性和较少的计算量。... 变量选择可降低模型复杂度、提高模型解释能力且避免多重共线性问题,目前暂无对随机前沿模型进行变量选择的研究。文章开创性地使用Alasso惩罚方法对随机前沿模型进行变量选择,该法为连续最优化过程,具有较好的稳定性和较少的计算量。蒙特卡罗模拟表明:文中方法能以较高的准确率剔除随机前沿模型中的非重要变量、保留重要变量和识别真实模型,变量选择的准确性较高。而且,文中方法有助于提高参数的估计效果,由此得出的影响因素分析和要素投入比计算较可靠。 展开更多
关键词 随机前沿模型 变量选择 复合误差 Alasso惩罚 BIC准则
在线阅读 下载PDF
高维数据中变量选择研究 预览
17
作者 宋瑞琪 朱永忠 王新军 《统计与决策》 CSSCI 北大核心 2019年第2期13-16,共4页
如何在高维数据空间中筛选有用变量,提取有用的信息,是大数据时代研究的热点之一。文章将变量选择的方法应用于高维数据,通过模拟仿真,引进敏感性与特异性,分析比较岭回归、Lasso、自适应Lasso以及Elastic Net回归等方法的适用领域,并... 如何在高维数据空间中筛选有用变量,提取有用的信息,是大数据时代研究的热点之一。文章将变量选择的方法应用于高维数据,通过模拟仿真,引进敏感性与特异性,分析比较岭回归、Lasso、自适应Lasso以及Elastic Net回归等方法的适用领域,并指出变量选择方法的应用前景。 展开更多
关键词 大数据 系数压缩法 变量选择 高维数据
在线阅读 下载PDF
零膨胀计数数据的联合建模及变量选择 预览
18
作者 胡亚南 田茂再 《统计研究》 CSSCI 北大核心 2019年第1期104-114,共11页
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题。对于零膨胀泊... 零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题。对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然,由零膨胀部分和泊松部分两项组成。考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数。本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中。 展开更多
关键词 零膨胀泊松模型 变量选择 联合建模
在线阅读 下载PDF
参数估计和变量选择的二次推断函数方法研究新进展
19
作者 赵明涛 许晓丽 《统计与决策》 CSSCI 北大核心 2019年第15期22-28,共7页
二次推断函数已成为纵向数据分析的重要工具。文章介绍了参数和半参数模型的二次推断函数方法研究成果及最新进展,主要包括边际模型和混合效应模型中基于二次推断函数的参数估计、变量选择;二次推断函数方法在经验似然、测量误差模型方... 二次推断函数已成为纵向数据分析的重要工具。文章介绍了参数和半参数模型的二次推断函数方法研究成果及最新进展,主要包括边际模型和混合效应模型中基于二次推断函数的参数估计、变量选择;二次推断函数方法在经验似然、测量误差模型方面的研究成果。指出了二次推断函数方法尚待解决的一些问题并对其未来的研究进行展望。 展开更多
关键词 纵向数据 二次推断函数 惩罚二次推断函数 参数估计 变量选择
基于附加噪音协变量的Elastic Net高维统计分析
20
作者 丁毅涛 胡俊英 +1 位作者 李永新 李建辉 《统计与决策》 CSSCI 北大核心 2019年第15期74-78,共5页
文章研究协变量中具有附加噪音的Elastic Net模型的高维统计性质。通过对矩阵■进行分析,以及选择适当的■。得到了Elastic Net估计的界。当矩阵■满足下限制特征条件,并且■和■的偏差条件成立时,任意解■与未知参数■有统一误差界。
关键词 变量选择 Lasso ELASTIC NET 限制特征条件
上一页 1 2 27 下一页 到第
使用帮助 返回顶部 意见反馈