期刊文献+
共找到342篇文章
< 1 2 18 >
每页显示 20 50 100
基于双向注意力机制图像描述方法研究 预览
1
作者 陶云松 张丽红 《测试技术学报》 2019年第4期346-350,364共6页
大多数图像描述任务中每个单词的生成都依赖于图像全部信息和生成的上文信息,其中包括许多无关的图像信息,而且没有学习下文信息.为解决该问题,提出了一种双注意力机制,先使用上一次的图像显著信息与词向量一起预测当前的隐层状态,再使... 大多数图像描述任务中每个单词的生成都依赖于图像全部信息和生成的上文信息,其中包括许多无关的图像信息,而且没有学习下文信息.为解决该问题,提出了一种双注意力机制,先使用上一次的图像显著信息与词向量一起预测当前的隐层状态,再使用当前的隐层状态预测当前图像显著信息.将双注意力机制与双向长短期记忆网络结合起来构成双向双注意力网络,并与卷积神经网络共同构成图像描述系统框架.该框架首先采用卷积神经网络提取图像特征,然后将图像特征输入到含有注意力机制的双向长短期记忆网络中,双向双注意力网络同时获取前向和后向的图像显著信息与隐层状态,产生图像描述.在数据集Flickr30k与MSCOCO上进行模型训练与测试.结果表明,模型分别与只含有注意力机制和只含有双向循环神经网络模型相比,图像描述准确率获得了提高. 展开更多
关键词 图像描述 注意力机制 双向长短期记忆网络 注意力机制 双向双注意力网络
在线阅读 免费下载
基于序列到序列模型的抽象式中文文本摘要研究
2
作者 余传明 朱星宇 +1 位作者 龚雨田 安璐 《图书情报工作》 CSSCI 北大核心 2019年第11期108-117,共10页
[目的/意义]为更好地处理文本摘要任务中的未登录词(out of vocabulary, 00V ),同时避免摘要重复,提高文本摘要的质量,本文以解决00V问题和摘要自我重复问题为研究任务,进行抽象式中文文本摘要研究。[方法/过程]在序列到序列(sequence t... [目的/意义]为更好地处理文本摘要任务中的未登录词(out of vocabulary, 00V ),同时避免摘要重复,提高文本摘要的质量,本文以解决00V问题和摘要自我重复问题为研究任务,进行抽象式中文文本摘要研究。[方法/过程]在序列到序列(sequence to sequence, seq2seq)模型的基础上增加指向生成机制和覆盖处理机制,通过指向生成将未登录词拷贝到摘要中以解决未登录词问题,通过覆盖处理避免注意力机制(attentionmechanism)反复关注同一位置,以解决重复问题。将本文方法应用到LCSTS中文摘要数据集上进行实验,检验模型效果。[结果/结论]实验结果显示,该模型生成摘要的ROUGE ( recall -oriented understudy for gisting evaluation)分数高于传统的seq2seq模型以及抽取式文本摘要模型,表明指向生成和覆盖机制能够有效解决未登录词问题和摘要重复问题,从而显著提升文本摘要质量。 展开更多
关键词 抽象式文本摘要 序列到序列模型 注意力机制 覆盖机制 指向生成机制
面向文本结构的混合分层注意力网络的话题归类 预览
3
作者 车蕾 杨小平 +2 位作者 王良 梁天新 韩镇远 《中文信息学报》 CSCD 北大核心 2019年第5期93-102,112共11页
针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组... 针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字-词语-句层次。TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用。在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率。 展开更多
关键词 深度学习 注意力机制 混合分层注意力网络 话题归类
在线阅读 下载PDF
基于LSTM-DA神经网络的农产品价格指数短期预测模型 预览
4
作者 贾宁 郑纯军 《计算机科学》 CSCD 北大核心 2019年第S11期62-65,71,共5页
农产品价格一直是维持社会经济生活安定的重点关注领域,由于农产品预测价格与影响因素之间存在非线性关系,递归神经网络虽然适用于时间序列的预测,但是针对长时间的跨度,其预测效果有限。基于此,根据农产品价格特点,设计了一种LSTM-DA(L... 农产品价格一直是维持社会经济生活安定的重点关注领域,由于农产品预测价格与影响因素之间存在非线性关系,递归神经网络虽然适用于时间序列的预测,但是针对长时间的跨度,其预测效果有限。基于此,根据农产品价格特点,设计了一种LSTM-DA(Long Short-Term Memory-Double Attention,双重注意力机制与长短期记忆网络融合)神经网络模型。它将卷积注意力网络(Convolutional Neural Networks,CNN)、长短期记忆网络(Long Short-Term Memory,LSTM)和注意力机制相结合,针对不同成分的影响因子通过卷积注意力网络进行特征提取,调节其对应的权重并馈送至长短期记忆网络模型中以呈现时间序列的影响,在此基础上,将结果再次送入注意力机制进行权重调节,最终将得到的结果用于农产品价格指数的短期预测。实验前,采用多线程机制从多个农业信息平台中爬取海量的价格、天气等相关数据,在对其进行解析和清洗的基础上,将其存入分布式文件系统(Hadoop Distributed File System,HDFS)中;实验时,采用长短期记忆网络作为基线。实验结果表明,与传统的单一模型相比,此模型不仅可以提升预测精度,而且预测的农产品价格指数可以准确地描述未来一周内蔬菜类产品的整体趋势。 展开更多
关键词 卷积注意力网络 长短期记忆网络 注意力机制 网络数据爬取 价格预测
在线阅读 免费下载
基于时空注意力深度模型的动态链路预测
5
作者 陈晋音 徐轩桁 +2 位作者 吴洋洋 陈一贤 郑海斌 《小型微型计算机系统》 CSCD 北大核心 2019年第11期2365-2373,共9页
动态网络的链路预测在复杂网络的各个领域均有应用.动态网络的节点和链路随时间动态变化(出现或者消失),因此其链路预测比静态链路预测更具有挑战.本文提出一种时空注意力的深度模型(GLAT),通过提取动态网络的时空特征,实现端到端(end-t... 动态网络的链路预测在复杂网络的各个领域均有应用.动态网络的节点和链路随时间动态变化(出现或者消失),因此其链路预测比静态链路预测更具有挑战.本文提出一种时空注意力的深度模型(GLAT),通过提取动态网络的时空特征,实现端到端(end-to-end)的动态网络的链路预测.GLAT通过注意力长短时记忆网络(LSTM-attention)和注意力图卷积网络(GCN-attention)相结合,利用LSTM-attention学习网络节点连边状态的时序信息,利用GCN-attention学习每个时刻网络的结构特征,通过提出的两种时空注意力机制可有效关注与动态链路预测任务相关的时空特征.本文对四个真实世界的数据集展开实验验证,GLAT模型在AUC、GMAUC、误差率这几个指标上分别比对比算法提高了9. 41%、13. 76%、82. 41%.本文使用度中心性(DC)和链路介数中心性(EBC)来衡量每条链路的重要性,实验证明,GLAT模型在这两个重要性链路上的预测误差率上比对比算法分别提高了32. 2%、17. 77%.因此GLAT模型在预测准确性,错误率和动态跟踪方面优于现有方法. 展开更多
关键词 动态网络 链路预测 注意力机制 长短时记忆网络 注意力图卷积网络
神经机器翻译的系统融合方法 预览
6
作者 谭敏 殷明明 段湘煜 《厦门大学学报:自然科学版》 CAS CSCD 北大核心 2019年第4期600-607,共8页
为了提高机器翻译模型的泛化能力,基于神经机器翻译系统,将系统融合技术应用于模型训练过程.在神经机器翻译系统的基本结构——编码器-解码器结构的基础上,提出5种融合方法(平均融合、权重融合、拼接融合、门机制融合和注意力机制融合)... 为了提高机器翻译模型的泛化能力,基于神经机器翻译系统,将系统融合技术应用于模型训练过程.在神经机器翻译系统的基本结构——编码器-解码器结构的基础上,提出5种融合方法(平均融合、权重融合、拼接融合、门机制融合和注意力机制融合)分别应用于多个编码器-一个解码器的融合、多个编码器-多个解码器的融合和一个编码器-多个解码器的融合.在中英翻译任务上进行实验,相对于基准系统,系统融合方法改进的机器翻译模型的机器双语互译评估(BLEU)值最终提升了0.59~3.01个百分点.实验结果表明,系统融合能有效地提升译文质量. 展开更多
关键词 神经机器翻译 循环神经网络 系统融合 注意力机制 机制
在线阅读 免费下载
基于症状权重自适应调整机制的医学领域问答技术研究 预览
7
作者 毕铭文 《山东工业技术》 2019年第4期233-233,231共2页
在线医学智能问答系统技术挑战主要在于症状语义理解和用户描述表示。本文提出了症状权重自适应调整机制的注意力模型(SFA)。使得注意力权重可以根据历史病例库的更新而自适应调整,集成了本文提出的问答模型的医学领域的问答系统性能也... 在线医学智能问答系统技术挑战主要在于症状语义理解和用户描述表示。本文提出了症状权重自适应调整机制的注意力模型(SFA)。使得注意力权重可以根据历史病例库的更新而自适应调整,集成了本文提出的问答模型的医学领域的问答系统性能也得到了显著的提升。 展开更多
关键词 问答系统 注意力机制 权重自适应调整机制
在线阅读 下载PDF
基于指针生成网络的自动摘要 预览
8
作者 赵增顺 孙骞 +2 位作者 杨皓然 滕升华 常发亮 《计算机工程与设计》 北大核心 2019年第9期2692-2696,共5页
通过对生成式自动摘要常用方法中的基于注意力机制的序列到序列基本模型进行研究,发现基本模型存在摘要细节错误、摘要短语重复、训练效率低等问题。针对这些问题,对基本模型进行改进。通过引入指针网络的复制机制,将其与基本模型的生... 通过对生成式自动摘要常用方法中的基于注意力机制的序列到序列基本模型进行研究,发现基本模型存在摘要细节错误、摘要短语重复、训练效率低等问题。针对这些问题,对基本模型进行改进。通过引入指针网络的复制机制,将其与基本模型的生成机制相结合,共同指导摘要的生成,有效提高摘要细节的准确率;通过引入覆盖率向量,对注意力机制进行二次利用,使摘要的重复短语大大降低。实验结果表明,改进模型优于基本模型,基本解决了摘要细节错误和短语重复的问题,验证了其有效性。 展开更多
关键词 序列模型 注意力机制 指针网络 复制机制 覆盖率向量
在线阅读 下载PDF
基于循环神经网络的股指价格预测研究 预览
9
作者 王理同 薛腾腾 +1 位作者 王惠敏 刘震 《浙江工业大学学报》 CAS 北大核心 2019年第2期186-191,共6页
利用基于注意力机制的循环神经网络构建股指价格的预测模型,可以很巧妙地提取出股指价格的各类影响因子的深层特征,与简单的单因子循环网络或者传统的多因子循环网络相比,该网络能够提高股指价格预测的准确性。为了加快模型的训练速度,... 利用基于注意力机制的循环神经网络构建股指价格的预测模型,可以很巧妙地提取出股指价格的各类影响因子的深层特征,与简单的单因子循环网络或者传统的多因子循环网络相比,该网络能够提高股指价格预测的准确性。为了加快模型的训练速度,减少模型参数量,在具体实验中,采用了去除注意力机制中解码环节的循环网络。仿真实验表明:在上证50股指每分钟价格的预测问题上,该网络模型比其他的传统网络模型的预测精度更高,而且预测效果与不去除解码环节的网络相比无明显差异,并且模型加快了对数据的处理速度,证实该方法是一种有效的股指价格预测方法。 展开更多
关键词 注意力机制 循环神经网络 长短时记忆机制 股指价格预测
在线阅读 下载PDF
基于序列到序列模型的文本到信息框生成的研究 预览
10
作者 鲍军威 周明 赵铁军 《智能计算机与应用》 2019年第3期1-5,10共6页
本文展示了一种序列到序列的模型(Seq2Seq)来基于文本生成信息框(Infobox),信息框指的是一组"属性-值"对。该模型以端到端的方式工作,可利用一个编码器将一个文本段落表示成一个隐向量序列,然后通过解码器来生成信息框。本文... 本文展示了一种序列到序列的模型(Seq2Seq)来基于文本生成信息框(Infobox),信息框指的是一组"属性-值"对。该模型以端到端的方式工作,可利用一个编码器将一个文本段落表示成一个隐向量序列,然后通过解码器来生成信息框。本文在WIKIBIO数据集上进行实验。研究提出的序列到序列模型取得了58.2的F1值,该结果比流水线式的基准方法显著提升了21.0个百分点。实验结果表明,本模型具有以生成序列的方式来生成"属性-值"对的能力。引入注意力与拷贝机制可以提升模型的准确率。更重要的是,研究观察到该拷贝机制有能力从输入文本中拷贝稀有词来生成目标端信息框中的"值"。 展开更多
关键词 文本到信息框生成 序列到序列模型 注意力机制 拷贝机制
在线阅读 免费下载
基于CNN-ATTBiLSTM的文本情感分析 预览
11
作者 刘书齐 王以松 陈攀峰 《贵州大学学报:自然科学版》 2019年第2期85-89,共5页
卷积神经网络(CNN)和循环神经网络(RNN)已经被证明在文本情感分析中是有效的文本表示模型。然而,CNN只考虑连续词之间的局部信息,忽略了词语之间长距离的上下文依赖信息,在前向传播的过程中池化操作会丢失一部分语义信息;RNN在文本长度... 卷积神经网络(CNN)和循环神经网络(RNN)已经被证明在文本情感分析中是有效的文本表示模型。然而,CNN只考虑连续词之间的局部信息,忽略了词语之间长距离的上下文依赖信息,在前向传播的过程中池化操作会丢失一部分语义信息;RNN在文本长度较短的情况下相比CNN并没有展现应有的优势。本文通过融合CNN和基于注意力机制的双向长短期记忆(ATTBiLSTM)网络提取的特征,提高模型的文本表示能力,同时为了防止过拟合,采取dropout策略。在中科院谭松波博士整理的酒店评论数据集上进行实验,结果表明本文提出的模型相比基线模型可以提取出更丰富的特征,效果较基线模型有所提升。 展开更多
关键词 卷积神经网络 注意力机制 双向长短期记忆神经网络 文本情感分析
在线阅读 下载PDF
基于卷积神经网络与注意力模型的人体步态识别 预览
12
作者 汪涛 汪泓章 +1 位作者 夏懿 张德祥 《传感技术学报》 CAS CSCD 北大核心 2019年第7期1027-1033,共7页
步态识别是非接触式生物识别领域中一个比较前沿的课题,它主要是利用行走过程中个体步态之间的差异来识别人的身份。近年来,随着可穿戴传感器在人体信息采集中的广泛应用,利用惯性传感器采集步行过程中的线性加速度以及角速度进而实现... 步态识别是非接触式生物识别领域中一个比较前沿的课题,它主要是利用行走过程中个体步态之间的差异来识别人的身份。近年来,随着可穿戴传感器在人体信息采集中的广泛应用,利用惯性传感器采集步行过程中的线性加速度以及角速度进而实现步态特征提取是该领域中一个研究热点。为了提取更加有效的步态识别特征,利用基于注意力机制的卷积神经网络来进行步态特征的深度学习,其主要流程是先对原始数据进行预处理,接着利用卷积神经网络对处理后的数据提取步态特征,然后利用注意力机制对步态特征进行加强,最后再分类。实验结果证明了本文方法的优越性。 展开更多
关键词 步态识别 深度学习 注意力机制 神经网络 步态周期
在线阅读 下载PDF
注意力机制在深度学习中的研究进展 预览
13
作者 朱张莉 饶元 +2 位作者 吴渊 祁江楠 张钰 《中文信息学报》 CSCD 北大核心 2019年第6期1-11,共11页
注意力机制逐渐成为目前深度学习领域的主流方法和研究热点之一,它通过改进源语言表达方式,在解码中动态选择源语言相关信息,从而极大改善了经典Encoder-Decoder框架的不足。该文在提出传统基于Encoder-Decoder框架中存在的长程记忆能... 注意力机制逐渐成为目前深度学习领域的主流方法和研究热点之一,它通过改进源语言表达方式,在解码中动态选择源语言相关信息,从而极大改善了经典Encoder-Decoder框架的不足。该文在提出传统基于Encoder-Decoder框架中存在的长程记忆能力有限、序列转化过程中的相互关系、模型动态结构输出质量等问题的基础上,描述了注意力机制的定义和原理,介绍了多种不同的分类方式,分析了目前的研究现状,并叙述了目前注意力机制在图像识别、语音识别和自然语言处理等重要领域的应用情况。同时,进一步从多模态注意力机制、注意力的评价机制、模型的可解释性及注意力与新模型的融合等方面进行了探讨,从而为注意力机制在深度学习中的应用提供新的研究线索与方向。 展开更多
关键词 深度学习 注意力机制 编码器解码器
在线阅读 下载PDF
基于注意力双层LSTM的长文本情感分类方法 预览
14
作者 毛焱颖 《重庆电子工程职业学院学报》 2019年第2期118-125,共8页
针对由于长文本评论篇幅长,正负情感特征离散分布且每个句子的的情感语义贡献度不同,导致难以准确判断全文情感倾向的问题,提出一种基于注意力双层LSTM的长文本情感倾向性分析方法。该方法首先利用LSTM学习句子级情感向量表示;然后采用... 针对由于长文本评论篇幅长,正负情感特征离散分布且每个句子的的情感语义贡献度不同,导致难以准确判断全文情感倾向的问题,提出一种基于注意力双层LSTM的长文本情感倾向性分析方法。该方法首先利用LSTM学习句子级情感向量表示;然后采用双向LSTM对文档中所有句子的情感语义及句子间的语义关系进行编码,并基于注意力机制对具有不同情感语义贡献度的句子进行权值分配;最后,加权句子级情感向量表示得到长文本的文档级情感向量表示,经过Softmax层得到长文本情感倾向。在Yelp2015和IMDb电影评论语料上实验,结果表明该方法能达到较好的分类效果,进一步提升了情感分类的正确率。 展开更多
关键词 长短时记忆网络 注意力机制 评论文本 情感分类
在线阅读 下载PDF
多特征融合的中文实体关系抽取研究 预览 被引量:1
15
作者 孙康康 《无线互联科技》 2019年第9期164-165,共2页
词性等特征在句子中扮演着重要的角色,往往能揭示命名实体之间的关系,而当前的实体关系抽取任务大多仅基于词向量进行,忽视了词性等对实体关系抽取任务有益的特征。因此,文章采用了一种多特征融合的方式进行中文实体关系抽取模型的训练... 词性等特征在句子中扮演着重要的角色,往往能揭示命名实体之间的关系,而当前的实体关系抽取任务大多仅基于词向量进行,忽视了词性等对实体关系抽取任务有益的特征。因此,文章采用了一种多特征融合的方式进行中文实体关系抽取模型的训练,在以词向量作为输入单元的前提下融合了句子中词语的词性、距离实体对的位置、实体标注相关特征,并以双向长短期记忆网络结合注意力机制的模型进行了中文实体关系抽取的实验,实验结果表明,基于多特征融合的训练方式提升了中文实体关系抽取的效果。 展开更多
关键词 实体关系抽取 多特征 双向长短期记忆网络 注意力机制
在线阅读 下载PDF
基于预读及简单注意力机制的句子压缩方法 预览 被引量:1
16
作者 鹿忠磊 刘文芬 +2 位作者 周艳芳 胡学先 王彬宇 《计算机应用研究》 CSCD 北大核心 2019年第2期371-375,394共6页
针对英文句子压缩方法进行研究,提出一种基于预读及简单注意力机制的压缩方法。在编码器—解码器(encoder-decoder)框架下,以循环门单元(gated recurrent unit,GRU)神经网络模型为基础,在编码阶段对原句语义进行两次建模。首次建模结果... 针对英文句子压缩方法进行研究,提出一种基于预读及简单注意力机制的压缩方法。在编码器—解码器(encoder-decoder)框架下,以循环门单元(gated recurrent unit,GRU)神经网络模型为基础,在编码阶段对原句语义进行两次建模。首次建模结果作为全局信息,加强二次语义建模,得到更全面准确的语义编码向量。解码阶段充分考虑删除式句子压缩的特殊性,适用简单注意力(3t-attention)机制,将编码向量中与当前解码时刻最相关的语义部分输入到解码器中,提高预测效率及准确率。在谷歌新闻句子压缩数据集上的实验结果表明,所提压缩方法优于已有公开结果。因此,预读及简单注意力机制可有效提高英文句子压缩精度。 展开更多
关键词 自然语言处理 句子压缩 预读 注意力机制
在线阅读 下载PDF
面向初等数学的知识点关系提取研究 预览
17
作者 杨东明 杨大为 +3 位作者 顾航 洪道诚 高明 王晔 《华东师范大学学报:自然科学版》 CAS CSCD 北大核心 2019年第5期53-65,共13页
随着互联网技术的发展,在线教育已经改变了学生的学习方式.但由于缺乏完整的知识体系,在线教育存在着智能化程度低和"信息迷航"的问题.因此,构建知识体系成为在线教育平台的核心技术.知识点间的关系提取是知识体系构建的主要... 随着互联网技术的发展,在线教育已经改变了学生的学习方式.但由于缺乏完整的知识体系,在线教育存在着智能化程度低和"信息迷航"的问题.因此,构建知识体系成为在线教育平台的核心技术.知识点间的关系提取是知识体系构建的主要任务之一,目前比较高效的关系提取算法主要是监督式的.但是这类方法受限于文本质量低、语料稀缺、标签数据难获取、特征工程效率低、难以提取有向关系等挑战.为此,基于百科语料和远程监督思想,研究了知识点间的关系提取算法.提出了基于关系表示的注意力机制,该方法能够提取知识点间的有向关系信息.结合了GCN和LSTM的优势,提出了GCLSTM,该模型更好地提取了句子中的多点信息.基于Transformer架构和关系表示的注意力机制,提出了适用于有向关系提取的BTRE模型,降低了模型的复杂度.设计并实现了知识点关系提取系统.通过设计3组对比实验,验证了模型的性能和效率. 展开更多
关键词 知识体系构建 关系提取 注意力机制 远程监督 TRANSFORMER
在线阅读 免费下载
结合注意力机制的相对GAN螺栓图像生成 预览
18
作者 戚银城 郎静宜 +2 位作者 赵振兵 江爱雪 聂礼强 《电测与仪表》 北大核心 2019年第19期64-69,共6页
螺栓缺陷非常容易引起输电线路异常甚至故障,但大量的缺陷数据难以获得。将生成式对抗网络应用于缺陷螺栓图像的生成,针对生成过程中存在的图像质量差、生成样本单一,模型收敛缓慢等问题,提出一种基于改进DCGAN的螺栓图像生成方法。在... 螺栓缺陷非常容易引起输电线路异常甚至故障,但大量的缺陷数据难以获得。将生成式对抗网络应用于缺陷螺栓图像的生成,针对生成过程中存在的图像质量差、生成样本单一,模型收敛缓慢等问题,提出一种基于改进DCGAN的螺栓图像生成方法。在损失函数中加入相对均值鉴别器和梯度惩罚,平衡了生成器和判别器的能力,提高了样本质量和模型的收敛速度;在模型的生成器和鉴别器中引入注意力机制,捕获图像中长距离的像素特征,提高了缺陷样本的多样性;实验结果验证了改进方法的有效性,IS值提高了0.1,实现了缺陷样本的扩增。 展开更多
关键词 螺栓 生成式对抗网络 相对均值鉴别器 梯度惩罚 注意力机制
在线阅读 下载PDF
基于双向长短时记忆神经网络的句子分类 预览
19
作者 洪源 沈勇 《计算机与数字工程》 2019年第7期1762-1766,共5页
针对文本分类中的特征选择问题,在传统RNN的基础上设计一种基于注意力机制的双向长短时记忆神经网络模型。其中双向的LSTM网络解决了传统RNN的梯度消失问题,并且能够更加充分地利用句子的上下文信息[1]。加入注意力机制的模型可以获得... 针对文本分类中的特征选择问题,在传统RNN的基础上设计一种基于注意力机制的双向长短时记忆神经网络模型。其中双向的LSTM网络解决了传统RNN的梯度消失问题,并且能够更加充分地利用句子的上下文信息[1]。加入注意力机制的模型可以获得含有输入序列节点注意力概率分布的语义编码,从而在特征向量提取过程当中消减了信息的损失和冗余。通过与传统LSTM的对比实验,证明该模型的准确率和稳定性较传统方法有进一步提高。 展开更多
关键词 句子分类 特征提取 深度学习 注意力机制 LSTM模型
在线阅读 下载PDF
基于知识图谱的用户偏好神经建模框架 预览
20
作者 朱桂明 宾辰忠 +2 位作者 古天龙 陈炜 贾中浩 《模式识别与人工智能》 CSCD 北大核心 2019年第7期661-668,共8页
针对目前基于特征和基于路径的知识图谱感知推荐方法的不足,文中提出端到端的将知识图谱引入推荐系统的用户偏好神经建模框架(NUPM).该框架以用户在知识图谱中的历史访问项目为偏好起点,通过知识图谱中实体间的关系链接传播用户偏好,学... 针对目前基于特征和基于路径的知识图谱感知推荐方法的不足,文中提出端到端的将知识图谱引入推荐系统的用户偏好神经建模框架(NUPM).该框架以用户在知识图谱中的历史访问项目为偏好起点,通过知识图谱中实体间的关系链接传播用户偏好,学习用户的潜在偏好,同时使用注意力网络融合各传播阶段偏好特征以构建最终的用户偏好向量.在真实数据集上的对比实验表明文中框架在个性化推荐中对用户偏好刻画的有效性. 展开更多
关键词 推荐系统 知识图谱 偏好传播 注意力机制
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部 意见反馈