期刊文献+
共找到167篇文章
< 1 2 9 >
每页显示 20 50 100
一种基于Hownet的词向量表示方法 预览
1
作者 陈洋 罗智勇 《北京大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期22-28,共7页
针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后... 针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后,根据Hownet中词语与义原之间的定义关系,将词语向量表示视为相关义原所张成的子空间中的投影,并提出学习词向量表示的深度神经网络模型。实验表明,基于Hownet的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。 展开更多
关键词 词向量表示 HOWNET 词语相似性计算 词义消岐
在线阅读 免费下载
基于神经网络的词义消歧 预览
2
作者 王子牛 陈娅先 +2 位作者 高建瓴 吴建华 王许 《软件》 2019年第2期11-15,共5页
在计算机语言学中,词义消歧是自然语言处理的一个重要问题,词义消歧即指根据上下文确定对象语义的过程,在词义、句义、篇章中都会出现这种词语在上下文的语义环境中有不同的含义的现象。本文提出一种基于神经网络的模型实现词义消歧,将... 在计算机语言学中,词义消歧是自然语言处理的一个重要问题,词义消歧即指根据上下文确定对象语义的过程,在词义、句义、篇章中都会出现这种词语在上下文的语义环境中有不同的含义的现象。本文提出一种基于神经网络的模型实现词义消歧,将词向量输入神经网络,通过分类的方式实现消歧的目的。实验表明,基于神经网络的词义消歧比传统的统计方法消歧具有更高的准确度. 展开更多
关键词 词义消歧 自然语言处理 词向量 神经网络
在线阅读 下载PDF
一种半监督的汉语词义消歧方法 预览 被引量:2
3
作者 张春祥 徐志峰 高雪瑶 《西南交通大学学报》 EI CSCD 北大核心 2019年第2期408-414,共7页
为了解决自然语言处理领域中的一词多义问题,本文提出了一种利用多种语言学知识和词义消歧模型的半监督消歧方法.首先,以歧义词汇左、右邻接词单元的词形、词性和译文作为消歧特征,来构建贝叶斯(Bayes)词义分类器,并以歧义词汇左、右邻... 为了解决自然语言处理领域中的一词多义问题,本文提出了一种利用多种语言学知识和词义消歧模型的半监督消歧方法.首先,以歧义词汇左、右邻接词单元的词形、词性和译文作为消歧特征,来构建贝叶斯(Bayes)词义分类器,并以歧义词汇左、右邻接词单元的词形和词性作为消歧特征,来构建最大熵(maximum entropy,ME)词义分类器;其次,采用Co-Training算法并结合大量无标注语料来优化词义消歧模型;再次,进行了优化实验,在实验中,使用SemEval-2007:Task#5的训练语料和哈尔滨工业大学的无标注语料来优化贝叶斯分类器和最大熵分类器;最后,对优化后的词义消歧模型进行测试.测试结果表明:与基于支持向量机(support vectormachine,SVM)的词义消歧方法相比,本文所提出方法的消歧准确率提高了0.9%.词义消歧的性能有所提高. 展开更多
关键词 自然语言处理 词义消歧 最大熵 贝叶斯分类器
在线阅读 下载PDF
基于Bi-LSTM的生物医学文本语义消歧研究 预览
4
作者 罗曜儒 李智 《软件导刊》 2019年第4期57-59,63共4页
生物医学文本语义消歧研究中,上下文语义表示存在精度不高、忽略语言特性等问题,对此提出一种基于Bi-LSTM的新型语言模型。该模型通过考虑上下文词序将整个句义信息以无监督学习方式嵌入低维连续空间,并以此生成高质量的上下文表示,然... 生物医学文本语义消歧研究中,上下文语义表示存在精度不高、忽略语言特性等问题,对此提出一种基于Bi-LSTM的新型语言模型。该模型通过考虑上下文词序将整个句义信息以无监督学习方式嵌入低维连续空间,并以此生成高质量的上下文表示,然后利用该方法构建歧义向量,最终计算cosine相似度,完成对歧义词的分类。实验表明,相比传统线性语言模型,基于Bi-LSTM生成的语义向量能更好地表示歧义词的语义信息,并在不同生物医学文本数据集中达到高准确度(95.01/91.27)。 展开更多
关键词 语义消歧 Bi-LSTM 无监督学习 生物医学 上下文表示
在线阅读 免费下载
基于词向量的无监督词义消歧方法 预览
5
作者 吕晓伟 章露露 《软件导刊》 2018年第9期193-195,共3页
词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义... 词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义项,并考虑融合上下文与义项的语义相似度及义项分布频率进行词义消歧。在Senseval-3数据集上测试,结果表明,该方法能有效实现词义消歧。 展开更多
关键词 词义消歧 词向量 自然语言处理 机器翻译 Word2vec
在线阅读 免费下载
引入词性标记的基于语境相似度的词义消歧 预览
6
作者 孟禹光 周俏丽 +1 位作者 张桂平 蔡东风 《中文信息学报》 CSCD 北大核心 2018年第8期9-18,共10页
目前的语境向量模型在对语义空间建模的时候,没有考虑到同一个词的不同词性具有不同的含义,将它们看作同一个点进行建模,导致得到的语境向量质量不高,使用这种语境向量计算语境相似度效果不好。针对该类问题,提出了一种加入词性特征的... 目前的语境向量模型在对语义空间建模的时候,没有考虑到同一个词的不同词性具有不同的含义,将它们看作同一个点进行建模,导致得到的语境向量质量不高,使用这种语境向量计算语境相似度效果不好。针对该类问题,提出了一种加入词性特征的语境向量模型,加入词性后,可以将原本用语义空间中一个点表示的几个语义区分出来,得到质量更好的语境向量和语境相似度,进而得到更好的消歧效果。实验结果表明,这种建模方式可以有效区分不同词性的语义,在2004年的Senseval-3测试集上进行测试,准确率达到了75.3%,并在SemEval-13和SemEval-15公开测试集上进行了测试,消歧效果相比未引入词性特征的模型均得到了提升。 展开更多
关键词 语境向量 语境相似度 词义消歧 词性特征
在线阅读 下载PDF
一种基于多义词向量表示的词义消歧方法 预览
7
作者 李国佳 赵莹地 郭鸿奇 《智能计算机与应用》 2018年第4期52-56,共5页
词义消歧是自然语言处理领域的基本任务。在词语词向量表示的基础上,计算获得多义词语上下文窗口的向量表示。利用统计的多义词及词义个数,基于K-means算法聚类文本语料集中多义词的上下文窗口表示,在原始文本语料集中对多义词语根据聚... 词义消歧是自然语言处理领域的基本任务。在词语词向量表示的基础上,计算获得多义词语上下文窗口的向量表示。利用统计的多义词及词义个数,基于K-means算法聚类文本语料集中多义词的上下文窗口表示,在原始文本语料集中对多义词语根据聚类类别进行标记。在标记的文本语料集上,训练获得多义词语每个词义的向量表示。对句子中的多义词语,给出了一种基于多义词向量表示的词义消歧方法,实验结果显示该方法有效可行。 展开更多
关键词 多义词向量表示 K-MEANS 词义消歧
在线阅读 免费下载
基于HowNet的图模型词义消歧方法 预览
8
作者 孟凡擎 鹿文鹏 +1 位作者 张旭 成金勇 《齐鲁工业大学学报:自然科学版》 2018年第6期66-73,共8页
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于HowNet的图模型词义消歧方法。该方法利用依存句法... 作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于HowNet的图模型词义消歧方法。该方法利用依存句法分析获取上下文知识,构建上下文消歧图,并对HowNet中有着重要词义区分能力的例句进行依存句法分析,构建依存消歧图,结合上下文消歧图和依存消歧图完成歧义词的消歧处理。实验结果表明,该方法在SemEval-2007task#5数据集上取得了0.468的消歧准确率,获得优于同类方法的消歧效果。 展开更多
关键词 词义消歧 图模型 HOWNET 依存句法分析
在线阅读 免费下载
一种基于词语多原型向量表示的句子相似度计算方法 预览 被引量:1
9
作者 郭鸿奇 李国佳 《智能计算机与应用》 2018年第2期38-42,共5页
针对词语向量化表示的问题,根据词语词向量表示的思想以及借助多义词词典,在K-means聚类多义词语上下文表示的基础上,获得词语的多原型向量表示。对句子中的多义词语,通过计算词语多原型向量表示与词语上下文表示的相似度来进行词义消歧... 针对词语向量化表示的问题,根据词语词向量表示的思想以及借助多义词词典,在K-means聚类多义词语上下文表示的基础上,获得词语的多原型向量表示。对句子中的多义词语,通过计算词语多原型向量表示与词语上下文表示的相似度来进行词义消歧,根据2个句子集中共有词语和差异词语的词义相似度,给出一种基于词语多原型向量表示的句子相似度计算方法,实验结果显示了该方法的有效性。 展开更多
关键词 词语多原型向量表示 词义消歧 句子相似度
在线阅读 免费下载
一种基于语义与句法结构的短文本相似度计算方法 预览
10
作者 赵谦 荆琪 +1 位作者 李爱萍 段利国 《计算机工程与科学》 CSCD 北大核心 2018年第7期1287-1294,共8页
为了提高短文本语义相似度计算的准确率,提出一种新的计算方法:将文本分割为句子单元,对句子进行句法依存分析,句子之间相似度计算建立在词语间相似度计算的基础上,在计算词语语义相似度时考虑词语的新特征——情感特征,并提出一种综... 为了提高短文本语义相似度计算的准确率,提出一种新的计算方法:将文本分割为句子单元,对句子进行句法依存分析,句子之间相似度计算建立在词语间相似度计算的基础上,在计算词语语义相似度时考虑词语的新特征——情感特征,并提出一种综合方法对词语进行词义消歧,综合词的词性与词语所处的语境,再依据Hownet语义词典计算词语语义相似度;将句子中词语之间的语义相似度根据句子结构加权平均得到句子的语义相似度,最后通过一种新的方法——二元集合法——计算短文本的语义相似度。词语相似度与短文本相似度的准确率分别达到了87.63%和93.77%。实验结果表明,本文方法确实提高了短文本语义相似度的准确率。 展开更多
关键词 词义消歧 情感特征 句法依存分析 短文本语义相似度
在线阅读 下载PDF
一种改进的无监督网络图词义消歧方法研究 预览
11
作者 王苗 杨鹏 《机床与液压》 北大核心 2017年第18期130-135,共6页
词义消歧是一项根据上下文自动选择正确词义的任务,并且成为了计算语言学领域中最重要最有挑战性的难题之一,在各种自然语言处理应用程序中起了至关重要的作用。因此,为了提高词义消歧的准确率,提出一种改进的无监督网络图词义消歧方法... 词义消歧是一项根据上下文自动选择正确词义的任务,并且成为了计算语言学领域中最重要最有挑战性的难题之一,在各种自然语言处理应用程序中起了至关重要的作用。因此,为了提高词义消歧的准确率,提出一种改进的无监督网络图词义消歧方法。使用《知网》How Net作为知识库,运用一种新的词语间高阶关系的相似性度量方法,来给图的边分配适当的权值。然后,使用中心度计算并且结合相邻词义,来选择最适合目标词的方法。在数据集Senseval-3中进行了具体测试。实验结果显示:提出的方法的准确率达到46.1%,优于相同测试集下其他无监督词义消歧方法。 展开更多
关键词 自然语言处理 词义消歧 无监督 How NET 权值 网络图 语义相似度
在线阅读 下载PDF
基于规则的汉语疑问词“什么”的语义识别模型构建 预览
12
作者 牛长伟 程邦雄 《中文信息学报》 CSCD 北大核心 2017年第5期14-20,共7页
汉语疑问词具有多义性,至少有三种通用解读:疑问解读、存在解读(虚指)和全称解读(任指)。该文从汉语疑问词的词义排歧角度出发,通过总结汉语疑问词三种解读所处的句法环境的共同特征,确立其在复杂句法环境中的强势解读,进而构建一... 汉语疑问词具有多义性,至少有三种通用解读:疑问解读、存在解读(虚指)和全称解读(任指)。该文从汉语疑问词的词义排歧角度出发,通过总结汉语疑问词三种解读所处的句法环境的共同特征,确立其在复杂句法环境中的强势解读,进而构建一个基于规则的汉语疑问词的语义识别模型,为制订词义排歧决策表提供依据。该文以词义最多的疑问词"什么"为例,尝试通过这一思路,来构建基于规则的"什么"的语义识别模型和词义排歧决策表,并通过实验来验证,然后将其改进。 展开更多
关键词 什么 语义识别模型 词义排歧
在线阅读 下载PDF
两种词义消歧方法分析与比较 预览 被引量:1
13
作者 张国清 《信息与电脑》 2017年第19期47-48,52共3页
为了解决中文信息处理中的多义词在特定语境中的语义辨识问题,笔者进行了两种多义词消歧方法的实验并对其适用范围和应用前景进行了分析。首先介绍了有导的利用神经网络进行的词义消歧方法,其次介绍了无导的利用Hownet义原同现频率信息... 为了解决中文信息处理中的多义词在特定语境中的语义辨识问题,笔者进行了两种多义词消歧方法的实验并对其适用范围和应用前景进行了分析。首先介绍了有导的利用神经网络进行的词义消歧方法,其次介绍了无导的利用Hownet义原同现频率信息进行的消歧方法。最后给出了两种方法的实验数据,并从消歧知识的获得、消歧知识的表现形式及消歧算法适用范围几个方面指出了不同方法在词义消歧方面的优缺点。 展开更多
关键词 神经网络 词义消歧 HOWNET 义原 同现频率
在线阅读 下载PDF
基于WordNet词义消歧的语义检索研究 预览 被引量:4
14
作者 高雪霞 炎士涛 《湘潭大学自然科学学报》 北大核心 2017年第2期118-121,共4页
针对有监督和基于知识库的词义消歧问题,提出了一种新的基于Jaccard系数的词义消歧算法,以解决词义错误配对问题.利用WordNet知识库中的知识源表示歧义词的词义信息并生成词义资源库,结合提出的基于Jaccard系数词义消歧算法完成信息检索... 针对有监督和基于知识库的词义消歧问题,提出了一种新的基于Jaccard系数的词义消歧算法,以解决词义错误配对问题.利用WordNet知识库中的知识源表示歧义词的词义信息并生成词义资源库,结合提出的基于Jaccard系数词义消歧算法完成信息检索.试验测试结果显示,通过新的词义消歧算法,信息检索系统精确度比传统信息检索系统提高10%. 展开更多
关键词 词义消歧 信息检索 Jaccard系数 WORDNET 查准率 查全率
在线阅读 免费下载
一种基于双通道LDA模型的汉语词义表示与归纳方法 预览 被引量:2
15
作者 王少楠 宗成庆 《计算机学报》 EI CSCD 北大核心 2016年第8期1652-1666,共15页
语义记忆是人类理解自然语言的基础.人类理解语言的过程可以看作是对词义进行编码、对语义记忆进行检索,进而对词义进行解码的过程.因此,对词义进行合理地表示是计算机理解语言的关键步骤.该文总结分析了已有的词义表示方法与人脑词义... 语义记忆是人类理解自然语言的基础.人类理解语言的过程可以看作是对词义进行编码、对语义记忆进行检索,进而对词义进行解码的过程.因此,对词义进行合理地表示是计算机理解语言的关键步骤.该文总结分析了已有的词义表示方法与人脑词义表征的关系,针对汉语词汇的歧义现象,重点阐述了如何从歧义词所处的上下文中最大限度地自动获取关于歧义词的词义信息,并将这些信息整合,通过一系列的特征集合表示歧义词的词义.具体地说,该文将出现在歧义词上下文语境中有明确含义的实词作为模型的输入,同时在上下文中获取可以表示歧义词词义的其他特征,最终将这两种信息通过贝叶斯概率模型整合在一起,共同实现歧义词的词义表示和归纳.实验表明,该文提出的方法可以得到更好的词义表示和归纳效果. 展开更多
关键词 词义表示 词义归纳 词义消歧 主题模型 双通道主题模型
在线阅读 下载PDF
基于主题模型的中文词义归纳 预览 被引量:1
16
作者 高章敏 何祥 +1 位作者 刘嘉勇 汤殿华 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2016年第6期1269-1272,共4页
词义归纳是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法.本文提出了基于主题模型的方法来解决中文词义归纳问题,基于主题模型的词义归纳方法关键之处在于使用文档的主题概率分布来推断多义词的词义... 词义归纳是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法.本文提出了基于主题模型的方法来解决中文词义归纳问题,基于主题模型的词义归纳方法关键之处在于使用文档的主题概率分布来推断多义词的词义分布.实验结果表明,本文方法在测试数据上获得了77.58%FScore值. 展开更多
关键词 词义归纳 主题模型 隐含狄利克雷分布 词义消歧
在线阅读 免费下载
结合语义知识的汉语词义消歧 预览
17
作者 张春祥 邓龙 +1 位作者 高雪瑶 卢志茂 《计算机工程与应用》 CSCD 北大核心 2016年第3期119-122,共4页
词义消歧一直是自然语言处理领域中的关键性问题。为了提高词义消歧的准确率,从目标歧义词汇出发,挖掘左右词单元的语义知识。以贝叶斯模型为基础,结合左右词单元的语义信息,提出了一种新的词义消歧方法。以SemEval-2007:Task#5作为训... 词义消歧一直是自然语言处理领域中的关键性问题。为了提高词义消歧的准确率,从目标歧义词汇出发,挖掘左右词单元的语义知识。以贝叶斯模型为基础,结合左右词单元的语义信息,提出了一种新的词义消歧方法。以SemEval-2007:Task#5作为训练语料和测试语料,对词义消歧分类器进行优化,并对优化后的分类器进行测试。实验结果表明:词义消歧的准确率有所提高。 展开更多
关键词 词义消歧 歧义词汇 贝叶斯模型 语义信息
在线阅读 下载PDF
基于SVM的离合词词义消歧 预览 被引量:1
18
作者 张振景 李新福 +1 位作者 田学东 王凯 《计算机科学》 CSCD 北大核心 2016年第2期239-244,共6页
离合词词义消歧要解决如何让计算机理解离合词中的歧义词在具体上下文中的含义。针对离合词中歧义词在机器翻译中造成的对照翻译不准确以及在信息检索中无法匹配有效信息等问题,将词义消歧的方法应用于离合词中的歧义词,采用SVM模型建... 离合词词义消歧要解决如何让计算机理解离合词中的歧义词在具体上下文中的含义。针对离合词中歧义词在机器翻译中造成的对照翻译不准确以及在信息检索中无法匹配有效信息等问题,将词义消歧的方法应用于离合词中的歧义词,采用SVM模型建立分类器。为了提高离合词词义消歧的正确率,在提取特征时,结合离合词的特点,不仅提取了歧义词上下文中的局部词、局部词性、局部词及词性3类特征,还提取了"离"形式的歧义词的中间插入部分的特征;将文本特征转换为特征向量时,对布尔权重法进行了改进,依次固定某种类型特征权重,分别改变另外两种类型特征权重的消歧正确率来验证3类特征的消歧效果。实验结果表明,局部词特征、局部词及词性特征对消歧效果的影响高于局部词性特征,且采用不同类型的特征权重与采用相同的权重相比,消歧正确率提高了1.03%~5.69%。 展开更多
关键词 离合词 SVM 词义消歧 分类器
在线阅读 免费下载
融合新闻要素的跨语言新闻文本相似度计算 预览 被引量:1
19
作者 侯中熙 王红斌 线岩团 《价值工程》 2016年第17期177-181,共5页
随着经济全球化程度的加深,我国与各国之间的交流、合作越来越频繁,各类大小事件的新闻报道各国各有侧重,新闻内容的匹配程度也有高低之分。传统的文本相似度方法具有计算维数过高和计算过于复杂的缺点。通过对新闻报道文本的分析发现,... 随着经济全球化程度的加深,我国与各国之间的交流、合作越来越频繁,各类大小事件的新闻报道各国各有侧重,新闻内容的匹配程度也有高低之分。传统的文本相似度方法具有计算维数过高和计算过于复杂的缺点。通过对新闻报道文本的分析发现,新闻报道具有何时、何地、何事、何因、何人五个基本因素的特点。针对这一特性,提出融合新闻要素的跨语言新闻文本相似度计算方法。该方法充分考虑到了新闻文本的五个新闻要素特征词对文本相似度的影响,有效减少了相似度低的文本干扰和传统文本相似度计算效率的问题。本文方法抽取新闻文本的新闻要素,借助翻译工具和词义消歧技术将抽取出来的不同语种的新闻要素统一为中文,并对新闻要素进行分类集合,然后利用集合相似度计算和数据融合方法来计算两篇新闻文本相似度,通过实验验证,本文方法对跨语言新闻文本相似度计算具有一定的效率和准确性,说明本文方法可行。 展开更多
关键词 新闻要素 跨语言 机器翻译 词义消歧 条件随机场
在线阅读 下载PDF
基于论文和专利的钙钛矿太阳能电池的技术机会分析 预览 被引量:6
20
作者 黄鲁成 王静静 +1 位作者 李欣 王立章 《情报学报》 CSSCI 北大核心 2016年第7期686-695,共10页
针对目前在技术机会识别中存在以下不足,即使用直接引用的时间滞后性和使用向量空间模型存在主观性的问题,本文以科技论文和专利数据为基础,采用文本挖掘方法并在完善SAO结构基础上,分析识别了钙钛矿太阳能电池的技术机会:首先运... 针对目前在技术机会识别中存在以下不足,即使用直接引用的时间滞后性和使用向量空间模型存在主观性的问题,本文以科技论文和专利数据为基础,采用文本挖掘方法并在完善SAO结构基础上,分析识别了钙钛矿太阳能电池的技术机会:首先运用文本挖掘的方式抽取出标题和摘要的Subject—Action—Object(SAO)结构,并对SAO结构进行词义消歧,以便提高SAO结构相似度的计算精度;其次,将SAO结构的相似度转换为论文相似度及专利相似度,通过多维尺度分析总结聚类主题,识别确定技术机会;最后,用钙钛矿太阳能电池作为实例进行了实证研究,发现了四个潜在的技术机会,为该领域的研发工作提供了决策参考,同时也证实了该方法的有效性和科学性。 展开更多
关键词 SAO结构 技术机会 钙钛矿 太阳能电池 词义消歧
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部 意见反馈