期刊文献+
共找到353篇文章
< 1 2 18 >
每页显示 20 50 100
基于HowNet的语义表示学习 预览
1
作者 朱靖雯 杨玉基 +1 位作者 许斌 李涓子 《中文信息学报》 CSCD 北大核心 2019年第3期33-41,共9页
HowNet是一个大规模高质量的跨语言(中英)常识知识库,蕴含着丰富的语义信息。该文利用知识图谱领域的方法将HowNet复杂的结构层层拆解,得到了知识图谱形式的HownetGraph,进而利用网络表示学习以及知识表示学习方法得到了跨语言(中、英)... HowNet是一个大规模高质量的跨语言(中英)常识知识库,蕴含着丰富的语义信息。该文利用知识图谱领域的方法将HowNet复杂的结构层层拆解,得到了知识图谱形式的HownetGraph,进而利用网络表示学习以及知识表示学习方法得到了跨语言(中、英)、跨语义单位(字词、义项①、DEF_CONCEPT②和义原)的向量表示,在词语相似度(word similarity)和词语类比(word analogy)任务上对中英文数据集进行了实验,实验结果显示该文提出的方法在词语语义相似度的任务上取得了最好效果。 展开更多
关键词 HOWNET 知识图谱 语义表示 表示学习
在线阅读 下载PDF
一种基于Hownet的词向量表示方法 预览
2
作者 陈洋 罗智勇 《北京大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期22-28,共7页
针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后... 针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后,根据Hownet中词语与义原之间的定义关系,将词语向量表示视为相关义原所张成的子空间中的投影,并提出学习词向量表示的深度神经网络模型。实验表明,基于Hownet的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。 展开更多
关键词 词向量表示 HOWNET 词语相似性计算 词义消岐
在线阅读 免费下载
基于扩展的情感词典和卡方模型的中文情感特征选择方法 预览
3
作者 胡思才 孙界平 +3 位作者 琚生根 王霞 龙彬 廖强 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期37-44,共8页
根据经典的特征选择方法在中文情感评论文本中应用的缺陷和不足,提出了一种改进的中文情感特征选择方法.目前,现有的情感特征选择方法普遍只利用了特征项在褒贬类中的统计信息,忽略了情感极性值对特征选择的影响;同时情感文本中否定词... 根据经典的特征选择方法在中文情感评论文本中应用的缺陷和不足,提出了一种改进的中文情感特征选择方法.目前,现有的情感特征选择方法普遍只利用了特征项在褒贬类中的统计信息,忽略了情感极性值对特征选择的影响;同时情感文本中否定词会带来特征项情感极性反转的情况,为特征选择带来较大的负面影响.针对这些问题,首先对情感文本中的否定词进行了检测和判定,对否定词界定范围内的情感特征词进行反义变换处理,有效的解决了情感文本中极性反转的问题.同时还将特征项的情感极性值和其在类中的频率特点两个因素融入到卡方特征选择模型(CHI)中,从而提升了卡方模型在文本情感特征选择的效果.实验结果表明,本文算法较其他算法在多个领域数据集上的情感分类准确率提高了1.5%左右. 展开更多
关键词 情感词典 卡方模型 特征选择 知网 否定词
在线阅读 免费下载
基于加权语义网的文本相似度计算方法研究 预览
4
作者 张弛 周艳玲 张贯虹 《赤峰学院学报:自然科学版》 2019年第5期19-23,共5页
为了更加准确地计算文本特征权重,提高文本相似度计算的精确度,文章提出了一种基于《知网(HowNet)》语义知识库的加权语义复杂网络文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现为边,以特征词的TF-IDF值为特征词节点... 为了更加准确地计算文本特征权重,提高文本相似度计算的精确度,文章提出了一种基于《知网(HowNet)》语义知识库的加权语义复杂网络文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现为边,以特征词的TF-IDF值为特征词节点的初始权重,以融合共现频率和概念间语义距离计算特征词节点之间边的权重,构建加权语义文本复杂网络.然后利用综合特征指数作为加权语义网中文本的特征权重.最后基于公开数据集和KNN算法进行文本聚类实验,实验结果表明,在基于F-度量值标准上本文提出的方法要优于传统基于向量空间模型的TF-IDF方法和另一种结合复杂网络权重的方法. 展开更多
关键词 复杂网络 特征词 KNN算法 文本相似度 HOWNET
在线阅读 免费下载
基于知网的词语语义相似度改进算法 预览
5
作者 李蕾 杨丽花 《计算机技术与发展》 2019年第4期42-46,共5页
词语语义相似度计算在很多领域都有广泛应用,而目前常用的基于知网的词语语义相似度计算方法由于未深入考虑同一棵树中的两个不同义原的可达路径上所有义原节点的密度对义原距离的影响,或未考虑义原深度与义原密度的主次关系,导致计算... 词语语义相似度计算在很多领域都有广泛应用,而目前常用的基于知网的词语语义相似度计算方法由于未深入考虑同一棵树中的两个不同义原的可达路径上所有义原节点的密度对义原距离的影响,或未考虑义原深度与义原密度的主次关系,导致计算结果不够精确,从而使其应用受限。针对该问题,给出了一个新的节点间边权重函数,通过在边权重函数中引入两义原可达路径上所有义原节点的密度,并利用权重因子来调整义原深度和义原密度对义原距离的影响,从而提出一种改进的基于知网的词语语义相似度计算方法。实验结果表明,该方法可以更有效地提高词语语义相似度计算精度,比现有方法更具有实用性。 展开更多
关键词 知网 词语语义相似度 义原密度 义原深度 义原距离
在线阅读 下载PDF
基于Word2Vec和HowNet的情感词典构建方法 预览
6
作者 元海霞 《现代计算机:上下旬》 2018年第3期9-13,共5页
基于情感词典对文本进行情感倾向分析是一种行之有效的途径,提出一种基于Word2Vec和HowNet构建情感词典的方法。该方法首先利用Word2Vec训练语料得到词向量进而获得与候选词最接近的10个词,根据这10个相近词确定情感倾向,而用Word2Ve... 基于情感词典对文本进行情感倾向分析是一种行之有效的途径,提出一种基于Word2Vec和HowNet构建情感词典的方法。该方法首先利用Word2Vec训练语料得到词向量进而获得与候选词最接近的10个词,根据这10个相近词确定情感倾向,而用Word2Vec无法确定情感倾向时,则用HowNet方法进行判定,即通过计算候选词与种子词的语义相似度确定极性。实验结果表明,该情感词典构建方法在餐饮评论情感词典构建中具有较高的准确性和可利用性。 展开更多
关键词 情感词典 情感倾向分析 Word2Vec HOWNET
在线阅读 免费下载
基于HowNet的图模型词义消歧方法 预览
7
作者 孟凡擎 鹿文鹏 +1 位作者 张旭 成金勇 《齐鲁工业大学学报:自然科学版》 2018年第6期66-73,共8页
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于HowNet的图模型词义消歧方法。该方法利用依存句法... 作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于HowNet的图模型词义消歧方法。该方法利用依存句法分析获取上下文知识,构建上下文消歧图,并对HowNet中有着重要词义区分能力的例句进行依存句法分析,构建依存消歧图,结合上下文消歧图和依存消歧图完成歧义词的消歧处理。实验结果表明,该方法在SemEval-2007task#5数据集上取得了0.468的消歧准确率,获得优于同类方法的消歧效果。 展开更多
关键词 词义消歧 图模型 HOWNET 依存句法分析
在线阅读 免费下载
基于HowNet查询扩展方法的探究 预览 被引量:1
8
作者 张振梅 刘明 +1 位作者 毕利 高玉琢 《计算机应用与软件》 北大核心 2018年第3期27-31,共5页
考虑到查询扩展方法在信息检索中很少考虑词语的顺序、分布和词条概念关系等因素,难以在信息检索中对文本相似性做出全方位的度量。针对这种情况,基于词语概念本体HowNet对词序、词距、扩展词权重特征进行概念相关性度量,并将词语相关... 考虑到查询扩展方法在信息检索中很少考虑词语的顺序、分布和词条概念关系等因素,难以在信息检索中对文本相似性做出全方位的度量。针对这种情况,基于词语概念本体HowNet对词序、词距、扩展词权重特征进行概念相关性度量,并将词语相关性度量作为特征词权重因子引入文本检索过程中,实现了一种改进的特征量化方法。Top-N检索结果的实验表明,采用的方法使得系统整体性能获得有效提升。 展开更多
关键词 查询扩展 TF-IDF 索引构建 HOWNET 信息检索
在线阅读 下载PDF
一种基于语义关系图的词语语义相关度计算模型 预览
9
作者 张仰森 郑佳 李佳媛 《自动化学报》 CSCD 北大核心 2018年第1期87-98,共12页
词语的语义计算是自然语言处理领域的重要问题之一,目前的研究主要集中在词语语义的相似度计算方面,对词语语义的相关度计算方法研究不够.为此,本文提出了一种基于语义词典和语料库相结合的词语语义相关度计算模型.首先,以HowNet和大规... 词语的语义计算是自然语言处理领域的重要问题之一,目前的研究主要集中在词语语义的相似度计算方面,对词语语义的相关度计算方法研究不够.为此,本文提出了一种基于语义词典和语料库相结合的词语语义相关度计算模型.首先,以HowNet和大规模语料库为基础,制定了相关的语义关系提取规则,抽取了大量的语义依存关系;然后,以语义关系三元组为存储形式,构建了语义关系图;最后,采用图论的相关理论,对语义关系图中的语义关系进行处理,设计了一个基于语义关系图的词语语义相关度计算模型.实验结果表明,本文提出的模型在词语语义相关度计算方面具有较好的效果,在Word Similarity-353数据集上的斯皮尔曼等级相关系数达到了0.5358,显著地提升了中文词语语义相关度的计算效果. 展开更多
关键词 语义相关度 语义关系图 HOWNET 依存语义关系 语义相似度
在线阅读 下载PDF
基于卷积神经网络的情感分析算法 预览
10
作者 李佳丽 封化民 +2 位作者 潘扬 徐治理 刘飚 《计算机应用与软件》 北大核心 2018年第4期287-292,共6页
随着词向量的广泛应用,情感词典在情感分析任务中不再使用。但是使用传统机器学习方法时,情感词仍然提供了重要的特征。通过结合词向量与情感词典,提出两种基于卷积神经网络的情感分析方法,分别为朴素连接法和独立卷积法。其中情感词典... 随着词向量的广泛应用,情感词典在情感分析任务中不再使用。但是使用传统机器学习方法时,情感词仍然提供了重要的特征。通过结合词向量与情感词典,提出两种基于卷积神经网络的情感分析方法,分别为朴素连接法和独立卷积法。其中情感词典的构建采用传统的种子词方法,根据HowNet和Word2Vec共同计算出当前语料库的词语-情感分数键值对。实验结果表明,提出的情感分析方法可以有效地提高情感分析的准确率。 展开更多
关键词 词向量 情感词典 卷积神经网络 朴素连接 独立卷积 HOWNET Word2Vec
在线阅读 下载PDF
基于类别特征改进的KNN短文本分类算法 预览 被引量:2
11
作者 黄贤英 熊李媛 +1 位作者 刘英涛 李沁东 《计算机工程与科学》 CSCD 北大核心 2018年第1期148-154,共7页
KNN短文本分类算法通过扩充短文本内容提高短文本分类准确率,却导致短文本分类效率降低。鉴于此,通过卡方统计方法提取训练空间中各类别的类别特征,根据训练空间中各类别样本与该类别特征的相似情况,对已有的训练空间进行拆分细化,将训... KNN短文本分类算法通过扩充短文本内容提高短文本分类准确率,却导致短文本分类效率降低。鉴于此,通过卡方统计方法提取训练空间中各类别的类别特征,根据训练空间中各类别样本与该类别特征的相似情况,对已有的训练空间进行拆分细化,将训练空间中的每个类别细化为多个包含部分样本的训练子集;然后针对测试文本,从细化后的训练空间中提取与测试文本相似度较高的类别特征所对应的训练子集的样本来重构该测试文本的训练集合,减少KNN短文本分类算法比较文本对数,从而提高KNN短文本分类算法的效率。实验表明,与基于知网语义的KNN短文本分类算法相比,本算法提高KNN短文本分类算法效率近50%,分类的准确性也有一定的提升。 展开更多
关键词 短文本分类 KNN分类 类别特征 HOWNET 效率
在线阅读 下载PDF
航空术语语义知识库辅助构建方法 预览
12
作者 王思博 王裴岩 张桂平 《中文信息学报》 CSCD 北大核心 2018年第12期57-66,共10页
语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语... 语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语语义知识库的方法。该方法根据航空术语的特点将辅助构建分成四个关键过程,构建了2 000条术语概念描述(DEF)。最后通过对人工标注的术语间相似度与根据术语DEF计算的术语间相似度结果的对比,验证了该构建方法的有效性。 展开更多
关键词 航空术语 语义知识库 知网 概念描述
在线阅读 下载PDF
基于多重继承与信息内容的知网词语相似度计算 预览 被引量:1
13
作者 张波 陈宏朝 +1 位作者 朱新华 吴田俊 《计算机应用研究》 CSCD 北大核心 2018年第10期2975-2979,共5页
针对目前中文词语语义相似度方法中基于信息内容的算法研究不足的问题,对知网信息模型上使用基于信息内容的中文词语相似度算法进行了研究。根据知网采用语义表达式表示知识而缺乏完整概念结构的特点,通过抽取知网语义表达式中的抽象概... 针对目前中文词语语义相似度方法中基于信息内容的算法研究不足的问题,对知网信息模型上使用基于信息内容的中文词语相似度算法进行了研究。根据知网采用语义表达式表示知识而缺乏完整概念结构的特点,通过抽取知网语义表达式中的抽象概念,结合原知网义原树构建具有多重继承特征的知网义项网作为基于信息内容的计算本体;根据该义项网,对基于信息内容的词语相似度算法进行了改进,提出了新的信息内容含量计算方法。经过Miller&Charles(MC30)基准平台的测试,验证了基于信息内容方法在计算中文语义相似度方面的可行性,也证明了该计算策略和改进算法的合理性。 展开更多
关键词 词语相似度 知网 多重继承 信息内容 描述逻辑
在线阅读 下载PDF
基于知识库的汉语未登录词语义预测 预览
14
作者 瞿健菊 冯敏萱 《中文信息学报》 CSCD 北大核心 2018年第1期34-42,共9页
该文基于知识库的语素构词知识,采用了分阶段的算法自动预测未登录词的语素构词知识,以此实现对未登录词的语义预测。基本思路是通过语素义组合或语素义类组合的匹配,先预测语义层面的知识,再确定相应语素项,最终获得未登录词多层面的... 该文基于知识库的语素构词知识,采用了分阶段的算法自动预测未登录词的语素构词知识,以此实现对未登录词的语义预测。基本思路是通过语素义组合或语素义类组合的匹配,先预测语义层面的知识,再确定相应语素项,最终获得未登录词多层面的语素构词知识。该算法简单、直观、合理,在首素性类、首素义类、首素义、尾素性类、尾素义类、尾素义、构词方式这七项预测内容全部正确的标准下,实验结果的预测正确率为62.32%,召回率为61.72%。 展开更多
关键词 未登录词 语义预测 语言知识库 构词 知网
在线阅读 下载PDF
基于后缀树算法的地区微博摘要技术研究 预览
15
作者 高永兵 张贵娟 +1 位作者 胡文江 马占飞 《计算机工程与应用》 CSCD 北大核心 2018年第9期126-132,144共8页
地区官方微博中包含了大量相关当地的事件信息,聚合地区官方微博数据可以发掘当地的重要事件;结合地区微博数据地区别称、不同层级,地区标签属性突显等特征提出了基于后缀树算法的地区微博摘要技术研究。利用地区权值树和知网HowNet对... 地区官方微博中包含了大量相关当地的事件信息,聚合地区官方微博数据可以发掘当地的重要事件;结合地区微博数据地区别称、不同层级,地区标签属性突显等特征提出了基于后缀树算法的地区微博摘要技术研究。利用地区权值树和知网HowNet对地区微博数据进行预处理,将意思相近的词汇进行替换统一;利用后缀树聚类算法STC和奇异值分解SVD对地区微博进行聚类;结合地区微博特征对其综合打分,选取有代表性的微博句子生成摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出当地事件并生成可读性高的事件摘要。 展开更多
关键词 地区微博 地区权值树 知网 后缀树聚类 摘要
在线阅读 下载PDF
基于多维语义空间的垃圾短信过滤算法 预览
16
作者 郑帅 齐向明 《自动化技术与应用》 2018年第7期33-37,共5页
随着移动电话的普及,垃圾短信问题已严重影响到了移动电话的正常使用,因此垃圾短信的治理越来越受到有关部门的重视。当前,垃圾短信的治理工作不断深入,垃圾短信监控拦截的准确性要求也越来越高,而传统的基于关键词匹配和流量监控的技... 随着移动电话的普及,垃圾短信问题已严重影响到了移动电话的正常使用,因此垃圾短信的治理越来越受到有关部门的重视。当前,垃圾短信的治理工作不断深入,垃圾短信监控拦截的准确性要求也越来越高,而传统的基于关键词匹配和流量监控的技术已经不能有效解决这一问题。通过对大量真实垃圾短信数据的分析和统计,提取数据中的语义概念,挖掘数据中的语义关系,通过分类、概括、聚集和联合,提出一种基于多维语义空间的垃圾短信过滤算法。经过试验表明,该算法可以有效的识别垃圾短信。 展开更多
关键词 文本挖掘 垃圾短信 语义空间 模式匹配 知网 语义相似度
在线阅读 下载PDF
基于文本相似度计算的兴趣网络构建方法研究 预览
17
作者 王远志 张海坤 +1 位作者 高标 陆文成 《安庆师范大学学报:自然科学版》 2018年第3期72-76,共5页
从海量无结构互联网信息中提取高质量的社会网络有着广阔的应用前景和较高的学术价值,本文以新浪微博网站作为信息源提取用户之间的共同兴趣网络,在知网文本相似度计算方法的基础上,结合用户特征词的词性分析,提出了一种结合词性的用户... 从海量无结构互联网信息中提取高质量的社会网络有着广阔的应用前景和较高的学术价值,本文以新浪微博网站作为信息源提取用户之间的共同兴趣网络,在知网文本相似度计算方法的基础上,结合用户特征词的词性分析,提出了一种结合词性的用户相似度计算方法,此方法可以计算用户之间的兴趣强度,进而构建共同兴趣网络。实验结果表明,该方法对用户类别判定的准确率有所提高,对兴趣网络的提取有较好的效果。 展开更多
关键词 关系提取 共同兴趣网络 知网 词语相似度 文本相似度
在线阅读 免费下载
两种词义消歧方法分析与比较 预览 被引量:1
18
作者 张国清 《信息与电脑》 2017年第19期47-48,52共3页
为了解决中文信息处理中的多义词在特定语境中的语义辨识问题,笔者进行了两种多义词消歧方法的实验并对其适用范围和应用前景进行了分析。首先介绍了有导的利用神经网络进行的词义消歧方法,其次介绍了无导的利用Hownet义原同现频率信息... 为了解决中文信息处理中的多义词在特定语境中的语义辨识问题,笔者进行了两种多义词消歧方法的实验并对其适用范围和应用前景进行了分析。首先介绍了有导的利用神经网络进行的词义消歧方法,其次介绍了无导的利用Hownet义原同现频率信息进行的消歧方法。最后给出了两种方法的实验数据,并从消歧知识的获得、消歧知识的表现形式及消歧算法适用范围几个方面指出了不同方法在词义消歧方面的优缺点。 展开更多
关键词 神经网络 词义消歧 HOWNET 义原 同现频率
在线阅读 下载PDF
改进的中文商标语义相似度计算方法研究
19
作者 翟东升 蔡文浩 +1 位作者 张杰 李振飞 《数据分析与知识发现》 CSSCI CSCD 2017年第11期19-28,共10页
【目的】为满足中文商标侵权判定过程中检测语义相似度的需求,提出一种改进的中文商标语义相似度计算方法。【方法】引入新参数改进传统的基于How Net的中文商标语义相似度计算方法,并收集大量商标数据作为相似度检测的支持数据以弥补Ho... 【目的】为满足中文商标侵权判定过程中检测语义相似度的需求,提出一种改进的中文商标语义相似度计算方法。【方法】引入新参数改进传统的基于How Net的中文商标语义相似度计算方法,并收集大量商标数据作为相似度检测的支持数据以弥补How Net词库的局限,分别使用传统方法和改进后的方法对样本数据进行相似度检测,并对比准确率验证改进后方法的有效性。【结果】实验结果显示,改进后的方法比传统方法准确率更高、有更好的区分度。【局限】相似度检测支持数据——商标数据库中的数据量可以进一步丰富。【结论】改进后的中文商标语义相似度检测方法可以作为检测中文商标语义相似度的有效方法。 展开更多
关键词 中文商标 语义相似度 HOWNET 相似度检测
基于角度——相似度转换模型的义原相似度计算 预览
20
作者 黄洪 屠肖龙 《浙江工业大学学报》 北大核心 2017年第6期597-603,共7页
义原的相似度是基于《知网》计算词语、句子相似度的基础.最早的义原相似度计算方法是刘群等提出的根据义原距离转换为义原相似度的方法,之后许多研究者在计算公式中引入了其他影响相似度计算的因素.这些因素本质上都可以由父节点深度... 义原的相似度是基于《知网》计算词语、句子相似度的基础.最早的义原相似度计算方法是刘群等提出的根据义原距离转换为义原相似度的方法,之后许多研究者在计算公式中引入了其他影响相似度计算的因素.这些因素本质上都可以由父节点深度、父节点到第一个义原的深度和父节点到第二个义原的深度等三个基本因素组成.将这三个因素作为基本变量,分析变量对义原相似度的影响方式并构建角度—相似度转换模型,实现了根据义原角度转换为义原相似度的方法.最后,通过实验分析比较新方法与同类方法在区分度、正区分度和距离误差上的优势,验证了其合理性. 展开更多
关键词 义原相似度 角度—相似度转换模型 知网
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部 意见反馈