期刊文献+

基于词向量的无监督词义消歧方法 预览

Unsupervised Word Disambiguation Method Based on Word Embeddings
在线阅读 免费下载
分享 导出
摘要 词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义项,并考虑融合上下文与义项的语义相似度及义项分布频率进行词义消歧。在Senseval-3数据集上测试,结果表明,该方法能有效实现词义消歧。 Word sense disambiguation have important applications in many fields.Lesk algorithm and its improved algorithm are typical representatives of unsupervised word-sense disambiguation.However,most of the existing algorithms are mostly based on word coverage of context and gloss.In addition,the effect of distance between ambiguous words and word in context is not considered.This paper proposes a method of word-sense disambiguation based on word vectors,which uses vectors to represent contexts and gloss and also considers combined semantic similarity between context and gloss with the distribution frequency of gloss.The test results on the Senseval-3 dataset show that this method can effectively achieve word-sense disambiguation.
作者 吕晓伟 章露露 LV Xiao-wei,ZHANG Lu-lu(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China)
出处 《软件导刊》 2018年第9期193-195,共3页
关键词 词义消歧 词向量 自然语言处理 机器翻译 Word2vec word sense disambiguation word embedding natural language processing;machine translation;Word2vec
作者简介 本文通讯作者:吕晓伟(1989-),女,昆明理工大学信息工程与自动化学院硕士研究生,研究方向为数据挖掘、词义消岐;;章露露(1992-),女,昆明理工大学信息工程与自动化学院硕士研究生,研究方向为数据库、信息检索.
  • 相关文献

参考文献5

二级参考文献17

共引文献72

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部 意见反馈