期刊文献+
共找到2,117篇文章
< 1 2 106 >
每页显示 20 50 100
基于NLTK的中文文本内容抽取方法 预览
1
作者 李晨 刘卫国 《计算机系统应用》 2019年第1期275-278,共4页
NLTK是Python中用于自然语言处理的第三方模块,但处理中文文本具有一定局限性.利用NLTK对中文文本中的信息内容进行抽取与挖掘,采用同语境词提取、双连词搭配提取、概率统计以及篇章分析等方法,得到一个适用于中文文本的NLTK文本内容抽... NLTK是Python中用于自然语言处理的第三方模块,但处理中文文本具有一定局限性.利用NLTK对中文文本中的信息内容进行抽取与挖掘,采用同语境词提取、双连词搭配提取、概率统计以及篇章分析等方法,得到一个适用于中文文本的NLTK文本内容抽取框架,及其具体的实现方法.经实证分析表明,在抽取结果中可以找到反映文本特点的语料内容,得到抽取结果与文本主题具有较强相关性的结论. 展开更多
关键词 自然语言处理 中文文本 自然语言处理工具包
在线阅读 下载PDF
自然语言处理概述及应用 预览
2
作者 王泽宇 《通讯世界》 2019年第4期309-310,共2页
自然语言处理是计算机系统或软件对人类使用的自然语言进行分析处理并加以有目的的生成语句的工具,也是人工智能发展的重要技术。文中阐述了自然语言处理与自然语言处理和计算机语言的区别,并对自然语言处理所用技术和自然语言处理的应... 自然语言处理是计算机系统或软件对人类使用的自然语言进行分析处理并加以有目的的生成语句的工具,也是人工智能发展的重要技术。文中阐述了自然语言处理与自然语言处理和计算机语言的区别,并对自然语言处理所用技术和自然语言处理的应用进行了概述。 展开更多
关键词 自然语言处理 人类自然语言 人工智能 神经网络系统
在线阅读 下载PDF
《自然语言加工的认知方法》评介
3
作者 韦晓保 《外语教学与研究》 CSSCI 北大核心 2019年第1期144-149,共6页
随着计算机技术的发展和人工智能研究的深入,计算机因其在海量信息的文本挖掘、信息提取、跨语言信息处理等方面的优势,在自然语言加工中的作用日益凸显。如何把人类认知引入到人工智能中,令其能够在自然语言产生、理解、加工等方面达... 随着计算机技术的发展和人工智能研究的深入,计算机因其在海量信息的文本挖掘、信息提取、跨语言信息处理等方面的优势,在自然语言加工中的作用日益凸显。如何把人类认知引入到人工智能中,令其能够在自然语言产生、理解、加工等方面达到类人智能水平,是目前人工智能和语言学界讨论的热点、难点和焦点. 展开更多
关键词 自然语言 加工研究 词义消歧 自然语言处理 认知科学 循环神经网络 关联词 人类语言 语言加工 语义分析 词汇集 认知方法 算法模型 文本建构 文体标记 语言模型
基于VR/AI的中学生学习课件研究与设计 预览
4
作者 陈颖 《电子世界》 2019年第9期98-99,共2页
引言:目前,随着机器学习、模式识别、数据挖掘等计算机技术的发展,促进了人工智能的应用和普及。人工智能可以利用先进的计算机技术实现数据智能化处理,从海量的数据中发现潜在的应用模式。人工智能研究方向也很多,比如语言识别、机器... 引言:目前,随着机器学习、模式识别、数据挖掘等计算机技术的发展,促进了人工智能的应用和普及。人工智能可以利用先进的计算机技术实现数据智能化处理,从海量的数据中发现潜在的应用模式。人工智能研究方向也很多,比如语言识别、机器人、图像识别、自然语言处理和专家系统等,人工智能可以模仿人的思维过程和意识形态,可以利用程序语言实现人类的很多动作,建立一个智能化处理软件或硬件设备,人工智能是现代科技发展的基础,许多应用技术都引入了人工智能,比如虚拟现实VR等。 展开更多
关键词 中学生 计算机技术 人工智能 智能化处理 设计 课件 自然语言处理 机器学习
在线阅读 下载PDF
人工智能在医学影像中的研究与应用
5
作者 韩冬 李其花 +3 位作者 蔡巍 夏雨薇 宁佳 黄峰 《大数据》 2019年第1期39-67,共29页
近年来,人工智能成为学术界和工业界的研究热点,并已经成功应用于医疗健康等领域。着重介绍了人工智能在医学影像领域最新的研究与应用进展,包括智能成像设备、智能图像处理与分析、影像组学、医学影像与自然语言处理的结合等前沿方向... 近年来,人工智能成为学术界和工业界的研究热点,并已经成功应用于医疗健康等领域。着重介绍了人工智能在医学影像领域最新的研究与应用进展,包括智能成像设备、智能图像处理与分析、影像组学、医学影像与自然语言处理的结合等前沿方向。分析了研究和发展从源头入手的全链条人工智能技术的重要性和可行性,阐述了学术界和工业界在这一重要方向上的创新性工作。同时指出,人工智能在医学影像领域中的研究尚处于起步阶段,人工智能与医学影像的结合将成为国际上长期的研究热点。 展开更多
关键词 人工智能 医学影像 成像方法 图像处理与分析 自然语言处理
基于自然语言处理的多源情报分析系统的研究与设计 预览
6
作者 刘旭东 苏马婧 朱广宇 《信息技术与网络安全》 2019年第5期17-21,共5页
近年来随着Web3.0的到来,移动互联网技术得到不断普及,世界已经进入了以数据为中心的时代——大数据智能时代。从大数据量、结构复杂且增长迅速的数据中寻找到有价值的信息和知识并加工成情报,对于决策和风险预警等有重大意义。传统的... 近年来随着Web3.0的到来,移动互联网技术得到不断普及,世界已经进入了以数据为中心的时代——大数据智能时代。从大数据量、结构复杂且增长迅速的数据中寻找到有价值的信息和知识并加工成情报,对于决策和风险预警等有重大意义。传统的情报分析方法主要是以人工分析为主,存在着许多不足,分析结果比较片面,难以形象地反映其中的规律性。本系统针对传统情报不能全面把握情报内容的问题,结合自然语言处理的文本相似度分析、情感倾向分析,使用分布式数据库技术作为数据存储的支撑,利用相似度分析、情感倾向分析的技术对情报素材的内容进行全面分析。 展开更多
关键词 自然语言处理 情报分析系统 相似度分析 情感倾向分析
在线阅读 下载PDF
基于专利摘要词嵌入分布式表示方法的改进 预览
7
作者 刘刚 曹雨虹 +1 位作者 裴莹莹 李玉 《信息通信》 2019年第4期29-31,共3页
专利文献是记录专利的主要依据,而专利摘要则是专利文献的进一步浓缩。实验基于中文专利摘要部分,借助Python第三方库jieba进行分词、词性标注、gensim进行词向量映射,探讨对中文专利摘要部分进行分词、词性标注的问题,进而探讨词嵌入... 专利文献是记录专利的主要依据,而专利摘要则是专利文献的进一步浓缩。实验基于中文专利摘要部分,借助Python第三方库jieba进行分词、词性标注、gensim进行词向量映射,探讨对中文专利摘要部分进行分词、词性标注的问题,进而探讨词嵌入中基于词袋模型和分布式模型的差异。针对现有的分布式表示方法中词向量连续稠密等问题,提出了在相关语料库的基础上将词语聚类之后再结合CBOW和Skip-Gram模型训练语料词语得到权重矩阵,并将此权重矩阵用户测试数据中去预测中心词并得到其词向量。研究表明改进后的方法在词嵌入分布式表示词向量更适合用于循环神经网络的研究。 展开更多
关键词 专利摘要 词嵌入 语言模型 聚类 自然语言处理
在线阅读 下载PDF
面向短文本分类的特征提取与算法研究 预览
8
作者 刘晓鹏 杨嘉佳 +2 位作者 卢凯 田昌海 唐球 《信息技术与网络安全》 2019年第5期48-52,共5页
近年来以大数据为中心的人工智能技术得到蓬勃发展,自然语言处理成为了人工智能时代最突出的前沿研究领域之一。然而,在自然语言处理领域的短文本分类中,不同的特征提取方法与机器学习算法集成时,处理效果差异明显。针对短文本分类精度... 近年来以大数据为中心的人工智能技术得到蓬勃发展,自然语言处理成为了人工智能时代最突出的前沿研究领域之一。然而,在自然语言处理领域的短文本分类中,不同的特征提取方法与机器学习算法集成时,处理效果差异明显。针对短文本分类精度较低的问题,基于组合的方式和预设的评价指标,通过将不同特征提取方法与不同机器学习算法进行组合,探究其在超短文本分类中的效果以寻求最优组合模型进而获得最佳分类效果。实验结果表明,在所选取的四种最优组合方法中,以词频-逆文件频率为特征提取方法、以逻辑回归为算法的组合模型在公开数据集中取得最好的实验效果,精度为92.13%,查全率为90.12%,适合应用于超短文本的分类应用场景。 展开更多
关键词 自然语言处理 文本分类 超短文本
在线阅读 下载PDF
基于预读及简单注意力机制的句子压缩方法 预览
9
作者 鹿忠磊 刘文芬 +2 位作者 周艳芳 胡学先 王彬宇 《计算机应用研究》 CSCD 北大核心 2019年第2期371-375,394共6页
针对英文句子压缩方法进行研究,提出一种基于预读及简单注意力机制的压缩方法。在编码器—解码器(encoder-decoder)框架下,以循环门单元(gated recurrent unit,GRU)神经网络模型为基础,在编码阶段对原句语义进行两次建模。首次建模结果... 针对英文句子压缩方法进行研究,提出一种基于预读及简单注意力机制的压缩方法。在编码器—解码器(encoder-decoder)框架下,以循环门单元(gated recurrent unit,GRU)神经网络模型为基础,在编码阶段对原句语义进行两次建模。首次建模结果作为全局信息,加强二次语义建模,得到更全面准确的语义编码向量。解码阶段充分考虑删除式句子压缩的特殊性,适用简单注意力(3t-attention)机制,将编码向量中与当前解码时刻最相关的语义部分输入到解码器中,提高预测效率及准确率。在谷歌新闻句子压缩数据集上的实验结果表明,所提压缩方法优于已有公开结果。因此,预读及简单注意力机制可有效提高英文句子压缩精度。 展开更多
关键词 自然语言处理 句子压缩 预读 注意力机制
在线阅读 下载PDF
基于Skip-gram的CNNs文本邮件分类模型 预览
10
作者 黄鹤 荆晓远 +1 位作者 董西伟 吴飞 《计算机技术与发展》 2019年第6期143-147,共5页
随着互联网广告技术的发展和电子邮件的普及,越来越多的垃圾广告邮件充斥生活,而对如何高效区分垃圾邮件的研究也逐渐成为了热门课题。自然语言在结构上具有很强的前后相关性,而且对于中文邮件直接转化成向量会有过高的维度产生,影响最... 随着互联网广告技术的发展和电子邮件的普及,越来越多的垃圾广告邮件充斥生活,而对如何高效区分垃圾邮件的研究也逐渐成为了热门课题。自然语言在结构上具有很强的前后相关性,而且对于中文邮件直接转化成向量会有过高的维度产生,影响最后分类的准确性。对此,首先对邮件文本进行分词,再利用skip-gram模型训练出数据集中每个词的wordembedding,引入的词嵌入(wordembedding)是为了将邮件文本转化成低维度特征向量;然后将每个词的wordembedding组合为二维特征矩阵作为网络的输入,此外在每一次的迭代过程中,输入特征也作为参数进行更新;最后送入提出的CNN-HIGHWAY混合模型中进行邮件分类。将该混合模型在CCERT中文邮件样本集上进行实验,并与传统的机器学习方法和标准的卷积神经网络模型进行对比,结果表明该模型不仅解决了维度过高的问题,而且提高了邮件分类的准确率。 展开更多
关键词 自然语言处理 词嵌入 邮件分类 卷积神经网络 深度学习
在线阅读 下载PDF
半监督算法在自然语言处理中的应用研究 预览
11
作者 黄春 《科技创新导报》 2019年第6期131-132,共2页
随着科学技术的发展进步,机器学习方法在自然语言处理领域已经得到了广泛的普及与应用。半监督算法作为其中一项重要方法,具有更一般的假设,方法更加直观,解释性好,因此在自然语言处理中有着广泛的应用。本文以半监督算法在自然语言处... 随着科学技术的发展进步,机器学习方法在自然语言处理领域已经得到了广泛的普及与应用。半监督算法作为其中一项重要方法,具有更一般的假设,方法更加直观,解释性好,因此在自然语言处理中有着广泛的应用。本文以半监督算法在自然语言处理中的应用为研究对象,首先分析了半监督算法在自然语言处理中应用必要性,随后探讨分析了半监督算法的一些具体应用方式。 展开更多
关键词 半监督算法 自然语言处理 应用
在线阅读 下载PDF
基于神经网络和NLP的软件需求安全分析研究 预览
12
作者 孙宝华 胡楠 李东洋 《计算机科学》 CSCD 北大核心 2019年第B06期348-352,共5页
为了对软件需求的不完备性和歧义性程度进行识别,搭建软件需求和标准规范之间的桥梁,提出一种基于自然语言处理(Natural Language Processing,NLP)和神经网络的分析评价模型。首先,从国际标准化组织(ISO)、开源Web应用程序安全计划(OWA... 为了对软件需求的不完备性和歧义性程度进行识别,搭建软件需求和标准规范之间的桥梁,提出一种基于自然语言处理(Natural Language Processing,NLP)和神经网络的分析评价模型。首先,从国际标准化组织(ISO)、开源Web应用程序安全计划(OWASP)和PCI目录等标准出发,识别出多个安全性规范特征,找到文本蕴涵关系;然后,利用蕴涵结果以及文本注释来训练神经网络模型,以预测文档中的某个语句是否存在于安全标准中。所提模型对每个蕴涵配置的预测性能进行了评价,结果表明:蕴涵配置9的平均F-得分最高,为最佳完备性预测器。且在最优和最差配置下,所提模型的性能均优于常用的空模型。 展开更多
关键词 软件需求 自然语言处理 神经网络模型 安全性 空模型 蕴涵关系
在线阅读 免费下载
一种基于语料的词汇语义相似度认知算法 预览
13
作者 吴华 罗顺 孙伟晋 《计算机与数字工程》 2019年第2期300-303,共4页
词汇的语义相似度计算是信息检索、自然语言处理、推荐系统等技术的基础。事实上,词汇可能因其语境或语料的不同,语义的相似度千差万别。论文通过提取词汇的上下文语境特征,构建了一种基于特定语料的词汇的语义相似度计算模型。实验结... 词汇的语义相似度计算是信息检索、自然语言处理、推荐系统等技术的基础。事实上,词汇可能因其语境或语料的不同,语义的相似度千差万别。论文通过提取词汇的上下文语境特征,构建了一种基于特定语料的词汇的语义相似度计算模型。实验结果表明,该算法有较好的准确率和较强的领域敏感性,取得了令人满意的结果。 展开更多
关键词 文本分析 自然语言处理 领域预料 语义相似度
在线阅读 下载PDF
基于数学教学的知识图谱构建 预览
14
作者 戈其平 钟艳如 《计算机技术与发展》 2019年第3期187-189,共3页
针对目前数学教学过程中,学生学习效率差,注意力难以集中等问题,提出了将知识图谱技术运用于数学教学中,构建关于数学内容的知识图谱,使得数学教学更加智能化,以提高学生的学习效率与学习兴趣。首先介绍了本体构建的基本规则与一般知识... 针对目前数学教学过程中,学生学习效率差,注意力难以集中等问题,提出了将知识图谱技术运用于数学教学中,构建关于数学内容的知识图谱,使得数学教学更加智能化,以提高学生的学习效率与学习兴趣。首先介绍了本体构建的基本规则与一般知识图谱建立的基本方法,然后以数学教学内容为例,根据自然语言处理技术对数学知识进行了信息抽取,根据不同实体之间的共性语义相似度检测对实体进行了知识融合,减少实体的冗余和重复率以及图的复杂度。对融合后的新知识,根据质量评估规则进行加工,将合格的部分加入到知识库中,然后依次迭代上述步骤更新数据库。最后在Windows平台下基于Neo4j引擎对知识图谱进行了可视化。从而达到数学内容系统化、提高教学质量的目的。 展开更多
关键词 数学教学 本体构建 知识图谱 自然语言处理
在线阅读 下载PDF
融合词汇特征的生成式摘要模型 预览
15
作者 江跃华 丁磊 +2 位作者 李娇娥 杜皓晅 高凯 《河北科技大学学报》 CAS 2019年第2期152-158,共7页
生成过程中利用词汇特征(包含n-gram和词性信息)识别更多重点词汇内容,进一步提高摘要生成质量,提出了一种基于sequence-to-sequence(Seq2Seq)结构和attention机制的、融合了词汇特征的生成式摘要算法。算法的输入层将词性向量与词向量... 生成过程中利用词汇特征(包含n-gram和词性信息)识别更多重点词汇内容,进一步提高摘要生成质量,提出了一种基于sequence-to-sequence(Seq2Seq)结构和attention机制的、融合了词汇特征的生成式摘要算法。算法的输入层将词性向量与词向量合并后作为编码器层的输入,编码器层由双向LSTM组成,上下文向量由编码器的输出和卷积神经网络提取的词汇特征向量构成。模型中的卷积神经网络层控制词汇信息,双向LSTM控制句子信息,解码器层使用单向LSTM为上下文向量解码并生成摘要。实验结果显示,在公开数据集和自采数据集上,融合词汇特征的摘要生成模型性能优于对比模型,在公开数据集上的ROUGE-1,ROUGE-2,ROUGE-L分数分别提升了0.024,0.033,0.030。因此,摘要的生成不仅与文章的语义、主题等特征相关,也与词汇特征相关,所提出的模型在融合关键信息的生成式摘要研究中具有一定的参考价值。 展开更多
关键词 自然语言处理 文本摘要 注意力机制 LSTM CNN
在线阅读 下载PDF
遥感数据用户需求融合处理技术 预览
16
作者 郑忠刚 付琨 +2 位作者 徐崇彦 巫震宇 周长飞 《国防科技大学学报》 EI CAS CSCD 北大核心 2019年第2期115-123,共9页
遥感数据是国家的基础性和战略性资源,在经济建设、国防建设、抢险救灾、生态环境保护等方面得到了广泛的应用,发挥着越来越重要的作用,各行各业对遥感数据的需求也越来越多。因此,如何提高对地观测资源的利用率,提高服务响应速度成为... 遥感数据是国家的基础性和战略性资源,在经济建设、国防建设、抢险救灾、生态环境保护等方面得到了广泛的应用,发挥着越来越重要的作用,各行各业对遥感数据的需求也越来越多。因此,如何提高对地观测资源的利用率,提高服务响应速度成为迫切需要解决的问题。采用自然语言处理技术,提出了一种用户需求融合处理方法,该方法可以有效地融合归并相同或者相似的用户需求,实现一图多用,引入需求预测和需求融合技术以提高需求融合效率,从而提高对地观测资源的利用率,达到事半功倍的效果。 展开更多
关键词 遥感数据 需求融合 自然语言处理 聚类 语义转换 需求预测 需求挖掘
在线阅读 下载PDF
基于主题模型的网络信息源可视化分析研究 预览
17
作者 刘少俊 方延风 《图书情报导刊》 2019年第3期32-39,共8页
在科技情报收集过程中,网络信息源来源广泛且数据量庞大,对人工分析造成了巨大的压力。对从网络信息源采集的网页进行文本提取,过滤无关信息,使用主题模型对文本进行主题抽取,对抽取的主题进行可视化分析,提取出与需求相关的主题后对信... 在科技情报收集过程中,网络信息源来源广泛且数据量庞大,对人工分析造成了巨大的压力。对从网络信息源采集的网页进行文本提取,过滤无关信息,使用主题模型对文本进行主题抽取,对抽取的主题进行可视化分析,提取出与需求相关的主题后对信息源进行分类分析。这一流程增强了信息处理能力,提高了情报收集的效率。 展开更多
关键词 科技情报 信息源 主题模型 爬虫 自然语言处理
在线阅读 下载PDF
大数据驱动下情报研究知识库构建的关键技术及实现
18
作者 宋小康 何劲 王曰芬 《情报理论与实践》 CSSCI 北大核心 2019年第1期34-40,共7页
[目的/意义]情报研究知识库的构建不仅需要依赖现有的知识库构建方法与技术来实现,而且需要针对情报研究目标对关键技术进行扩展与创新。[方法/过程]文章利用自然语言处理和深度学习的方法,探究情报研究知识库构建中用于文本知识抽取和... [目的/意义]情报研究知识库的构建不仅需要依赖现有的知识库构建方法与技术来实现,而且需要针对情报研究目标对关键技术进行扩展与创新。[方法/过程]文章利用自然语言处理和深度学习的方法,探究情报研究知识库构建中用于文本知识抽取和组织的文本语义空间技术以及用于专家定位的专家知识地图技术。[结果/结论]文章提出包含文本集、特征词贡献集和特征词语义关联集的文本语义空间,以及包含领域术语关联和专家合作关联的专家知识地图,详细阐述具体步骤并以石墨烯领域数据进行实现。 展开更多
关键词 大数据 情报研究知识库 文本语义空间 知识地图 自然语言处理 深度学习
基于篇章结构的英文作文自动评分方法 预览
19
作者 周明 贾艳明 +1 位作者 周彩兰 徐宁 《计算机科学》 CSCD 北大核心 2019年第3期234-241,共8页
作文自动评分(Automated Essay Scoring AES)是指使用统计学、自然语言处理及语言学等领域的技术对作文进行评价和评分的系统。篇章结构分析是自然语言处理领域的一个重要研究方向,也是作文自动评分系统的重要组成部分之一。目前国外的... 作文自动评分(Automated Essay Scoring AES)是指使用统计学、自然语言处理及语言学等领域的技术对作文进行评价和评分的系统。篇章结构分析是自然语言处理领域的一个重要研究方向,也是作文自动评分系统的重要组成部分之一。目前国外的作文自动评分系统虽有广泛应用,但对篇章结构评分的研究还存在不足,且对中国学生英语作文的针对性不强;国内对英语作文自动评分的研究处于起步阶段,忽视了篇章结构对英语作文评分的重要性。针对这些问题,提出一种基于篇章结构的英文作文自动评分方法,在词、句、段落3个层面上提取作文的词汇、句法以及结构等特征,并使用支持向量机、随机森林以及极端梯度上升等算法对篇章成分进行分类,最后构建线性回归模型对作文的篇章结构进行评分。实验结果表明,基于随机森林的篇章成分识别模型(Discourse Element Identification based Random Forest,DEI-RF)的准确率为94.13%;基于线性回归的篇章结构自动评分模型(Discourse Structures Scoring based Linear Regression,DSS-LR)在背景介绍段(Introduction)、论证段(Argumentation)以及让步段(Concession)的均方差可达到0.02,0.11和0.08。 展开更多
关键词 作文自动评分 篇章成分 篇章结构分析 自然语言处理 随机森林 线性回归
在线阅读 免费下载
方块苗文词性标注集的设计 预览
20
作者 周潭 莫礼平 +3 位作者 曾虎 雷智 李文宇 吴莹 《智能计算机与应用》 2019年第1期131-134,共4页
词性标注集是计算机处理自然语言时进行词类表示的工具。任何自然语言的词性标注都必须以词性标注集为基础。本文根据方块苗文信息化的实际需要,结合方块苗文的造字原理及词语的使用特点,在介绍对词性标注及标注集相关概念的基础上,参... 词性标注集是计算机处理自然语言时进行词类表示的工具。任何自然语言的词性标注都必须以词性标注集为基础。本文根据方块苗文信息化的实际需要,结合方块苗文的造字原理及词语的使用特点,在介绍对词性标注及标注集相关概念的基础上,参考汉语词性标注规范设计方法,基本确定了方块苗文的词性和种类,设计了方块苗文的词性标注符号和基于语法范畴的分类标记体系;初步制订了用于方块苗文信息处理领域的词性标注集,在某种意义上为方块苗文词性标注建立了参考标准。 展开更多
关键词 自然语言处理 方块苗文 词性标注 词性标注集
在线阅读 免费下载
上一页 1 2 106 下一页 到第
使用帮助 返回顶部 意见反馈