期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于语义分布相似度的主题模型 预览 被引量:1
1
作者 居亚亚 杨璐 严建峰 《计算机应用研究》 CSCD 北大核心 2019年第12期3553-3557,共5页
潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架... 潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架下,使用GPU(generalized Pólya urn)模型加入单词-单词和文档-主题语义分布相似度来引导主题建模,从语义关联层面上削弱了词袋假设对主题产生的影响。在四个公开数据集上的实验表明,基于语义分布相似度的主题模型在主题语义连贯性、文本分类准确率方面相对于目前流行的主题建模算法表现得更加优越,同时该模型提高了收敛速度和模型精度。 展开更多
关键词 潜在狄利克雷分布 语义分布相似度 主题模型 GPU模型
在线阅读 下载PDF
融合相似度和地理信息的兴趣点推荐 预览
2
作者 郭晨睿 李平 郭苗苗 《计算技术与自动化》 2019年第3期67-73,共7页
兴趣点推荐是一种基于上下文信息的位置感知的个性化推荐。由于用户签到行为具有高稀疏性,为兴趣点推荐的精确度带来了很大的挑战。针对该问题,提出了一种融合相似度和地理信息的兴趣点推荐模型,称为SIGFM。首先利用潜在迪利克雷分配(La... 兴趣点推荐是一种基于上下文信息的位置感知的个性化推荐。由于用户签到行为具有高稀疏性,为兴趣点推荐的精确度带来了很大的挑战。针对该问题,提出了一种融合相似度和地理信息的兴趣点推荐模型,称为SIGFM。首先利用潜在迪利克雷分配(Laten Dirichlet Allocation,LDA)模型挖掘用户相关兴趣特征并进行相似性度量,利用Louvain Community Detection(LCD)算法与用户签到数据进行相似性度量,使两种相似度相融合;然后使用地理信息获取用户的签到特征;最后将融合相似度和地理信息结合到一起获得一个新的模型。在真实数据集上的实验结果表明,SIGFM模型有效解决了数据稀疏性与冷启动问题,优于其他POIs的推荐算法。 展开更多
关键词 潜在狄利克雷分布 Louvain社区发现 兴趣点推荐 地理信息 相似度
在线阅读 下载PDF
基于动态权重的LDA算法 预览 被引量:1
3
作者 居亚亚 杨璐 严建峰 《计算机科学》 CSCD 北大核心 2019年第8期260-265,共6页
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚类。该模型以词袋(Bag of Words,BOW)模型为假设,所有单词的重要性相同,简化了建模的复杂度,但使得主题... 潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚类。该模型以词袋(Bag of Words,BOW)模型为假设,所有单词的重要性相同,简化了建模的复杂度,但使得主题分布倾向于高频词,影响了主题模型的语义连贯性。针对此问题,提出了一种基于动态权重的LDA算法,该算法的基本思想是每个单词在建模中具有不同的重要性,在迭代过程中根据单词的主题分布动态生成相应的权重并反作用于主题建模,降低了高频词对建模的影响,提高了关键词:的重要性。在4个公开数据集上的实验表明,基于动态权重的LDA算法在主题语义连贯性、文本分类准确率、泛化性能和精度方面比目前流行的LDA推理算法表现得更加优越。 展开更多
关键词 潜在狄利克雷分布 主题模型 动态权重
在线阅读 免费下载
电网设备缺陷文本的质量评价与提升方法 被引量:2
4
作者 邵冠宇 王慧芳 何奔腾 《电网技术》 EI CSCD 北大核心 2019年第4期1472-1479,共8页
文本质量直接影响着文本挖掘效果的优劣。在总结电网企业缺陷文本存在的质量问题基础上,提出了缺陷文本质量评价和提升方法。首先,通过对大量实际缺陷文本的分析,总结出电网设备缺陷文本的格式及容易出现的不完整、不具体、冗余度过高... 文本质量直接影响着文本挖掘效果的优劣。在总结电网企业缺陷文本存在的质量问题基础上,提出了缺陷文本质量评价和提升方法。首先,通过对大量实际缺陷文本的分析,总结出电网设备缺陷文本的格式及容易出现的不完整、不具体、冗余度过高等问题。然后,基于相应问题,定义了缺陷文本质量的评价指标,并提出了基于"层次-自适应灰色关联分析法"的评价方法。接下来,针对历史缺陷文本中质量较差和缺陷等级与缺陷描述不匹配的文本,利用潜在狄利克雷分布方法,结合国家电网有限公司的缺陷分类标准,进行修正以提升质量;针对新录入文本,利用文本质量评价方法进行质量问题提示,利用词向量映射方法给出修正建议,保证新录入缺陷文本的质量。最后,结合实例对修正前后的缺陷文本进行质量对比,算例表明,修正后的历史缺陷文本在文本质量得分上有较大提升,新录入文本存在的问题也能较为准确地识别并给出对应修正建议。 展开更多
关键词 电网设备缺陷文本 文本质量评价 层次-自适应灰色关联分析法 文本质量提升 潜在狄利克雷分布
基于回复支持的关键评论提取方法 预览
5
作者 郭楠 张勤 +2 位作者 徐红艳 郭舒 刘志国 《吉林大学学报:信息科学版》 CAS 2019年第6期671-676,共6页
当前网络中充斥着大量的虚假评论,准确识别出代表用户真实感受的关键评论成为评论分析领域研究的热点问题。为此,提出一种基于回复支持的关键评论提取方法,该方法从用户对评论的反馈行为出发,重点考量评论点赞和评论回复两个指标,通过... 当前网络中充斥着大量的虚假评论,准确识别出代表用户真实感受的关键评论成为评论分析领域研究的热点问题。为此,提出一种基于回复支持的关键评论提取方法,该方法从用户对评论的反馈行为出发,重点考量评论点赞和评论回复两个指标,通过计算评论点赞率和回复率获取评论的回复支持情况,仅对回复支持度高的评论进行提取,从而剔除了大量虚假或无用的评论,提升了关键评论提取的准确性。最后,通过与现有主流方法进行实验对比,验证了该方法具有较高的正确率和召回率。 展开更多
关键词 在线评论 回复支持 关键句提取 潜在狄利克雷分布
在线阅读 下载PDF
基于近义词分配的铁路扣件状态检测 预览
6
作者 李爽 李柏林 《铁道标准设计》 北大核心 2018年第6期30-33,共4页
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉单词间的... 针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉单词间的语义距离,从而获取语义相关的近义词;然后,在"视觉词包模型"的基础上,结合柔性分配策略将底层特征映射至若干近义词上;最后,利用支持向量机实现扣件检测。对4类扣件图像的分类实验证明该模型能够有效提高扣件分类精确度。 展开更多
关键词 铁路扣件 检测 词包模型 相对熵 潜在狄利克雷分布 近义词 视觉单词
在线阅读 下载PDF
基于马尔科夫模型的用户兴趣转移建模 预览 被引量:1
7
作者 郑磊 王莉 段跃兴 《计算机工程与设计》 北大核心 2018年第1期177-182,共6页
为解决在社交网络平台中的用户内容个性化推荐问题,提出一种微博用户兴趣转移模型.用户的不同兴趣在其生 活以及社交网络平台中的内容所占比例趋于稳定,且在社交网络平台中用户下一时刻的内容受到用户当前内容的影响.提 出基于LDA (... 为解决在社交网络平台中的用户内容个性化推荐问题,提出一种微博用户兴趣转移模型.用户的不同兴趣在其生 活以及社交网络平台中的内容所占比例趋于稳定,且在社交网络平台中用户下一时刻的内容受到用户当前内容的影响.提 出基于LDA (潜在狄利克雷分布)主题模型推断用户主题分布、确定用户兴趣,在新浪微博系统上,基于马尔科夫模型的 状态转移原理构造用户兴趣的转移模型,挖掘用户兴趣之间的转移概率,实现对用户微博内容进行预测.在真实数据集上 验证了该模型的合理性和有效性,其推荐准确率达到78%. 展开更多
关键词 社交网络 兴趣 预测 潜在狄利克雷分布 马尔科夫模型
在线阅读 下载PDF
潜在狄利克雷分布模型研究综述 预览 被引量:1
8
作者 何伟林 谢红玲 奉国和 《信息资源管理学报》 CSSCI 2018年第1期55-64,共10页
潜在狄利克雷分布(LDA)模型是主题挖掘领域的重要方法之一,为深入了解该领域的研究进展,对2012到2016年5年期间该模型相关研究成果进行全面阐述和分析。系统地梳理LDA模型在词汇、时间演化、层次关系、情感分析、短文本、标签和比较... 潜在狄利克雷分布(LDA)模型是主题挖掘领域的重要方法之一,为深入了解该领域的研究进展,对2012到2016年5年期间该模型相关研究成果进行全面阐述和分析。系统地梳理LDA模型在词汇、时间演化、层次关系、情感分析、短文本、标签和比较性文本挖掘等7个方面的模型扩展研究;总结LDA模型在主题探索、推荐系统、预测系统,过滤系统和图像处理等方面的应用研究;最后对该模型未来研究方向进行展望,包括完善评价体系、提高模型精确度和处理效率以及在模型中引入可视化技术等。 展开更多
关键词 潜在狄利克雷分布 概率主题模型 主题建模
在线阅读 免费下载
基于上下文语义信息的铁路扣件状态检测 预览
9
作者 李爽 李柏林 +1 位作者 罗建桥 欧阳 《传感器与微系统》 CSCD 2018年第8期130-133,共4页
针对传统“视觉词包(BOW)模型”识别铁路扣件状态时仅利用扣件图像的特征域,忽略其空间域中上下文语义信息的缺点,提出了一种基于上下文语义信息的扣件检测模型。在传统“视觉词包模型”的基础上,引入吉布斯随机场模型对图像中像... 针对传统“视觉词包(BOW)模型”识别铁路扣件状态时仅利用扣件图像的特征域,忽略其空间域中上下文语义信息的缺点,提出了一种基于上下文语义信息的扣件检测模型。在传统“视觉词包模型”的基础上,引入吉布斯随机场模型对图像中像素的空间相关性进行建模,将图像块在特征域的相似性与空间域的上下文语义约束关系结合,更准确地定义视觉单词;利用潜在狄利克雷分布(LDA)学习扣件图像的主题分布;采用支持向量机(SVM)对扣件进行分类识别。对4类扣件图像的分类实验证明:模型能够有效提高扣件分类精度。 展开更多
关键词 铁路扣件检测 词包模型 吉布斯随机场模型 上下文语义信息 潜在狄利克雷分布
在线阅读 下载PDF
基于查询意图识别与主题建模的文档检索算法 预览 被引量:1
10
作者 严锐 李石君 《计算机工程》 CSCD 北大核心 2018年第3期189-194,共6页
传统的搜索引擎仅返回给用户包含查询关键字的文档,忽略了查询背后用户真正的信息需求。为此,将文档检索看作个性化推荐问题,提出一种查询意图识别的主题模型个性化检索算法。对用户检索历史进行潜在狄利克雷分布主题建模,结合检索... 传统的搜索引擎仅返回给用户包含查询关键字的文档,忽略了查询背后用户真正的信息需求。为此,将文档检索看作个性化推荐问题,提出一种查询意图识别的主题模型个性化检索算法。对用户检索历史进行潜在狄利克雷分布主题建模,结合检索历史主题模型识别用户查询的潜在意图,并按主题相关度进行文档推荐,计算查询到文档集的KL距离对文档集排序,最终返回给用户个性化检索文档列表。实验结果表明,与基于协同相似计算和基于用户聚类的推荐算法相比,该算法能够更准确有效地为用户提供个性化检索。 展开更多
关键词 搜索引擎 查询意图 文档检索 个性化推荐 主题模型 潜在狄利克雷分布 KL距离
在线阅读 下载PDF
基于GV-LDA的微博话题检测研究 预览
11
作者 李少华 李卫疆 余正涛 《软件导刊》 2018年第2期131-135,共5页
随着社交网络的不断发展,微博成为越来越多的人获取信息的平台。为了有效解决微博话题检测中海量短文本带来的词稀疏问题,提出结合全局向量模型(GloVe)和潜在狄利克雷分布(LDA)的GV-LDA模型。在使用LDA进行话题检测前,模型利用多义... 随着社交网络的不断发展,微博成为越来越多的人获取信息的平台。为了有效解决微博话题检测中海量短文本带来的词稀疏问题,提出结合全局向量模型(GloVe)和潜在狄利克雷分布(LDA)的GV-LDA模型。在使用LDA进行话题检测前,模型利用多义词词项的含义与词性相关的事实,在标注过并去除低频词的语料上,对全局向量模型进行训练获得词向量,对词性相同且相似度大于阈值的词进行替换以解决稀疏性问题。实验结果表明,GV-LDA模型较传统的LDA主题模型,可有效提高话题检测的准确率和召回率,并降低"主题-词"处理的维度,因此GV-LDA更适合微博话题检测。 展开更多
关键词 微博 话题检测 全局向量 潜在狄利克雷分布
在线阅读 免费下载
嵌入标记信息的铁路扣件状态检测主题模型 预览
12
作者 欧阳 罗建桥 +1 位作者 李柏林 李爽 《计算机工程》 CSCD 北大核心 2018年第6期200-206,共7页
针对潜在狄利克雷分布(LDA)模型忽略特征单词明确性的问题,提出一种嵌入标记信息的主题模型WL_LDA。设计一种基于SIFT特征点约束单方向LBP图像的方法。运用该方法获取图像的纹理结构,对视觉单词进行标记。将标记信息嵌入到LDA中,利用... 针对潜在狄利克雷分布(LDA)模型忽略特征单词明确性的问题,提出一种嵌入标记信息的主题模型WL_LDA。设计一种基于SIFT特征点约束单方向LBP图像的方法。运用该方法获取图像的纹理结构,对视觉单词进行标记。将标记信息嵌入到LDA中,利用单词和标记的二维直方图推导图像的主题分布。通过运用该主题分布训练分类器,完成铁路扣件的状态检测。实验结果表明,与LDA主题模型相比,各扣件在主题空间中的区分度增加4.5%~15%,与现有PCA、DF等方法相比,漏检率和误检率明显降低,具有较好的分类性能。 展开更多
关键词 图像语义分析 潜在狄利克雷分布 视觉单词 SIFT特征 单词标记 主题模型
在线阅读 下载PDF
一种基于地理位置人群分类的非参数聚类方法 预览
13
作者 邱运芬 张晖 +2 位作者 李波 杨春明 赵旭剑 《软件导刊》 2017年第2期7-10,共4页
地理位置作为用户生活轨迹的具体表现,在人群分类中有着举足轻重的作用。地理位置数据具有高维稀疏性,已有人群分类方法需对位置数据进行特征选择并提前确定特征数,实际应用中存在不便。针对该问题,提出基于地理位置人群分类的一种非参... 地理位置作为用户生活轨迹的具体表现,在人群分类中有着举足轻重的作用。地理位置数据具有高维稀疏性,已有人群分类方法需对位置数据进行特征选择并提前确定特征数,实际应用中存在不便。针对该问题,提出基于地理位置人群分类的一种非参数聚类方法。该方法首先利用分层狄利克雷过程(Hierarchical Dirichlet Process,HDP)无监督学习出最佳特征个数;然后利用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)对位置数据进行特征选取,同时得到功能特征概率矩阵;最后将其作为聚类权向量计算用户间的相似度,利用亲和力聚类(Affinity Propagation,AP)实现人群分类。实验结果表明,该方法较传统方法消耗时间更少、占用内存更低,且同时具有较高的F-measure。 展开更多
关键词 地理位置 人群分类 分层狄利克雷过程 潜在狄利克雷分布 亲和力聚类
在线阅读 免费下载
基于分布式LDA-Spark的微博用户兴趣挖掘 预览
14
作者 赵星雷 肖诗斌 《北京信息科技大学学报:自然科学版》 2017年第3期70-74,共5页
为了挖掘海量微博数据中潜在的语意信息,通过Gibbs采样方式,并结合Spark分布式计算框架,实现了一种LDA主题模型并行化的算法。该算法针对微博数据的特点,将3层贝叶斯概率模型改为用户-主题-词模型;为了满足LDA的并行化处理需求,采用了... 为了挖掘海量微博数据中潜在的语意信息,通过Gibbs采样方式,并结合Spark分布式计算框架,实现了一种LDA主题模型并行化的算法。该算法针对微博数据的特点,将3层贝叶斯概率模型改为用户-主题-词模型;为了满足LDA的并行化处理需求,采用了一种无冲突的数据分割方法将数据集分成了P×P个数据块,将分割好的数据块重新排序整合成P个子集,保证每个子集中均包含P个数据块,对每个子集进行并行采样。从困惑度、收敛速度及加速比3个方面对改进算法与标准LDA算法进行了对比实验,困惑度2种算法的结果接近;在收敛速度方面,改进算法较标准LDA慢,但在实际应用中对效率没有太大影响;加速比实验中,总词数为100万、work节点为8时,改进算法所用时间是标准LDA的16.78%。实验结果表明,改进算法能得到较为精确的模型,并在大数据环境下可以取得良好的加速效果。 展开更多
关键词 SPARK 分布式框架 潜在狄利克雷分布 微博 主题模型
在线阅读 下载PDF
市长公开电话文本自动分类技术比较研究 预览
15
作者 杨槟泽 李长军 《中国海洋大学学报:自然科学版》 CSCD 北大核心 2017年第S1期173-177,共5页
通过研究青岛市市长公开电话的文本数据,提出了地点词的自动获取算法,并对文本分类中特征选择方法及分类器的组合进行了比较研究。实验证明,对于电话短文本分类问题,特征选择方法 CHI与分类器的组合普遍优于LDA与分类器的组合,得到CHI+... 通过研究青岛市市长公开电话的文本数据,提出了地点词的自动获取算法,并对文本分类中特征选择方法及分类器的组合进行了比较研究。实验证明,对于电话短文本分类问题,特征选择方法 CHI与分类器的组合普遍优于LDA与分类器的组合,得到CHI+SVM则是分类效果最好的组合。 展开更多
关键词 文本分类 市长公开电话 潜在狄利克雷分布 支持向量机
在线阅读 下载PDF
基于吉布斯采样结果的主题文本网络构建方法 预览 被引量:1
16
作者 张志远 杨宏敬 赵越 《计算机工程》 CSCD 北大核心 2017年第6期150-157,共8页
挖掘文档集合中主题词的概率分布可对文档内容做概要性了解。进一步探寻给定主题下单词之间的连接关系不仅能丰富主题词的含义,而且能更细致地表现主题的层次和聚集关系。为此,针对带标签的文档集合,基于标注潜在狄利克雷分布(LDA... 挖掘文档集合中主题词的概率分布可对文档内容做概要性了解。进一步探寻给定主题下单词之间的连接关系不仅能丰富主题词的含义,而且能更细致地表现主题的层次和聚集关系。为此,针对带标签的文档集合,基于标注潜在狄利克雷分布(LDA)分析后的吉布斯采样结果,提出一种给定主题下2个单词共现的概率计算方法,并在此基础上构建主题文本网络。与逐点标注LDA(PL-LDA)模型相比,该方法不扩充原始文件,计算量小,耗时短。在航空安全报告数据集上的实验结果表明,对标记单词较多的主题,该方法能够较好地展示主题词的分布情况以及它们之间的复杂联系。 展开更多
关键词 主题模型 文本网络 吉布斯采样 潜在狄利克雷分布 航空安全报告
在线阅读 下载PDF
基于词向量的实体链接方法 预览 被引量:2
17
作者 齐爱芹 徐蔚然 《数据采集与处理》 CSCD 北大核心 2017年第3期604-611,共8页
实体链接任务主要包括命名实体识别、查询扩展、候选实体选择、特征抽取和排序。本文针对查询词的扩展,提出了一种基于词向量的扩展方法。该方法利用连续词袋(Continuous bag-of-words,CBOW)模型训练语料中词语的词向量,然后将距... 实体链接任务主要包括命名实体识别、查询扩展、候选实体选择、特征抽取和排序。本文针对查询词的扩展,提出了一种基于词向量的扩展方法。该方法利用连续词袋(Continuous bag-of-words,CBOW)模型训练语料中词语的词向量,然后将距离查询词近的词作为扩展词。词向量从语料中挖掘出词与词之间的语义相关性是对基于规则的查询扩展方法的补充,以此来召回候选实体。在特征抽取时,把文档之间的潜在狄利克雷分布(Latent Dirichlet allocation,LDA)的主题相似性作为特征之一。在计算文档相似性时,不再以高频词作为向量的维度,而是以基于词向量的相关词作为向量维度,由此得到文档的语义相似性特征。最后利用基于单文档方法的排序学习模型把查询词链接到相应的候选实体。实验结果表明利用该方法能使F_1值达到0.71,具有较好的效果。 展开更多
关键词 实体链接 潜在狄利克雷分布 词向量 排序学习
在线阅读 下载PDF
基于LDA的弱监督文本分类方法 预览 被引量:3
18
作者 张金瑞 柴玉梅 +1 位作者 昝红英 高明磊 《计算机工程与设计》 北大核心 2017年第1期86-91,共6页
针对传统的文本分类方法需要大量人工标注好的训练数据,且数据标注的好坏会影响结果等问题,通过对LDA及其相关模型的研究,提出一种基于LDA的弱监督文本分类算法。无需人工标注训练数据,在处理文本时,引入词向量,保持文本中的词序,加入... 针对传统的文本分类方法需要大量人工标注好的训练数据,且数据标注的好坏会影响结果等问题,通过对LDA及其相关模型的研究,提出一种基于LDA的弱监督文本分类算法。无需人工标注训练数据,在处理文本时,引入词向量,保持文本中的词序,加入二元语法。实验结果表明,该方法节省了人力、物力,取得了较优效果。 展开更多
关键词 文本分类 潜在狄利克雷分布 主题 词序 二元语法
在线阅读 下载PDF
基于动态聚类的旅游线路推荐 预览 被引量:2
19
作者 肖春景 夏克文 +1 位作者 乔永卫 张宇翔 《计算机应用》 CSCD 北大核心 2017年第8期2395-2400,共6页
基于会话的协同过滤用固定时间窗划分交互历史并将用户兴趣表示为这些阶段的序列,但是旅游数据的高稀疏性会导致某些阶段内没有交互行为和近邻相似度计算困难的问题。为了缓解数据稀疏,有效利用数据特性,提出了基于动态聚类的旅游线路... 基于会话的协同过滤用固定时间窗划分交互历史并将用户兴趣表示为这些阶段的序列,但是旅游数据的高稀疏性会导致某些阶段内没有交互行为和近邻相似度计算困难的问题。为了缓解数据稀疏,有效利用数据特性,提出了基于动态聚类的旅游线路推荐算法。该方法首先分析了旅游数据不同于其他标准数据的特性;其次利用动态聚类得到的变长时间窗口对游客交互历史进行划分,利用潜在狄利克雷分布(LDA)抽取每个阶段的概率主题分布,结合时间惩罚权值建立用户兴趣漂移模型;接着,通过反映年龄、线路季节、价格等因素的游客特征向量为目标游客选择近邻和候选线路集合;最后根据候选线路和游客的概率主题相关度完成线路推荐。该方法通过采用变长时间窗口不但缓解了数据稀疏,而且划分的阶段数目不需提前指定,而是根据数据特性自动生成;近邻选择时采用特征向量而非旅游数据进行相似度计算,避免了由于数据稀疏无法计算的问题。在实际旅游数据上的大量实验结果表明,该方法不仅很好适应了旅游数据特征,而且提高了旅游线路的推荐精度。 展开更多
关键词 动态聚类 潜在狄利克雷分布 兴趣模型 时间惩罚 特征向量
在线阅读 下载PDF
面向产品属性的用户情感模型 预览 被引量:1
20
作者 贾闻俊 张晖 +2 位作者 杨春明 赵旭剑 李波 《计算机应用》 CSCD 北大核心 2016年第1期175-180,共6页
传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利... 传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过程(HDP)将名词实体聚类形成产品属性并自动获取其数量;然后,结合产品属性中名词实体的权重和评价短语以及情感词典作为先验,利用潜在狄利克雷分布(LDA)对产品属性进行情感分类。实验结果表明,该模型具有较高的情感分类准确率,情感分类平均准确率达87%。该模型与传统的情感模型相比在抽取产品属性和评价短语的情感分类上具有较高的准确率。 展开更多
关键词 情感模型 细粒度 产品属性 分层狄利克雷过程 潜在狄利克雷分布
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部 意见反馈