期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
基于改进的Page Rank算法的网页主题相关度分析研究 预览
1
作者 普措才仁 齐爱琴 《电子技术与软件工程》 2018年第9期254-255,共2页
基于链接分析的经典算法Page Rank,其页面转移概率被平均分配到链出页面,新页面链接较少,所以PR值较低,出现在最后反馈结果中的排序靠后,影响用户信息获取效率和准确度,而冗余信息对用户的干扰使用是信息检索领域探究的焦点。文章分析... 基于链接分析的经典算法Page Rank,其页面转移概率被平均分配到链出页面,新页面链接较少,所以PR值较低,出现在最后反馈结果中的排序靠后,影响用户信息获取效率和准确度,而冗余信息对用户的干扰使用是信息检索领域探究的焦点。文章分析经典算法Page Rank的优缺点,并提出基于主题相关性的Page Rank算法改进策略,实施重新排序,结果证明改进后的算法提高查询效率和质量,具有良好的稳定性,具备可拓展性。 展开更多
关键词 改进PageRank算法 网页主题相关度 主题漂移
在线阅读 下载PDF
基于页面相似度的PageRank算法 预览 被引量:1
2
作者 王丰 俞成海 +1 位作者 汪佳文 徐立波 《浙江理工大学学报》 2017年第2期237-241,共5页
用户通过检索平台虽然可以获得大量信息,但是搜索结果往往会出现主题漂移现象,不能满足用户的实际需求。为减少这种现象的发生,提出一种改进的PageRank算法。该算法基于传统的PageRank算法,先利用向量空间模型对页面间的相似度进行计算... 用户通过检索平台虽然可以获得大量信息,但是搜索结果往往会出现主题漂移现象,不能满足用户的实际需求。为减少这种现象的发生,提出一种改进的PageRank算法。该算法基于传统的PageRank算法,先利用向量空间模型对页面间的相似度进行计算,然后依据相似度赋予不同的调控因子,并将它们引入到PageRank算法中,从而使得页面PR值的计算更加合理、科学。结果表明:改进后的PageRank算法在搜索应用中能够有效减少了主题漂移现象,搜索结果也更加符合用户需求。 展开更多
关键词 PAGERANK算法 主题漂移 空间向量模型 相似度 互联网
在线阅读 下载PDF
改进的Shark-search算法在网络采集中的应用 预览
3
作者 张玲 祁玉娟 姜华 《计算机技术与发展》 2017年第8期192-194,199共4页
Shark—search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分... Shark—search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研究,提出了一种基于网页主题分块的Shark—search算法。该算法在经典Shark—search算法的基础上依据网页组织结构根据网页布局标签对页面内容进行分块,从网页,块和链接三个层面与主题的相关性得到链接的综合价值,因而具有自学习功能,能统计学习与主题相关性较大的块特征,并在发生主题漂移的时候具有自调整功能,给予主题相关性较大的父页面上的链接更多被抓取的机会。采集实验结果表明,所提出的算法在经典Shark—search的基础上能较好地改进主题信息采集的查准率,能够更灵活地针对实际的Web资源状况进行自调整。 展开更多
关键词 Shark-search算法 网页分块 Web信息搜集 链接价值 主题漂移
在线阅读 下载PDF
一种基于最近搜索周期被引用频率的改进WPR算法 预览
4
作者 王旭阳 任国盛 《计算机科学》 CSCD 北大核心 2016年第2期86-88,共3页
针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容... 针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容分析,采用改进的TD-IDF算法来解决网页相关性,改善主题漂移现象;通过网页的最近搜索周期的被引用频率来提高那些较新而且价值较高的网页的PR值,从而改善偏重旧网页的现象。仿真结果表明,改进后的算法与WPR算法相比获得了更好的效果。 展开更多
关键词 主题特征 被引用频率 偏重旧网页 搜索周期 主题漂移
在线阅读 免费下载
基于用户行为与页面分析的改进PageRank算法 预览 被引量:5
5
作者 王旭阳 任国盛 《计算机工程》 CAS CSCD 北大核心 2016年第2期164-168,共5页
在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低。经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象。针对上述问题,引入网页权威因子和时间因子,通过网页按关键... 在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低。经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象。针对上述问题,引入网页权威因子和时间因子,通过网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页的PR值进行迭代修正,返回一个新的排序结果并分析网页内容,采用改进的TD-IDF算法解决网页相关性,避免主题漂移现象。仿真实验结果表明,改进算法可以提高网页排名的质量,使相关度较高的网页通过人们的自主选择获得不同程度的加权,获得加权的网页在检索结果中的排名得到提升,从而提高用户需求网页的查准率。 展开更多
关键词 权威因子 时间因子 主题漂移 转移概率 PR值
在线阅读 下载PDF
生态安全研究的主题漂移与趋势分析 预览 被引量:9
6
作者 胡秀芳 赵军 +2 位作者 查书平 鲁凤 王晓峰 《生态学报》 CAS CSCD 北大核心 2015年第21期6934-6946,共13页
近年来,国际上关于生态安全研究的文献大量涌现。随着全球变化和人类活动影响加剧,生态安全研究正发生着深刻变化,呈现出多目标、多层次、多学科交叉综合的复杂特点,研究主题日益丰富,但模糊性和争议性问题一直存在,对已有文献成... 近年来,国际上关于生态安全研究的文献大量涌现。随着全球变化和人类活动影响加剧,生态安全研究正发生着深刻变化,呈现出多目标、多层次、多学科交叉综合的复杂特点,研究主题日益丰富,但模糊性和争议性问题一直存在,对已有文献成果进行系统分析非常有必要。本文利用引文网络分析可视化工具CitespaceⅡ,通过绘制科学知识图谱,以定量与定性相结合的可视化文献综述研究方法,对各国学者发表的生态安全研究成果进行系统分析梳理,展示了研究主题的演进轨迹和发展趋势,总结了其发展变化的内在原因。研究表明:生态安全的研究主题可分为持续性和阶段性两类,主题演化轨迹符合Gartner光环曲线理论,人类文明发展阶段、国际政治经济格局、学科研究水平是决定生态安全研究阶段和主题演变的主要因素,该领域经历了问题提出与概念形成期、奠基拓展期、纵深发展期三个阶段,各阶段都有一些关键文献出现,这些引领学科发展的经典文献以自然科学研究为主;全球化、生物多样性、生态农业与农业集约化、恢复力、脆弱性是当前生态安全领域的研究热点;保障人类生存发展基本需要和人对环境变化的适应与响应将是21世纪生态安全研究的主要方向。 展开更多
关键词 生态安全 主题漂移 科学知识图谱 CitespaceⅡ
在线阅读 下载PDF
在线评论信息挖掘分析的数据来源可靠性研究 预览 被引量:3
7
作者 李金海 何有世 《软科学》 CSSCI 北大核心 2015年第4期94-99,共6页
通过将研究分解成三个子任务,对网络数据从运用PageRank与TrustRank剔除作弊网页开始;借助结合网页间主题相关度、时间差以及在线评论比例的权重的TC-PageRank算法,提炼与产品主题高度相关并包含大量在线评论数据的网页集;最后考虑了网... 通过将研究分解成三个子任务,对网络数据从运用PageRank与TrustRank剔除作弊网页开始;借助结合网页间主题相关度、时间差以及在线评论比例的权重的TC-PageRank算法,提炼与产品主题高度相关并包含大量在线评论数据的网页集;最后考虑了网页与产品主题的相似度以及网页的链接增幅对网页权威性的影响,运用改进的HITS算法,确定在线评论分析数据来源的权威网页集;而基于MapReduce的矩阵分块运算,降低了算法时空的复杂度。并通过仿真实验验证了该方法的可行性与准确性。 展开更多
关键词 在线评论 PAGERANK 主题漂移 链接增幅
在线阅读 下载PDF
基于用户兴趣度的PageRank改进算法 预览 被引量:2
8
作者 黄贤英 陈红阳 《重庆理工大学学报:自然科学版》 CAS 2014年第5期74-78,共5页
传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题.针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法.该算法主要从网页自身的客观特性和用户兴趣的主观特... 传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题.针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法.该算法主要从网页自身的客观特性和用户兴趣的主观特性两方面对网页的PR值进行重新估算,并依据估算后的网页PR值对网页做重排序.相比传统的PageRank算法,改进的PRUI算法进一步提高了系统检索的准确率和首页命中率. 展开更多
关键词 搜索引擎 PAGERANK算法 主题漂移 用户兴趣度 页面排序
在线阅读 免费下载
基于Tf-Idf和网页链接的PageRank改进算法 预览 被引量:1
9
作者 戴上平 郑波荣 《计算机应用与软件》 CSCD 北大核心 2013年第5期301-302,330共3页
提出基于Tf-Idf和网页链接对传统的PageRank算法不足之处进行改进。该算法不仅较好地解决了PageRank主题漂移问题,而且在查准率和查全率方面也有较大的提高。通过实验证明,该算法可以获得优于传统PageRank算法的查询结果集。
关键词 PAGERANK 查全率 搜索引擎 网页连接 主题漂移
在线阅读 下载PDF
基于角色划分的文献软聚类算法 预览
10
作者 马瑞新 邓贵仕 孟繁成 《计算机应用研究》 CSCD 北大核心 2012年第3期 856-858,共3页
传统的文献聚类算法根据分析文献关键词进行,忽视了文献之间的引用关系,导致了主题漂移和搜索精度不高的问题。针对引文网络中的聚类问题,受到优先情节和增长定律的启发,提出了一种基于角色划分的分层次的文献软聚类算法。首先根据文献... 传统的文献聚类算法根据分析文献关键词进行,忽视了文献之间的引用关系,导致了主题漂移和搜索精度不高的问题。针对引文网络中的聚类问题,受到优先情节和增长定律的启发,提出了一种基于角色划分的分层次的文献软聚类算法。首先根据文献之间的引用关系构造引用矩阵,进行结构挖掘;然后根据结构挖掘的结果为每一聚类构造聚类主题,进而进行关键词分析,精化聚类。实验结果表明,该算法能够有效地提高搜索精度和效率。 展开更多
关键词 主题漂移 优先情节 增长定律 角色划分 聚类主题
在线阅读 下载PDF
基于特殊主题的PageRank改进算法 被引量:1
11
作者 王建雄 《图书情报工作》 CSSCI 北大核心 2012年第21期114-118,共5页
在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网... 在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为。改进算法弥补了原算法的不足,提高了主题搜索的效率。 展开更多
关键词 主题漂移 PAGERANK算法 领域向量 锚文本
基于PageRank的主题过滤算法改进 预览 被引量:3
12
作者 王福海 《科技信息》 2011年第15期 J0077,J0227,共2页
对通用搜索引擎中的PageRank排序算法进行分析,针对原PageRank算法中"主题漂移"问题,提出一种与主题相关的改进算法,改进的PageRank值由链接重要性和内容重要性共同确定。
关键词 PAGERANK 搜索引擎 主题漂移 主题过滤
在线阅读 下载PDF
基于主题聚焦模型的PageRank改进算法 预览 被引量:2
13
作者 温泉 丁祥武 《计算机应用与软件》 CSCD 2011年第3期 173-175,共3页
通过研究传统的超链接分析算法PageRank及其改进算法TSPR(topic-sensitive PageRank)和MP-PageRank的不足,提出了一种新的改进方法,基于主题聚焦模型的PageRank算法。这种算法研究用户查询行为,建立主题聚焦模型,较好地解决了PageRan... 通过研究传统的超链接分析算法PageRank及其改进算法TSPR(topic-sensitive PageRank)和MP-PageRank的不足,提出了一种新的改进方法,基于主题聚焦模型的PageRank算法。这种算法研究用户查询行为,建立主题聚焦模型,较好地解决了PageRank主题漂移问题以及其他改进算法依赖查询上下文的缺点。更加准确地反映出页面的重要性,提供更高质量的查询结果集。 展开更多
关键词 PAGERANK TSPR MP-PageRank 主题聚焦 主题漂移
在线阅读 下载PDF
基于最大流及页面相似度的Web结构挖掘 预览 被引量:1
14
作者 李莹 吴晓军 《计算机技术与发展》 2011年第10期 112-115,共4页
针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构挖掘方法。该方法在传统的超链接结构挖掘算法HITS的基础上引入页面相似度值构造邻接矩阵,并结合基于... 针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构挖掘方法。该方法在传统的超链接结构挖掘算法HITS的基础上引入页面相似度值构造邻接矩阵,并结合基于最大流的Web社区发现技术来构建特征向量空间模型,通过迭代计算最终获得价值最高的权威结果集和中心结果集。实验结果证明该方法有较好的查准率与查全率,并有效抑制了“主题漂移”现象,具有一定的实用价值。 展开更多
关键词 WEB结构挖掘 主题漂移 页面相似度值
在线阅读 下载PDF
PageRank算法研究综述 预览 被引量:37
15
作者 李稚楹 杨武 谢治军 《计算机科学》 CSCD 北大核心 2011年第B10期 185-188,共4页
网页排序是搜索引擎的关键技术之一。介绍了著名的PageRank算法,针对其存在主题漂移、偏重旧网页等不足,分析了各种改进算法的基本思想和技术特点,希望为以后的研究工作提供基础性支持。
关键词 PAGERANK 主题漂移 偏重旧网页
在线阅读 免费下载
《新闻与传播研究》2006—2010年载文分析 预览
16
作者 姚冠一卓 张学福 《科技情报开发与经济》 2011年第17期 176-179,共4页
在介绍《新闻学与传播研究》概况的基础上,从期刊不同阶段的载文特点、主要发文机构、高产作者、论文合著、研究热点的持续与漂移情况、热点关键词、共词网络等方面,统计分析了《新闻学与传播研究》期刊2006—2010年载文的文献计量学特征。
关键词 新闻与传播研究 主题漂移 统计分析 文献计量分析
在线阅读 下载PDF
PageRank算法研究 预览 被引量:1
17
作者 张敏 李锋 《微计算机信息》 2011年第8期143-144,136共3页
简要分析了PageRank算法的思想及其不足,对国内外研究工作者的改进算法进行了分类,比较了它们的优缺点。对未来的研究方向进行了展望,给出了若干值得研究的问题。
关键词 信息检索 PAGERANK算法 时效性 主题漂移 潜在语义模型(LSM)
在线阅读 下载PDF
PageRank算法中主题漂移的研究 预览 被引量:12
18
作者 高琪 张永平 《微计算机信息》 2010年第9期117-119,89共4页
pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页。也正因此在使用pagerank算法时往往会发生主题漂... pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页。也正因此在使用pagerank算法时往往会发生主题漂移现象。产生这一问题的原因有两个,一是pagerank对网页权值平均分配,二是pagerank与查询主题的无关性。本文从这二方面入手,采用tf-idf算法计算主题的相关权重,提出了与查询主题相关的query-basedpagerank算法,有效地解决了原算法中的主题漂移问题。 展开更多
关键词 PAGERANK 主题漂移 主题敏感 页面排序 搜索引擎
在线阅读 下载PDF
基于相似度量矩阵HITS的改进算法
19
作者 何明 周军 +1 位作者 纪周鹏 李树友 《微电子学与计算机》 CSCD 北大核心 2010年第7期194-197,共4页
HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量... HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量权重矩阵,通过权重矩阵来归一HITS算法每次产生的Authority、Hub值.在查询效率和质量方面,改进的HITS算法更优,也减少了"主题漂移"现象的发生. 展开更多
关键词 HITS算法 主题漂移 相似度量 Authority值 Hub值
基于锚文本相似度的PageRank改进算法 预览 被引量:14
20
作者 王钟斐 王彪 《计算机工程》 CAS CSCD 北大核心 2010年第24期 258-260,共3页
分析搜索引擎Google的PageRank算法,给出其存在的3个问题及针对这3个问题提出的改进。结合锚文本相似度提出一种改进的PageRank算法,利用Nutch对传统PageRank算法和改进后的PageRank算法进行实验分析与比较。实验结果表明,改进的Page... 分析搜索引擎Google的PageRank算法,给出其存在的3个问题及针对这3个问题提出的改进。结合锚文本相似度提出一种改进的PageRank算法,利用Nutch对传统PageRank算法和改进后的PageRank算法进行实验分析与比较。实验结果表明,改进的PageRank算法提高了搜索结果的查准率,有利于减少主题漂移现象。 展开更多
关键词 PAGERANK算法 锚文本 相似度 主题漂移
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部 意见反馈