期刊文献+
共找到21,779篇文章
< 1 2 250 >
每页显示 20 50 100
文章速递大数据平台下基于类型的小文件合并方法 认领
1
作者 秦加伟 刘辉 方木云 《软件工程》 2020年第10期12-14,11,共4页
Hadoop存储海量小文件将导致存储和计算性能显著下降。本文通过分析HDFS架构提出了一种基于文件类型的小文件合并方法,即根据文件类型将相同类型的小文件合并为大文件,并建立小文件到合并文件的索引关系,索引关系存储于HashMap中。为了... Hadoop存储海量小文件将导致存储和计算性能显著下降。本文通过分析HDFS架构提出了一种基于文件类型的小文件合并方法,即根据文件类型将相同类型的小文件合并为大文件,并建立小文件到合并文件的索引关系,索引关系存储于HashMap中。为了进一步提高文件读取速度,建立了基于HashMap的缓存机制。实验表明该方法能显著提高HDFS在存储和读取海量小文件时的整体性能。 展开更多
关键词 HDSF HashMap 索引 合并 缓存
在线阅读 下载PDF
文章速递面向混合索引的区块链系统的可查询性优化 认领
2
作者 郑浩瀚 申德荣 +1 位作者 聂铁铮 寇月 《计算机科学》 CSCD 北大核心 2020年第10期301-308,共8页
区块链技术具有去中心化和不可篡改性等特性,被认为是下一代的颠覆性核心技术。然而,现有区块链系统在数据管理方面的性能较弱,通常只能根据Hash值查询相关交易。当前对于查询的研究大多是将数据同步存储到外部数据库中,通过借用外部数... 区块链技术具有去中心化和不可篡改性等特性,被认为是下一代的颠覆性核心技术。然而,现有区块链系统在数据管理方面的性能较弱,通常只能根据Hash值查询相关交易。当前对于查询的研究大多是将数据同步存储到外部数据库中,通过借用外部数据库进行查询,或是研究如何保证全节点的可靠性,没有从实际意义上解决区块链查询效率低下的问题。文中提出了一种新的解决方案。首先,将区块链数据划分成不同属性;其次,根据不同数据属性,结合区块链本身的Merkle树和多种索引结构,提出了一种新的索引——MHerkle树,该结构在充分保证区块链不可篡改性的情况下增强了区块链的查询性能;然后,设计了MHerkle树的索引构建算法,并根据索引提出了基于不同属性的查询算法以及范围查询算法;最后,通过实验验证了所提索引的可行性和有效性。 展开更多
关键词 区块链 查询 索引 不可篡改 优化
在线阅读 下载PDF
不可达顶点剪枝算法及其在最短路径中的应用 认领
3
作者 李艳 王阳阳 +1 位作者 张红岩 武优西 《计算机工程与应用》 CSCD 北大核心 2020年第15期51-57,共7页
k步可达性查询用于回答图G中从顶点u到达顶点v最多k步是否存在路径,但其多用于无权图的可达性研究。针对加权图,在图中构建了最早到达、逆向最早到达和最晚到达等三个索引,并应用这三个索引实现对不可达顶点的快速剪枝,从而有效地缩减... k步可达性查询用于回答图G中从顶点u到达顶点v最多k步是否存在路径,但其多用于无权图的可达性研究。针对加权图,在图中构建了最早到达、逆向最早到达和最晚到达等三个索引,并应用这三个索引实现对不可达顶点的快速剪枝,从而有效地缩减了加权图的规模。运用该方法建立索引并剪枝顶点的时间复杂度与空间复杂度分别为O(n+e)和O(n),这里n和e分别为图中顶点的数目和边的数目。该方法可以与Dijkstra算法、Floyd算法和A*算法等多种传统算法相结合,并应用于最短路径求解,从而提高传统算法计算性能。最后以物流配送网络为例进行了实验验证,实验结果表明提出的方法可以正确并高效地对不必要计算的顶点进行剪枝,从而加快了最短路径求解速度,验证了提出方法的有效性。 展开更多
关键词 索引 剪枝策略 最短路径 可达性查询
在线阅读 下载PDF
UCG201年度游戏索引 认领
4
《游戏机实用技术》 2020年第1期235-239,共5页
在2019年上一世代主机的游戏基本不见踪影,仅有像《舞力全开》这类保持着全平台习惯的游戏还能在对应机种一览里看到些让人感到许久不见的主机名称。也因此2019年的索引里游戏类型数量进一步缩水,仅有PSV还勉强“现役”,不过由于主机本... 在2019年上一世代主机的游戏基本不见踪影,仅有像《舞力全开》这类保持着全平台习惯的游戏还能在对应机种一览里看到些让人感到许久不见的主机名称。也因此2019年的索引里游戏类型数量进一步缩水,仅有PSV还勉强“现役”,不过由于主机本身已经退市,所以到了2020年估计就不会见到这个奋战多年的掌机了,相对的也许会迎来新的成员:PS系列和Xbox系列的新主机入驻也说不定。 展开更多
关键词 游戏类型 索引 掌机 主机
关于年鉴内容索引编制的一点思考 认领
5
作者 马冰霜 《巴蜀史志》 2020年第3期93-94,共2页
索引(Index),《现代汉语词典(第7版)》解释为"把书刊中的项目或内容摘记下来,每条下标注出处页码,按一定次序排列,供人查阅的资料。也叫引得。"根据360百科搜索,适用于年鉴的索引被称为"内容索引"(Content index),... 索引(Index),《现代汉语词典(第7版)》解释为"把书刊中的项目或内容摘记下来,每条下标注出处页码,按一定次序排列,供人查阅的资料。也叫引得。"根据360百科搜索,适用于年鉴的索引被称为"内容索引"(Content index),是将年鉴所载文件、文章、条目、图表中所包含的"事物、人名、地名、其他名词及术语等"内容要项摘录出来而编成索引,并附于年鉴后面。本文以《成都年鉴》为例,提出编制年鉴内容索引的有效步骤。 展开更多
关键词 成都年鉴 现代汉语词典 次序排列 索引 年鉴内容
在线阅读 下载PDF
浅析ElasticSearch在CentOS环境下的部署与应用 认领
6
作者 王槊 邵柱 《网络安全和信息化》 2020年第8期102-103,共2页
ElasticSearch是一款分布式的搜索及分析引擎,在建立索引、搜索以及数据分析方面都有着非常优异的表现。本文笔者详细介绍了该引擎的部署细节与如何应用。
关键词 分析引擎 分布式的 部署与应用 数据分析 索引 搜索
在线阅读 下载PDF
地学时序大数据的相似性度量与索引方法综述 认领
7
作者 何珍文 吴冲龙 +3 位作者 刘刚 田宜平 张夏林 陈麒玉 《地质科技通报》 CAS CSCD 北大核心 2020年第4期44-50,共7页
地学时序大数据具有多传感器、多目标、多分辨率、多类型的多源异构特征,是地学领域机器学习与数据挖掘的重要数据来源,分为基于时点和基于时段的两大类时序数据。现有时序数据的相似性度量与索引研究主要聚焦在前者。时序数据表达方法... 地学时序大数据具有多传感器、多目标、多分辨率、多类型的多源异构特征,是地学领域机器学习与数据挖掘的重要数据来源,分为基于时点和基于时段的两大类时序数据。现有时序数据的相似性度量与索引研究主要聚焦在前者。时序数据表达方法的核心思想是降维处理,是相似性度量与索引方法的基础,主要包括基于域变换和模型的表达方法和基于极限分段思想的表达方法。相似性度量的核心是相似性距离计算,主要分为锁步度量和弹性度量。它为时序数据索引中索引项的聚合与划分提供了基本准则。多源异构地学时序大数据的高效相似性度量与分布式索引方法是地学大数据领域未来的重要研究方向。 展开更多
关键词 时序数据 大数据 表达 索引 相似性度量
在线阅读 免费下载
基于KST索引的最大连通Steiner分量查询算法 认领
8
作者 陈子阳 陈伟 +1 位作者 贾勇 周军锋 《计算机学报》 EI CSCD 北大核心 2020年第7期1215-1229,共15页
查找图的连通分量在生物信息学领域有着重要应用价值,其中的关键问题之一是查询最大连通Steiner分量(SMCC).针对已有最大连通Steiner分量查询方法中存在的查询效率低的问题,本文首先提出利用k-edge连通分量与(k+1)-edge连通分量之间的... 查找图的连通分量在生物信息学领域有着重要应用价值,其中的关键问题之一是查询最大连通Steiner分量(SMCC).针对已有最大连通Steiner分量查询方法中存在的查询效率低的问题,本文首先提出利用k-edge连通分量与(k+1)-edge连通分量之间的包含关系建立顶点集合的分层索引KST.和现有的专用索引相比,KST索引规模得到了缩减;然后本文提出了基于KST索引的SMCC查询算法以及具有顶点数量限制的SMCC L查询算法.和已有方法中索引的是图中顶点不同,KST索引中维护的是顶点集合的包含关系.其优点在于将已有方法在遍历过程中的一次一顶点的查询方式转换为更高效的一次一集合的查询方式,显著减少了需要访问的索引点数量,极大提升了查询处理的效率;最后,基于15个真实数据集进行实验测试,从不同角度验证了本文所提方法的高效性. 展开更多
关键词 无向图 k-edge连通分量 最大连通Steiner分量 索引 最大生成树
在线阅读 下载PDF
DSI:一种基于动态分段的时间序列查询索引 认领
9
作者 周骑骏 王鹏 汪卫 《计算机工程》 CAS CSCD 北大核心 2020年第2期88-95,共8页
时间序列数据主要依据采集时间进行排序,时间序列上相邻的数据具有一定的关联性,当用户读取时间序列数据时不只是读取一条数据,而是连续读取一段时间序列数据。针对时间序列的局部性特点,提出一种基于动态分段的时间序列索引DSI,通过设... 时间序列数据主要依据采集时间进行排序,时间序列上相邻的数据具有一定的关联性,当用户读取时间序列数据时不只是读取一条数据,而是连续读取一段时间序列数据。针对时间序列的局部性特点,提出一种基于动态分段的时间序列索引DSI,通过设置差值及差值等级对时间序列数据进行动态分段,使用区间树快速查找不同长度的数据分段块,并利用层次聚类算法优化查询结果集合。实验结果表明,DSI索引的查询效率优于现有时间序列查询索引。 展开更多
关键词 索引 范围查询 时间序列 区间树 层次聚类
在线阅读 下载PDF
TiDB的多索引访问优化 认领
10
作者 兰海 韩珂 +2 位作者 申砾 崔秋 彭煜玮 《计算机应用》 CSCD 北大核心 2020年第2期410-415,共6页
当查询条件涉及多个已建立索引的属性时,TiDB不能利用多个索引产生更优的执行计划。为了解决此问题,在研究现有数据库解决方案(如PostgreSQL和MySQL等)后,在TiDB中提出一种同时利用多个索引的新类型数据访问路径,称为MultiIndexPath。首... 当查询条件涉及多个已建立索引的属性时,TiDB不能利用多个索引产生更优的执行计划。为了解决此问题,在研究现有数据库解决方案(如PostgreSQL和MySQL等)后,在TiDB中提出一种同时利用多个索引的新类型数据访问路径,称为MultiIndexPath。首先,设计算法生成一个查询可能的MultiIndexPath,并产生该路径的物理计划MultiIIndexPlan,然后计算物理计划的代价;其次,结合TiDB的架构与实现,提出MultiIndexPlan的通用执行框架;最后,当条件为合取范式时,提出Pipeline执行方案。整个工作基于TiDB 3.0实现并进行若干实验,结果表明:当条件为析取范式时,所提方案的性能比原TiDB至少有一个数量级提升;当条件为合取范式时,性能也优于原TiDB。 展开更多
关键词 分布式数据库 TiDB 优化器 索引
在线阅读 下载PDF
分布式集群系统中Session会话的高效共享方法研究 认领
11
作者 王建永 何旻诺 +1 位作者 方宽 唐乐 《电子设计工程》 2020年第6期136-139,148共5页
传统共享方法是在应用服务器中进行的,其Session会话管理是独立的,意味着在集群系统中,一旦出现机器宕机,那么会话共享时间就会缩短。针对该问题,提出了基于有序模型Session会话的高效共享方案。保持原IP地址,保证系统不会出现机器宕机... 传统共享方法是在应用服务器中进行的,其Session会话管理是独立的,意味着在集群系统中,一旦出现机器宕机,那么会话共享时间就会缩短。针对该问题,提出了基于有序模型Session会话的高效共享方案。保持原IP地址,保证系统不会出现机器宕机,复制集群统一管理Session,使任何一台机器上都拥有相同Session状态。构建基于Session有序模型,对会话数据进行访问,并建立会话索引,用二维平面代表磁盘文件系统的逻辑地址,使用键值对的形式保存所有关键字矩阵之间的包含关系,由此实现Session会话的高效共享。由测试结果表明,该方法共享时间较长,为保障会话安全提供技术支持。 展开更多
关键词 分布式集群 SESSION 索引 数据读写 访问
在线阅读 下载PDF
XML引擎与关系数据库集成测试技术 认领
12
作者 许波 《中国新技术新产品》 2020年第5期59-60,共2页
可扩展标记语言XML(eXtensible Markup Language)已成为Web上表示和交换数据的标准格式。该文针对目前XML数据管理日益增长的需求,设计并开发了无缝集成于关系数据库的纯XML数据管理引擎系统,并对如何开展XML数据存储、数据查询、关键... 可扩展标记语言XML(eXtensible Markup Language)已成为Web上表示和交换数据的标准格式。该文针对目前XML数据管理日益增长的需求,设计并开发了无缝集成于关系数据库的纯XML数据管理引擎系统,并对如何开展XML数据存储、数据查询、关键字检索、数据更新模块技术指标的测试工作进行了研究。通过测试手段对DiReX:与关系数据库系统无缝集成的纯XML引擎的文档、功能性、可靠性、易用性进行了全面讲解。 展开更多
关键词 XML XQUERY XPATH 索引 关键字检索
在线阅读 下载PDF
《西昌学院学报》(社会科学版)2019年“复印报刊资料”转载统计 认领
13
《西昌学院学报:社会科学版》 2020年第2期128-128,F0003,共2页
根据中国人民大学书报资料中心2020年3月13日提供的"复印报刊资料"转载统计,《西昌学院学报》(社会科学版)2019年共刊发论文103篇,被中国人民大学书报资料中心"复印报刊资料"索引收录86篇,索引率为84%。具体索引情... 根据中国人民大学书报资料中心2020年3月13日提供的"复印报刊资料"转载统计,《西昌学院学报》(社会科学版)2019年共刊发论文103篇,被中国人民大学书报资料中心"复印报刊资料"索引收录86篇,索引率为84%。具体索引情况统计如下:论习近平对邓小平对外开放思想的继承与发展/田瑞欣,蒋朝莉/《/中国特色社会主义理论》2019第10期。 展开更多
关键词 中国人民大学 复印报刊资料 西昌学院 中国特色社会主义理论 索引 学报 转载
在线阅读 免费下载
一种基于Lucene的高效索引建立方法 认领
14
作者 李致远 冯琳 《工业控制计算机》 2020年第1期77-78,共2页
随着计算机技术和互联网技术的发展,人们也越来越多的使用电子文档记录数据,电子文档具有容量大,易存储和易转移等特点,但当数据量较大时查找电子文档的内容就需要借助索引技术加快搜索速度,索引技术的优劣直接影响用户的使用体验。主... 随着计算机技术和互联网技术的发展,人们也越来越多的使用电子文档记录数据,电子文档具有容量大,易存储和易转移等特点,但当数据量较大时查找电子文档的内容就需要借助索引技术加快搜索速度,索引技术的优劣直接影响用户的使用体验。主要探讨单机存储大规模文档时高效索引的建立问题,论文分析检索系统的组成和原理,最后使用Lucene工具包通过多线程建立多个索引目录的方式,加速索引的建立以及索引查询的速度。实验结果表明,该文的方法能有效提升索引的创建和搜索速度。 展开更多
关键词 LUCENE 文本文档 索引
在线阅读 下载PDF
基于ORACLE数据库的SQL性能优化 认领
15
作者 岳彩云 赖晓风 《电脑知识与技术:学术版》 2020年第10期17-19,共3页
数据库系统是任何信息系统最重要的组成部分,它涉及信息系统运行效率,影响系统性能.随着现代信息技术的进步,数据库的规模越来越庞大,对数据处理的操作也越来越复杂.在Oracle数据库系统中,查询操作是最基本、最复杂、最频繁的操作,SQL... 数据库系统是任何信息系统最重要的组成部分,它涉及信息系统运行效率,影响系统性能.随着现代信息技术的进步,数据库的规模越来越庞大,对数据处理的操作也越来越复杂.在Oracle数据库系统中,查询操作是最基本、最复杂、最频繁的操作,SQL的查询语句的效率直接影响数据库的整体性能.该文主要介绍了SQL的语句所用优化技术,简要分析了数据库逻辑结构的优化、数据库物理存储结构的优化、使用分区.同时深入研究SQL性能分析及优化,其中,手动进行SQL profile绑定主要涉及要执行的SQL文本、计划出问题后的表现、采用sql profile绑定;索引调优涉及要执行的SQL文本、SQL执行的相关统计信息、SQL执行计划、创建索引等.经过研究得出,若想将ORACLE数据库性能提高,必须多角度优化SQL语句. 展开更多
关键词 数据库 SQL 索引 查询
在线阅读 下载PDF
关系数据库中海量要素存储的分区优化研究 认领
16
作者 叶云霜 林伟华 +1 位作者 刘福江 董晓莹 《计算机技术与发展》 2020年第1期167-173,共7页
目前,关系数据库中的分区技术应用相当广泛,但是用分区策略管理海量要素图层数据的存储与索引没有比较系统的技术方法。采用不同管理方式、不同分区粒度、不同索引方式及其组合的分区技术来系统地管理海量空间图层数据,进一步研究了不... 目前,关系数据库中的分区技术应用相当广泛,但是用分区策略管理海量要素图层数据的存储与索引没有比较系统的技术方法。采用不同管理方式、不同分区粒度、不同索引方式及其组合的分区技术来系统地管理海量空间图层数据,进一步研究了不同的分区粒度及索引方式对查询效率的影响,并通过实验验证了关系数据库中的分区技术对海量要素图层数据的存储与管理具有优化作用。结果表明,在不使用分区键作为查询条件时,分区粒度越大查询效率越高;使用分区键作为查询条件时,本地分区索引查询效率更高等。利用合理的分区方案使得海量要素图层数据存储和管理得以优化,对矢量大数据的存储和管理研究具有重要意义,为更好地应用分区技术来解决实际遇到的存储与检索效率问题提供决策支持。 展开更多
关键词 海量要素图层 关系数据库 分区 存储 索引
在线阅读 下载PDF
基于语料库工具AntConc对《PrepEdge Bridging》写作教材的中等频率词汇难度和词汇分布研究 认领
17
作者 李丰贤 《国外英语考试教学与研究》 2020年第2期106-119,共14页
过去,语料库曾经是少数专业人士如语言学或语言测试学专家使用的工具;但现在随着电脑技术的广泛普及和教学理念的更新,基于语料库的研究方兴未艾。语料库的数据统计和分析功能使得对英语教材的评估变为现实。本文主要探讨通过自建语料... 过去,语料库曾经是少数专业人士如语言学或语言测试学专家使用的工具;但现在随着电脑技术的广泛普及和教学理念的更新,基于语料库的研究方兴未艾。语料库的数据统计和分析功能使得对英语教材的评估变为现实。本文主要探讨通过自建语料库的方法,对《PrepEdge Bridging》写作教材的中等频率的词汇难度和分布情况进行评估和研究,以及基于此数据和给教材编写者、教材使用者以及学生提出可优化的建议。 展开更多
关键词 教材 词汇 难度 频率 语料库 索引
在线阅读 下载PDF
钛冶金数据库条目性能优化设计研究 认领
18
作者 马力 唐晓宁 +2 位作者 贺韬 谢刚 张彬 《矿冶》 CAS 2019年第1期50-53,共4页
钛冶金数据库是基于传统数据库软件开发的,其中最重要的一部分就是各种钛冶金数据的数学计算模型。钛化合物的热力学计算数据存储形式复杂、计算过程繁琐,查询和分析计算速度都受到数据库性能的影响。为此把数据库索引建立在基础数据库... 钛冶金数据库是基于传统数据库软件开发的,其中最重要的一部分就是各种钛冶金数据的数学计算模型。钛化合物的热力学计算数据存储形式复杂、计算过程繁琐,查询和分析计算速度都受到数据库性能的影响。为此把数据库索引建立在基础数据库上,成为索引数据库,使数据索引单独存放在该数据库中。索引数据库可以按照经济性能的比较,规划成标准大小的索引数据库,新增数据根据自身数据特点形成新的索引加入到索引数据库中,这样就利用已有数据库的处理能力对条目性能进行了优化,大大提高了钛冶金数据库的数据检索效率。 展开更多
关键词 钛冶金数据库 数据条目 索引 索引数据库 索引生产
在线阅读 下载PDF
中文索引平台建设--以“索引家”开发为例 认领
19
作者 王雅戈 叶继元 +3 位作者 黄建年 唐强 刘峰 杨斐 《图书馆论坛》 CSSCI 北大核心 2019年第11期37-40,共4页
文章分析研发中文索引平台的必要性;以"索引家"为例,探讨中文索引平台开发的思路、功能模块、效果等;展望中文索引平台发展趋势。
关键词 索引 中文索引平台 索引
在线阅读 下载PDF
面向CDP系统的视图盘构建方法 认领
20
作者 周娇 《信息安全研究》 2019年第2期157-161,共5页
在传统的块级持续数据保护(continuous data protection,CDP)系统中,过去某时间点的恢复任务一旦完成,被保护磁盘当前时刻的数据状态就被完全覆盖,必须将被保护磁盘再次恢复到最新数据状态,当前工作才能得以继续进行下去.针对传统CDP系... 在传统的块级持续数据保护(continuous data protection,CDP)系统中,过去某时间点的恢复任务一旦完成,被保护磁盘当前时刻的数据状态就被完全覆盖,必须将被保护磁盘再次恢复到最新数据状态,当前工作才能得以继续进行下去.针对传统CDP系统恢复功能“一次查看,两次恢复”的问题,提出了日志盘分区技术及一种元数据层次式多级索引技术.将元数据与变动数据分别存放在日志盘的不同区域,并利用B+树与改进B+树将元数据区块和变动数据区块组织起来,形成元数据层次式多级索引,将过去任意时间点的数据挂载到虚拟磁盘供用户检视.经实验证明,该方法在不影响被保护磁盘当前数据状态的前提下向用户提供过去任意时间点的数据,简化了用户操作,减少了时间消耗. 展开更多
关键词 持续数据保护 日志盘分区 元数据 B^+ 索引 虚拟磁盘
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部 意见反馈