期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
AKNN-Qalsh: PostgreSQL系统高维空间近似最近邻检索插件 预览
1
作者 张楚涵 张家侨 冯剑琳 《中山大学学报:自然科学版》 CAS CSCD 北大核心 2019年第3期79-85,共7页
复杂数据对象(如图片、文本)通常被表示成高维特征向量。PostgreSQL系统现有的最近邻检索方法KNN-Gist基于树状索引实现,无法高效支持高维数据的最近邻检索。引入的PostgreSQL系统高维空间近似最近邻检索插件:AKNN-Qalsh,基于位置敏感... 复杂数据对象(如图片、文本)通常被表示成高维特征向量。PostgreSQL系统现有的最近邻检索方法KNN-Gist基于树状索引实现,无法高效支持高维数据的最近邻检索。引入的PostgreSQL系统高维空间近似最近邻检索插件:AKNN-Qalsh,基于位置敏感哈希机制实现,支持大规模、高维数据对象的近似最近邻检索。通过在五个真实数据集上的密集实验,验证了该插件的有效性。 展开更多
关键词 高维数据 特征向量 最近邻检索 位置敏感哈希 PostgreSQL插件
在线阅读 下载PDF
Top-Down grid位置敏感哈希 k 匿名隐私保护 预览
2
作者 汪小寒 刘世杨 +1 位作者 韩慧慧 罗永龙 《计算机应用研究》 CSCD 北大核心 2018年第8期2428-2430,2446共4页
传统位置服务匿名隐私保护方法大多在原始数据集上寻找匿名区域,很少对待隐匿区域进行筛选,会带来较高的时间消耗。事实上,匿名常常是在查询点周围进行的。通过采用Top-Down grid网格划分方法选择待匿名区域,提出了基于Top-Down gri... 传统位置服务匿名隐私保护方法大多在原始数据集上寻找匿名区域,很少对待隐匿区域进行筛选,会带来较高的时间消耗。事实上,匿名常常是在查询点周围进行的。通过采用Top-Down grid网格划分方法选择待匿名区域,提出了基于Top-Down grid的位置敏感哈希划分的 k 匿名隐私保护算法,不仅可以提高时间效率,而且与现实世界更相符;利用位置敏感哈希函数对所选位置点进行投影变换,使得划分更加合理、匿名损失率更小,匿名后的数据质量更高。理论分析和实验验证也表明所提方法的可行性和有效性。 展开更多
关键词 k -匿名 位置敏感哈希 Top-Down网格划分 隐私保护
在线阅读 下载PDF
基于稀疏向量距离的网络入侵数据检测 预览
3
作者 杨浩 章玲玲 +1 位作者 熊焕东 谢昕 《科学技术与工程》 北大核心 2017年第27期88-92,共5页
传统的网络入侵检测速度慢、实时性差,且误报率较高。为此,提出一种基于稀疏向量距离的网络入侵数据检测方法。该方法首先对所获得的网络样本数据进行初步分析,采用K-means算法对样本数据包进行量化处理得到该数据流的位置分布集,使用... 传统的网络入侵检测速度慢、实时性差,且误报率较高。为此,提出一种基于稀疏向量距离的网络入侵数据检测方法。该方法首先对所获得的网络样本数据进行初步分析,采用K-means算法对样本数据包进行量化处理得到该数据流的位置分布集,使用压缩感知的稀疏编码技术处理,得到数据的稀疏表示,然后通过随机投影获取数据集的二值哈希编码可以近似地表示稀疏向量的距离,与设定的阈值进行比较,判断该数据是否为入侵数据。根据这些稀疏向量的距离能够快速而准确地检测到入侵的网络数据。实验结果表明,相对于传统检测算法,本文算法具有速度快、实时性好、误报率低等优点,使入侵检测系统的性能得到了很大提高,充分确保了网络的安全性。 展开更多
关键词 压缩感知 位置敏感哈希 入侵检测 二值哈希编码 网络安全
在线阅读 免费下载
位置大数据中一种基于Bloom Filter的匿名保护方法 预览 被引量:2
4
作者 刘彦 张琳 《计算机科学》 CSCD 北大核心 2017年第6期144-149,共6页
位置大数据服务应用中存在大量的用户敏感信息,针对服务中海量数据分析的隐私泄露问题,提出一种基于Bloom Filter多哈希散列编码的位置匿名保护方法。采用启发式的隐私度量技术划分匿名区来隐藏真实的位置数据,保持欧氏距离上搜索目标... 位置大数据服务应用中存在大量的用户敏感信息,针对服务中海量数据分析的隐私泄露问题,提出一种基于Bloom Filter多哈希散列编码的位置匿名保护方法。采用启发式的隐私度量技术划分匿名区来隐藏真实的位置数据,保持欧氏距离上搜索目标的邻近关系以优化空间匿名框的面积,并在划分策略中引入查询服务相似性因子以减少空间碎片的产生。在移动用户和服务器之间构建可信的第三方位置匿名服务器,能有效地模糊目标节点,从而抵御恶意的隐私攻击。理论分析和仿真实验表明,新算法能有效优化匿名空间区域,提高隐私保护程度,并在海量数据集的构建过程中具有较优的时间复杂度。 展开更多
关键词 位置大数据服务 隐私保护 位置敏感哈希 匿名区搜索
在线阅读 免费下载
大数据下近似成员关系查询方法研究进展 预览
5
作者 胡会南 陈华辉 《数据通信》 2017年第2期27-34,共8页
近似成员关系查询(Approximate Membership Query,AMQ)要快速回答类似"数据对象q是否和给定的大数据集合S中的至少一个元素相似?",即"q是否是S的近似成员"问题。AMQ在图像检索、数据挖掘、模式识别、生物检测等领域有许多应用。... 近似成员关系查询(Approximate Membership Query,AMQ)要快速回答类似"数据对象q是否和给定的大数据集合S中的至少一个元素相似?",即"q是否是S的近似成员"问题。AMQ在图像检索、数据挖掘、模式识别、生物检测等领域有许多应用。对AMQ问题及其处理方法进行了综述介绍。从AMQ的定义出发,对处理AMQ问题的相关基础技术进行了介绍,讨论了目前主要的AMQ算法,分析比较了各算法的区别和优缺点,最后探讨了AMQ处理中尚需进一步研究的若干问题。 展开更多
关键词 大数据 近似成员关系查询 布鲁姆过滤器 位置敏感哈希
在线阅读 下载PDF
基于哈希技术的高维数据相似性搜索研究进展
6
作者 胡会南 《无线通信技术》 2017年第1期41-45,共5页
数据检索中的相似性搜索是数据处理的基础问题之一,被广泛应用于机器学习、模式识别、图像检索等领域。本文针对哈希函数构建过程的不同分为基于位置敏感哈希的哈希索引技术和基于位置敏感哈希与布隆过滤器结合的哈希索引技术两部分进... 数据检索中的相似性搜索是数据处理的基础问题之一,被广泛应用于机器学习、模式识别、图像检索等领域。本文针对哈希函数构建过程的不同分为基于位置敏感哈希的哈希索引技术和基于位置敏感哈希与布隆过滤器结合的哈希索引技术两部分进行综述。总结了具有代表性的哈希算法的研究现状,分析比较了各算法性能的主要差异,最后探讨了该技术尚需进一步研究的若干问题。 展开更多
关键词 高维数据 相似性搜索 位置敏感哈希 布隆过滤器
智能电网中一种动态数据完整性验证方案 预览 被引量:2
7
作者 孙旭 温蜜 +1 位作者 张栩 周波 《计算机工程》 CSCD 北大核心 2017年第8期38-43,共6页
为准确高效地验证智能电网云存储系统中数据的完整性,提出一种新的动态数据完整性验证方案。该方案在保证数据机密性的基础上,对数据执行BLS短签名操作,并支持第三方验证,可根据用户需求验证数据的完整性,减少计算开销,同时通过位置敏... 为准确高效地验证智能电网云存储系统中数据的完整性,提出一种新的动态数据完整性验证方案。该方案在保证数据机密性的基础上,对数据执行BLS短签名操作,并支持第三方验证,可根据用户需求验证数据的完整性,减少计算开销,同时通过位置敏感哈希的快速检索方式提高更新存储数据的查询效率,在验证完整性时快速检索数据。实验结果表明,该方案可准确验证电力数据的完整性,并且支持高效的数据动态更新。 展开更多
关键词 智能电网 云存储 数据完整性 BLS短签名 位置敏感哈希 动态更新
在线阅读 下载PDF
移动机器人视觉候选闭环召回方法设计 预览
8
作者 吴俊君 《计算机工程与设计》 北大核心 2016年第6期1659-1662,共4页
为改进移动机器人视觉SLAM闭环探测性能,提出基于位置敏感哈希的候选闭环召回方法。采用位置敏感哈希技术以随机比特采样的方式对尺度空间中的地图关键帧进行哈希索引,以局部互信息为图像相似性度量指标在哈希桶内召回候选闭环。在国际... 为改进移动机器人视觉SLAM闭环探测性能,提出基于位置敏感哈希的候选闭环召回方法。采用位置敏感哈希技术以随机比特采样的方式对尺度空间中的地图关键帧进行哈希索引,以局部互信息为图像相似性度量指标在哈希桶内召回候选闭环。在国际公开的数据集上,将该方法与典型BoW方法进行准确性对比实验,实验结果表明,针对大范围室外环境的拓扑地图,该方法仅需召回4个候选闭环即可达到100%的闭环召回率,避免了大量局部特征提取和离线训练过程,能力优于BoW方法。 展开更多
关键词 移动机器人 视觉SLAM 闭环探测 位置敏感哈希 局部互信息
在线阅读 下载PDF
基于内容的商品图像检索技术与系统研究 预览 被引量:1
9
作者 李灿 《移动通信》 2016年第8期63-69,74共8页
提出了一种新的基于商品图像的检索系统,充分利用当前学术界的一些高效算法,包括基于Hadoop平台的大数据处理技术,基于E2LSH的高维数据近邻查找技术,基于图像全局特征提取的GIST技术以及基于深度学习的卷积神经网络技术CNN。紧密结合这... 提出了一种新的基于商品图像的检索系统,充分利用当前学术界的一些高效算法,包括基于Hadoop平台的大数据处理技术,基于E2LSH的高维数据近邻查找技术,基于图像全局特征提取的GIST技术以及基于深度学习的卷积神经网络技术CNN。紧密结合这些新技术,在基于商品图像的检索方面取得了较好的检索效果。 展开更多
关键词 图像检索 位置敏感哈希 HADOOP MAPREDUCE HDFS CNN
在线阅读 下载PDF
图像检索研究综述及系统实现 预览 被引量:3
10
作者 杜丙新 《电子科技》 2016年第6期185-189,共5页
利用文献可视化分析工具对图像检索研究现状进行了综述,同时设计了一种基于位置敏感哈希算法的图像检索系统。通过位置敏感哈希算法将图像的特征向量映射到哈希桶中,从而有效地降低了计算复杂度并提高了图像检索的效率。实验结果表明,... 利用文献可视化分析工具对图像检索研究现状进行了综述,同时设计了一种基于位置敏感哈希算法的图像检索系统。通过位置敏感哈希算法将图像的特征向量映射到哈希桶中,从而有效地降低了计算复杂度并提高了图像检索的效率。实验结果表明,文中设计的方法在检索效率以及查全率-查准率两个测度上均获得了较好的性能。 展开更多
关键词 位置敏感哈希 图像检索 图像特征向量
在线阅读 免费下载
基于Spark框架的分布式入侵检测方法 预览 被引量:5
11
作者 左晓军 董立勉 曲武 《计算机工程与设计》 北大核心 2015年第7期1720-1726,共7页
为以较低的误报率和较高的检测率对攻击和恶意行为进行实时检测,基于Spark框架和位置敏感哈希算法,提出一种分布式数据流聚类方法 DSCLS,能够处理实时数据流,可根据数据流速进行横向分布式扩展。基于DSCLS分布式聚类算法,建立网络入侵... 为以较低的误报率和较高的检测率对攻击和恶意行为进行实时检测,基于Spark框架和位置敏感哈希算法,提出一种分布式数据流聚类方法 DSCLS,能够处理实时数据流,可根据数据流速进行横向分布式扩展。基于DSCLS分布式聚类算法,建立网络入侵检测系统,能够高速实时分析数据流,聚类相关模式,实时检测已知攻击和入侵,能够对未知的新型攻击进行检测。理论分析和实验结果表明,与主流的数据流聚类算法D-Stream相比,DSCLS方法能够有效提高检测率并降低误报率,在时间性能和可扩展性方面更有优势。 展开更多
关键词 入侵检测 数据流 聚类 位置敏感哈希 DSCLS算法
在线阅读 下载PDF
基于哈希编码学习的图像检索方法 预览
12
作者 左欣 沈继锋 +3 位作者 于化龙 高尚 徐丹 胡春龙 《江苏科技大学学报:自然科学版》 CAS 北大核心 2015年第6期567-573,共7页
针对传统的位置敏感哈希编码低效的问题,提出一种监督学习框架下基于正交子空间的判别投影哈希函数学习的海明编码方法.该方法首先根据特征值的能量分布进行子空间分解,其次基于Fisher判别分析准则,利用样本的分布信息学习一组最佳投影... 针对传统的位置敏感哈希编码低效的问题,提出一种监督学习框架下基于正交子空间的判别投影哈希函数学习的海明编码方法.该方法首先根据特征值的能量分布进行子空间分解,其次基于Fisher判别分析准则,利用样本的分布信息学习一组最佳投影的哈希函数,实现原始特征空间向海明空间的紧致嵌入,最终生成一组紧凑且具有判别性的二进制编码,并用于图像检索.在公开数据集上的实验结果表明:该算法与其他经典算法相比,具有较好的稳定性,降低了内存消耗并提高了检索的平均准确率. 展开更多
关键词 位置敏感哈希 正交子空间 判别投影学习 视觉字典 空间金字塔
在线阅读 下载PDF
一种基于压缩Fisher向量的目标检索方法 预览
13
作者 刘辛 杨素锦 杨俊 《火力与指挥控制》 CSCD 北大核心 2015年第7期37-42,共6页
当前,视觉词典法(Bo VW,Bag of Visual Words)是解决目标检索问题的主要方法,但传统的Bo VW方法具有词典生成时间效率低、检索内存消耗大等问题。针对这些问题,提出了基于压缩Fisher向量的目标检索方法,该方法首先将Fisher核机制用于... 当前,视觉词典法(Bo VW,Bag of Visual Words)是解决目标检索问题的主要方法,但传统的Bo VW方法具有词典生成时间效率低、检索内存消耗大等问题。针对这些问题,提出了基于压缩Fisher向量的目标检索方法,该方法首先将Fisher核机制用于目标检索,它能自动降低目标图像背景带来的不利影响,然后,采用位置敏感哈希(LSH,Locality Sensitive Hashing)对Fisher向量进行压缩编码以降低计算复杂度和内存开销,使之适用于大规模数据库。实验结果表明,新方法只用几百比特就能表征一幅图像内容,对大规模目标检索有很好的适用性,且较之当前主流的压缩视觉词典法具有更高的准确率。 展开更多
关键词 目标检索 视觉词典法 压缩Fisher向量 位置敏感哈希
在线阅读 下载PDF
利用改进LSH算法进行层次化新闻话题检测 被引量:1
14
作者 卢美莲 王梓 李佳珊 《北京邮电大学学报》 EI CAS CSCD 北大核心 2014年第3期32-37,共6页
针对回顾式话题检测方法存在的话题检测时效性较差的问题,提出了改进的位置敏感哈希(LSH)算法,并应用于互联网新闻层次化话题检测.在挖掘新闻内容特征的同时,应用潜在狄利克雷分布主题模型挖掘新闻的语义特征,将非二进制空间的内容特... 针对回顾式话题检测方法存在的话题检测时效性较差的问题,提出了改进的位置敏感哈希(LSH)算法,并应用于互联网新闻层次化话题检测.在挖掘新闻内容特征的同时,应用潜在狄利克雷分布主题模型挖掘新闻的语义特征,将非二进制空间的内容特征向量和主题特征向量转换到二进制特征空间上,依次应用LSH算法对新闻文本基于内容特征和主题特征聚类,得到具有"主题-内容"层次的话题.实验结果表明,该方法通过挖掘新闻的内容特征和主题特征,能更准确和完整地表现新闻内容;将内容特征和主题特征转换到统一的二进制空间,有效降低了聚类过程的时间复杂度,在保证话题检测准确率和话题在语义层面上扩展性的前提下,提高了话题检测的效率. 展开更多
关键词 话题检测 层次聚类 主题模型 位置敏感哈希
近似最近邻搜索算法——位置敏感哈希 预览 被引量:4
15
作者 高毫林 徐旭 李弼程 《信息工程大学学报》 2013年第3期332-340,共9页
寻找查询点的最近邻是信息处理相关领域的主要任务之一。在数据规模较大时需要采用快速检索算法,常用的快速检索算法主要是基于树的算法,但是当数据点维数较高时,这些算法的效率会变低。位置敏感哈希是当前解决高维搜索的最快的算法... 寻找查询点的最近邻是信息处理相关领域的主要任务之一。在数据规模较大时需要采用快速检索算法,常用的快速检索算法主要是基于树的算法,但是当数据点维数较高时,这些算法的效率会变低。位置敏感哈希是当前解决高维搜索的最快的算法,文章对汉明空间、欧式空间下的位置敏感哈希算法的实现方案进行了详细分析,对算法中数据点冲突概率、空间时间消耗、参数调整对算法性能的影响进行了详尽的研究和试验,最后讨论算法的优点和缺点,说明了算法应用于视觉聚类的可能性。 展开更多
关键词 近似最近邻搜索 位置敏感哈希 精确欧式距离位置敏感哈希 视觉聚类
在线阅读 免费下载
基于位置敏感哈希的海量文本数据查询算法研究 预览 被引量:1
16
作者 蒋巍 《科技通报》 北大核心 2013年第10期70-72,共3页
提出了一种基于位置敏感哈希算法的海量文本数据查询算法,通过位置敏感哈希算法将文本数据的特征向量映射到哈希桶中,从而有效地降低了计算复杂度并提高了数据检索的效率。首先,利用TF—IDF特征表示文本的特征向量,并根据给定的哈... 提出了一种基于位置敏感哈希算法的海量文本数据查询算法,通过位置敏感哈希算法将文本数据的特征向量映射到哈希桶中,从而有效地降低了计算复杂度并提高了数据检索的效率。首先,利用TF—IDF特征表示文本的特征向量,并根据给定的哈希函数集把文本的特征向量映射至哈希桶;接下来,利用哈希表为给定的文本计算出与之对应的直方图,通过直方图距离计算文本的相似度;最后,通过计算目标文本集中的文本与待查询文本的相似度进行文本排序,排序分值高的文本作为相关文本返回给用户。实验结果表明,对比已有方法文本提出的算法在MAP以及查全率-查准率曲线两个测度上都获得了较好的性能。 展开更多
关键词 位置敏感哈希 海量文本数据 哈希 排序
在线阅读 下载PDF
面向高维数据的LSH算法及应用 预览 被引量:1
17
作者 赵启潍 张乐 +1 位作者 祝贝利 刘静 《福建电脑》 2012年第4期 13-14,48,共3页
随着社交网络的兴起和不断发展,产生的海量高维数据给传统的检索技术带来了新的挑战。位置敏感哈希算法(LSH)是解决高维数据的快速检索和匹配的有效手段。本文首先叙述了LSH算法的基本原理,重点介绍了算法的构建和查询匹配过程,最... 随着社交网络的兴起和不断发展,产生的海量高维数据给传统的检索技术带来了新的挑战。位置敏感哈希算法(LSH)是解决高维数据的快速检索和匹配的有效手段。本文首先叙述了LSH算法的基本原理,重点介绍了算法的构建和查询匹配过程,最后就算法的发展和未来应用进行了展望。 展开更多
关键词 位置敏感哈希 高维数据 查询匹配
在线阅读 下载PDF
基于位置敏感哈希的网络视频重复检测 预览 被引量:2
18
作者 王洪峰 刘辛 《计算机应用研究》 CSCD 北大核心 2012年第5期 1954-1958,共5页
针对当前网络上存在着大量的重复或近似重复的视频问题,提出了一种基于镜头层比较和位置敏感哈希的快速准确的网络视频重复检测方法。通过视频间匹配的镜头数占查询视频总镜头数的比例来判断视频的相似性。除此之外,还利用著名的近似最... 针对当前网络上存在着大量的重复或近似重复的视频问题,提出了一种基于镜头层比较和位置敏感哈希的快速准确的网络视频重复检测方法。通过视频间匹配的镜头数占查询视频总镜头数的比例来判断视频的相似性。除此之外,还利用著名的近似最近邻查找技术——LSH在镜头层来快速查找相似镜头,从而提高检测速度。通过将镜头作为检索单元,把数据库中所有视频的镜头放到一起构建一个新的数据集,将种子(查询)视频的每一个镜头作为一个查询请求,应用基于LSH的近似近邻检索方法,检索出与查询镜头相匹配的所有镜头,最后融合这些返回的结果,得到查询视频的重复或者近似重复的视频集。通过在包含12 790个视频的CC_WEB_VIDEO数据集上的实验结果表明,该方法取得了相比已有方法更好的检测性能。 展开更多
关键词 网络视频 重复检测 位置敏感哈希 镜头层比较
在线阅读 下载PDF
基于多表频繁项投票和桶映射链的快速检索方法 预览 被引量:3
19
作者 高毫林 彭天强 +1 位作者 李弼程 郭志刚 《电子与信息学报》 EI CSCD 北大核心 2012年第11期2574-2581,共8页
为解决基于随机映射的高维向量快速检索方法位置敏感哈希存在的随机性强和内存消耗大两个问题,在E2LSH(Exact Euclidean Locality Sensitive Hashingl的基础上提出了基于多表频繁项投票和桶映射链的快速检索方法。该方法用检索结果构... 为解决基于随机映射的高维向量快速检索方法位置敏感哈希存在的随机性强和内存消耗大两个问题,在E2LSH(Exact Euclidean Locality Sensitive Hashingl的基础上提出了基于多表频繁项投票和桶映射链的快速检索方法。该方法用检索结果构造基准索引矩阵,并对基准索引矩阵进行频繁项投票和校正得出最终索引来降低检索的随机性;桶映射链利用E2LSH的数据划分特性减少检索时读入内存的数据点的数目,以此来降低内存消耗。实验证明该方法能减弱检索的随机性,并有效地降低检索的内存消耗。这对于提高大规模信息检索尤其是图像检索的可行性有着较大的作用。 展开更多
关键词 信息检索 位置敏感哈希 随机性 内存消耗 频繁项投票 桶映射链
在线阅读 免费下载
基于多表投票的弱随机检索方法 预览
20
作者 龙清 郭志刚 高毫林 《信息工程大学学报》 2012年第3期319-324,共6页
高维向量检索在模式识别、计算机视觉、信息检索等领域有着重要的作用。对数据点进行随机映射的位置敏感哈希是当前该问题的主要解决方法,它虽然速度快,但随机性强。为减弱其随机性,提出了多表投票的弱随机检索方法。该方法首先对所... 高维向量检索在模式识别、计算机视觉、信息检索等领域有着重要的作用。对数据点进行随机映射的位置敏感哈希是当前该问题的主要解决方法,它虽然速度快,但随机性强。为减弱其随机性,提出了多表投票的弱随机检索方法。该方法首先对所有数据点进行随机映射,然后进行相似计算得出检索向量,再将多个哈希表对应的检索向量构造成矩阵,最后对该矩阵列元素进行频次投票得出最终索引。实验说明该方法能综合利用多个哈希表的信息降低位置敏感哈希的随机性,并得出与真实近似程度相当的结果。 展开更多
关键词 高维向量 位置敏感哈希 多表投票 随机映射
在线阅读 免费下载
上一页 1 2 3 下一页 到第
使用帮助 返回顶部 意见反馈