期刊文献+
共找到418篇文章
< 1 2 21 >
每页显示 20 50 100
畸变差改正算法OpenCL并行加速研究 预览
1
作者 于梦华 王双亭 +2 位作者 李英成 朱祥娥 刘晓龙 《遥感信息》 CSCD 北大核心 2019年第3期88-92,共5页
针对畸变差改正算法的处理速度不高和CUDA实现算法加速的设备局限性问题,提出了一种OpenCL并行改进畸变差纠正算法实现加速的方法。该方法是对传统的畸变差纠正算法进行并行改进,通过调用计算机GPU的计算单元实现算法加速;采用CPU+GPU... 针对畸变差改正算法的处理速度不高和CUDA实现算法加速的设备局限性问题,提出了一种OpenCL并行改进畸变差纠正算法实现加速的方法。该方法是对传统的畸变差纠正算法进行并行改进,通过调用计算机GPU的计算单元实现算法加速;采用CPU+GPU的异构模式实现算法加速,将传统算法中逐像素密集计算部分分配到GPU进行处理;与CUDA实现算法加速针对NVIDIA显卡设备不同,OpenCL并行改进的算法没有了设备的限制。实验结果表明,相对于传统算法来说,影像畸变差纠正处理速度显著提升,总体加速比最高达5.976,计算部分加速比最高达到63.432,同时在AMD显卡设备上也得到了较好的加速效果。 展开更多
关键词 OPENCL 算法加速 畸变差改正 并行改进 加速
在线阅读 下载PDF
星载SAR图像几何校正并行算法研究
2
作者 范明虎 田军锋 +2 位作者 赵建辉 左宪禹 葛强 《河南大学学报:自然科学版》 CAS 2019年第5期553-558,共6页
并行计算是遥感图像快速处理的基本方法,而并行算法则是实现这种方法的关键之一.针对星载SAR图像几何校正中单幅图像的快速处理问题,首先分析了一种串行校正算法的可并行特征,随后分别设计了一种面向多CPU/核和一种面向GPU的全局并行校... 并行计算是遥感图像快速处理的基本方法,而并行算法则是实现这种方法的关键之一.针对星载SAR图像几何校正中单幅图像的快速处理问题,首先分析了一种串行校正算法的可并行特征,随后分别设计了一种面向多CPU/核和一种面向GPU的全局并行校正算法,并利用2幅星载SAR图像测试了多种数据粒度下这2种算法的加速效能.实验结果表明,这2种并行算法可以大幅提高星载SAR图像的几何校正速度;CPU并行算法的性能主要与CPU/核心数目有关,而GPU并行算法则主要与数据粒度有关;后者具有很高的加速比,是几何校正的高效方法. 展开更多
关键词 SAR图像 几何校正 并行算法 加速
Level set函数快速步进并行重构的分区优化 预览
3
作者 夏波 黄筱云 +2 位作者 陈同庆 程永舟 江诗群 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2019年第9期1601-1607,共7页
为进一步提升Level set函数重构的分区并行重构效率,本文采用均分交界面方式进行分区,并保证生成内边界重构节点数量最少。通过运用基于共享存储并行编程(OpenMP)多线程技术的并行计算模型,实现圆球、Zalesak球和哑铃等值面的并行重构... 为进一步提升Level set函数重构的分区并行重构效率,本文采用均分交界面方式进行分区,并保证生成内边界重构节点数量最少。通过运用基于共享存储并行编程(OpenMP)多线程技术的并行计算模型,实现圆球、Zalesak球和哑铃等值面的并行重构。计算结果表明:新分区方法能平衡子区域间计算荷载,减少子区域间信息传递次数和节点回滚次数,与均分区域方法相比,新分区方法能够获得更高计算速度,具有更好的实用性和可扩展性。 展开更多
关键词 LEVEL set函数 快速步进法 并行重构 分区优化 交界面 共享存储并行编程 多线程技术 加速
在线阅读 下载PDF
扰动引力多核快速并行算法 预览
4
作者 黄炎 王庆宾 +3 位作者 冯进凯 谭勖立 范雕 马越原 《测绘科学技术学报》 北大核心 2019年第2期139-142,共4页
程飞行器和弹道导弹的精确控制与导航会受到地球外部扰动引力场的影响,实践中常利用地球重力场位系数模型计算扰动引力矢量,但其计算效率随着所用模型阶次的升高而显著降低。针对这一问题,文中提出利用OpenMP并行算法快速计算轨迹点扰... 程飞行器和弹道导弹的精确控制与导航会受到地球外部扰动引力场的影响,实践中常利用地球重力场位系数模型计算扰动引力矢量,但其计算效率随着所用模型阶次的升高而显著降低。针对这一问题,文中提出利用OpenMP并行算法快速计算轨迹点扰动引力矢量,在不损失精度的前提下有效提高了计算效率。通过数值实验可知,所提方法可以提高扰动引力矢量的计算效率,加速比达到6倍。这也为重力场元快速计算提供了参考方案。 展开更多
关键词 并行计算 重力场模型 扰动引力 OpenMP算法 加速
在线阅读 免费下载
改进遗传算法的MapReduce并行化研究 预览
5
作者 董义明 王鹏达 +1 位作者 李鹏 仝茵 《电脑知识与技术:学术版》 2019年第4期151-152,159共3页
针对遗传算法在进行海量数据搜索时,算法的收敛速度会随着数据复杂度升高和数据量的增多而变慢的问题。该文将遗传算法进行了合并优化,将合并后的算法在MapReduce架构上并行化实现。实验结果表明,改进后的遗传算法当运行在MapReduce架... 针对遗传算法在进行海量数据搜索时,算法的收敛速度会随着数据复杂度升高和数据量的增多而变慢的问题。该文将遗传算法进行了合并优化,将合并后的算法在MapReduce架构上并行化实现。实验结果表明,改进后的遗传算法当运行在MapReduce架构上时,不仅加快了收敛速度,而且提高了加速比。 展开更多
关键词 遗传算法 MAPREDUCE 收敛速度 加速
在线阅读 下载PDF
基于CUDA架构的GF4影像快速正射纠正
6
作者 肖聆元 李欣 杨博 《测绘地理信息》 2019年第1期74-78,共5页
传统串行正射纠正算法已无法满足GF4卫星影像的实时应用需求,以GPU为代表的高性能处理架构和并行算法已逐渐成为卫星数据处理的热点。本文提出一种基于CUDA架构的快速正射纠正算法,可在GPU设备上并行运算,通过实验对比分析,该方法具有... 传统串行正射纠正算法已无法满足GF4卫星影像的实时应用需求,以GPU为代表的高性能处理架构和并行算法已逐渐成为卫星数据处理的热点。本文提出一种基于CUDA架构的快速正射纠正算法,可在GPU设备上并行运算,通过实验对比分析,该方法具有较高准确性和加速比。此外,在正射纠正流程之前,本文利用DOM和DEM对GF4的RPC模型进行精化处理,以精化RPC模型作为纠正变换模型,保证了最终纠正结果的几何精度。 展开更多
关键词 GF4 GPU CUDA RPC精化 正射纠正 加速
多GPU并行可压缩流求解器及其性能分析 被引量:1
7
作者 赖剑奇 李桦 +1 位作者 张冉 常青 《航空学报》 CSCD 北大核心 2018年第9期21-30,共10页
为实现可压缩流问题的大规模高效数值求解,开展基于图形处理单元(GPU)的并行计算研究。在NVIDIA GTX 1070上建立了基于消息传递接口+统一计算设备架构(MPI+CUDA)的多GPU并行可压缩流求解器,该求解器基于结构网格有限体积法,空间... 为实现可压缩流问题的大规模高效数值求解,开展基于图形处理单元(GPU)的并行计算研究。在NVIDIA GTX 1070上建立了基于消息传递接口+统一计算设备架构(MPI+CUDA)的多GPU并行可压缩流求解器,该求解器基于结构网格有限体积法,空间离散采用AUSM+UP格式。采用一维区域分解法对计算网格进行划分,使得各GPU之间达到负载平衡。针对超声速进气道算例,对算法单GPU并行性能和多GPU可扩展性能进行分析。数值结果显示,单GPU并行计算可以获得37~46倍的加速比,极大地提高了计算效率;4块GPU并行计算加速比从47倍增加到143倍,并行效率维持在70%以上,说明并行算法具有良好的可扩展性。 展开更多
关键词 图形处理单元(GPU) 统一计算设备架构(CUDA) 并行计算 加速 并行效率
基于Hadoop平台Canopy-Kmeans聚类算法优化改进研究 预览
8
作者 周功建 《安徽广播电视大学学报》 2018年第4期117-122,128共7页
在分析Hadoop平台架构和Canopy-Kmeans聚类算法的基础上,对Canopy-Kmeans算法进行了并行化优化改进,通过统计学思维对数据分组抽样后聚类以方便并行化和降低时间复杂度,利用最小最大原则优化Canopy初始中心点选取,用数据异度均值抽样法... 在分析Hadoop平台架构和Canopy-Kmeans聚类算法的基础上,对Canopy-Kmeans算法进行了并行化优化改进,通过统计学思维对数据分组抽样后聚类以方便并行化和降低时间复杂度,利用最小最大原则优化Canopy初始中心点选取,用数据异度均值抽样法保证从原数据中均匀提取数据样本,并对Kmeans迭代计算过程进行优化.结合Hadoop平台下MapReduce框架将改进算法进行并行化设计实现.实验表明,对海量数值数据进行聚类时,改进的Canopy-Kmeans并行算法是有效的、收敛的,在聚类准确率和时效性上都有一定程度的提升. 展开更多
关键词 HADOOP MAPREDUCE 聚类分析 Kmeans算法 Canopy-Kmeans算法 加速
在线阅读 下载PDF
基于数据划分的空间分析多线程并行计算研究 预览
9
作者 曾军 张跃鹏 张德 《测绘科学与工程》 2018年第5期52-56,共5页
随着地理信息系统数据处理规模和模型复杂度的不断增大,传统的串行算法难以满足空间分析在计算效率、性能等方面的应用需求,并行空间分析作为解决目前问题的有效途径日益受到关注。本文首先介绍了串行算法并行化改造的性能评价指标和数... 随着地理信息系统数据处理规模和模型复杂度的不断增大,传统的串行算法难以满足空间分析在计算效率、性能等方面的应用需求,并行空间分析作为解决目前问题的有效途径日益受到关注。本文首先介绍了串行算法并行化改造的性能评价指标和数据划分的基本原则;然后,根据并行空间分析具有高度数据依赖性的特点,分析了矢量数据和栅格数据的数据划分策略;最后,以实例验证了基于数据划分的多线程并行计算,该计算能大幅提升数据密集型和计算密集型空间分析的效率。 展开更多
关键词 空间分析 并行计算 多线程 数据划分 加速 负载均衡
在线阅读 下载PDF
基于关键路径前瞻的工作流调度算法 预览
10
作者 孙婷 肖创柏 +1 位作者 张雅琴 徐秀杰 《北京工业大学学报》 CSCD 北大核心 2018年第8期1136-1144,共9页
为了进-步提髙工作流调度的效率,对异构环境下的工作流调度算法进行研究,提出了-种基于关键路径 前瞻算法(critical path lookahead algorithm, CPLA)的工作流调度算法.该算法在任务确定优先级阶段考虑了人口任 务到当前任务的最... 为了进-步提髙工作流调度的效率,对异构环境下的工作流调度算法进行研究,提出了-种基于关键路径 前瞻算法(critical path lookahead algorithm, CPLA)的工作流调度算法.该算法在任务确定优先级阶段考虑了人口任 务到当前任务的最长路径,以及当前任务到出口任务的最长路径;在资源选择阶段考虑了关键路径任务和非关键 路径任务对调度结果的影响.使用随机生成的和真实世界的2 种不同类型的有向无环图( directed acyclic graph, DAG)工作流来评估CPLA的性能,实验结果表明:CPLA能够有效地缩短调度长度,算法的效率、加速比、调度长度 比等性能有所提髙,并且算法的时间复杂度低于目前调度效果最好的Lookahead算法. 展开更多
关键词 静态工作流调度 关键路径 非关键路径 加速
在线阅读 下载PDF
基于Spark框架的改进并行K-means算法研究 预览 被引量:1
11
作者 邓青 杨宁 《智能计算机与应用》 2018年第1期76-78,共3页
传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确。随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究者利用Hadoop并行框架进行K-means并行化研究,虽然提高了算法的运行时间,但K-means算法在聚类判定时需要... 传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确。随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究者利用Hadoop并行框架进行K-means并行化研究,虽然提高了算法的运行时间,但K-means算法在聚类判定时需要反复迭代,反复进行磁盘的读写操作,很大一部分时间花费在磁盘操作上,并行算法的效率大打折扣。为此,本文提出基于Spark框架的改进并行K-means算法,通过对RDD的操作有效解决了频繁的磁盘读写。在标准数据集下,进行对比实验,通过聚类效果和算法并行的加速比,验证了改进算法的有效性。 展开更多
关键词 SPARK K-MEANS MAP REDUCE HADOOP 加速
在线阅读 免费下载
基于CUDA的高性能对称密码算法实现技术研究
12
作者 杨海云 张梓锌 +1 位作者 隆昆 段博坤 《网络安全技术与应用》 2018年第8期31-33,共3页
在大数据和云计算应用与日俱增的今天,很多的应用服务器面临着执行大量计算稠密的加密挑战。CUDA作为NVIDIA推出的一种并行计算平台和编程模型,能够利用现有的显卡资源,以低成本的方式提升加密性能。在NVIDIA Geforce 940M上设计并实现... 在大数据和云计算应用与日俱增的今天,很多的应用服务器面临着执行大量计算稠密的加密挑战。CUDA作为NVIDIA推出的一种并行计算平台和编程模型,能够利用现有的显卡资源,以低成本的方式提升加密性能。在NVIDIA Geforce 940M上设计并实现了并行的AES和SM4算法,与传统的CPU实现方式进行对比,AES最高可以获得92.70%的加密效率提升和13.69倍的加速比,SM4最高可以获得98.41%的加密效率提升和62.92倍的加速比。 展开更多
关键词 CUDA 并行计算 对称密码算法 加速
基于SPMD的粗粒度并行遗传算法在立体仓库路径优化中的应用 预览 被引量:1
13
作者 陈荣虎 何运杰 《软件导刊》 2018年第12期108-112,共5页
为了提高粗粒度并行遗传算法性能,缩短对立体仓库路径优化问题的求解时间,将一种单程序多数据流(简称SPMD)并行结构运用到粗粒度并行遗传算法中,并对算法进行改进。通过对自动化立体仓库拣选路径优化模型的求解,得到串行与并行计算两种... 为了提高粗粒度并行遗传算法性能,缩短对立体仓库路径优化问题的求解时间,将一种单程序多数据流(简称SPMD)并行结构运用到粗粒度并行遗传算法中,并对算法进行改进。通过对自动化立体仓库拣选路径优化模型的求解,得到串行与并行计算两种情况下的运算时间与加速比,并在求解精度相差不大的情况下,将改进算法的计算时间与遗传算法、蚁群遗传算法进行比较。对比结果表明,并行计算能有效提高算法优化效率,缩短程序执行时间。该研究对于解决自动化立体仓库堆垛拣选路径优化问题有着重要的现实意义。 展开更多
关键词 粗粒度并行遗传算法 SPMD并行结构 自动化立体仓库 并行计算 加速
在线阅读 免费下载
基于多核并行计算的无人机CFD数值模拟 预览
14
作者 姜悦宁 贾宏光 厉明 《计算机工程与应用》 CSCD 北大核心 2018年第7期221-225,238共6页
随着计算机系统向多处理器多核架构发展,针对航空工程技术高精度大规模求解问题,提出了一种高效、准确的无人机CFD(ComputationalFluidDynamics)数值模拟多核并行计算方法。对典型机翼进行了串行解法和并行解法的数值校验,验证了以... 随着计算机系统向多处理器多核架构发展,针对航空工程技术高精度大规模求解问题,提出了一种高效、准确的无人机CFD(ComputationalFluidDynamics)数值模拟多核并行计算方法。对典型机翼进行了串行解法和并行解法的数值校验,验证了以N-S(Navier-Stokes)方程为主控方程的数值求解方法的正确性。接着对比了串行计算和并行计算的时间、加速比等性能,最终获得了针对无人机整机的一种高效的并行计算方法,并对某无人机整机纵向气动特性进行了数值计算。采用FLUENT脚本记录功能,实现不同工况按编译顺序自动计算、保存数据和切换,提高了计算效率。从模块角度详细介绍了CFD串行、并行计算的工作原理,为采用并行计算的方法提供了依据。 展开更多
关键词 计算流体力学(CFD) 并行计算 气动布局 数值模拟 加速
在线阅读 下载PDF
基于TMS320C6678的粒子群算法并行设计 预览
15
作者 张庆祥 郭绪涛 王晶 《电子技术应用》 2018年第2期23-26,共4页
针对粒子群算法在实际应用中的实时性需求,对算法的并行性进行分析,并根据TMS320C6678多核处理器的架构特点,设计出局部并行全局串行的并行模型,高效地将应用程序映射到多核处理器中。实验数据表明,该设计充分发挥了TMS320C6678的性能优... 针对粒子群算法在实际应用中的实时性需求,对算法的并行性进行分析,并根据TMS320C6678多核处理器的架构特点,设计出局部并行全局串行的并行模型,高效地将应用程序映射到多核处理器中。实验数据表明,该设计充分发挥了TMS320C6678的性能优势,有效提高了系统的实时处理能力。该设计有效地推进了PSO算法在实际中的应用,对其他各种群智能算法有重要的借鉴意义。 展开更多
关键词 粒子群算法 TMS320C6678 并行处理 加速
在线阅读 下载PDF
GPU加速的中子输运稳态格子Boltzmann方法
16
作者 马宇 王亚辉 +1 位作者 彭星杰 夏榜样 《核动力工程》 CSCD 北大核心 2018年第S2期6-9,共4页
采用具有强局部特性的格子Boltzmann方法(LBM)对多维介质中的中子输运过程进行模拟。同时,为了提高LBM计算的速度,应用了图形处理器(GPU)加速技术对LBM计算过程进行了并行加速。典型中子输运问题的数值模拟结果表明,LBM能准确的模拟中... 采用具有强局部特性的格子Boltzmann方法(LBM)对多维介质中的中子输运过程进行模拟。同时,为了提高LBM计算的速度,应用了图形处理器(GPU)加速技术对LBM计算过程进行了并行加速。典型中子输运问题的数值模拟结果表明,LBM能准确的模拟中子输运问题,同时GPU加速技术能有效的提高LBM的计算效率。二者的结合能够实现中子输运问题的高效准确计算。 展开更多
关键词 中子输运 格子BOLTZMANN方法 GPU并行计算 加速
基于闪存固态硬盘内部并行机制的R-树优化方法 预览
17
作者 陈玉标 李建中 +2 位作者 李英姝 李发明 高宏 《计算机研究与发展》 CSCD 北大核心 2018年第9期2066-2082,共17页
近年来,闪存固态硬盘内部结构有了很大的改进,使得它已拥有丰富的内部并行性.R-树是一种被广泛应用于空间数据管理的索引结构.但是,基于传统机械硬盘和闪存固有特点优化的R-树索引,并没有利用固态硬盘内部并行性来提高查询和更新效率.针... 近年来,闪存固态硬盘内部结构有了很大的改进,使得它已拥有丰富的内部并行性.R-树是一种被广泛应用于空间数据管理的索引结构.但是,基于传统机械硬盘和闪存固有特点优化的R-树索引,并没有利用固态硬盘内部并行性来提高查询和更新效率.针对R-树索引,提出一种利用固态硬盘内部并行机制加速查询和更新的方法.首先,实现一种适合于固态硬盘内部并行性的异步I/O提交技术.在此基础上,针对R-树的查询和更新操作,通过聚集读写请求批量提交,以达到利用固态硬盘内部并行性加速的目的.此外,通过理论分析证明该优化方法,即使在并行通道只有4或者8时,依然可以提供1.86和2.93的期望加速比.通过真实数据在3款固态硬盘上的实验测试结果表明,利用优化策略的查询算法可实现高达3倍的稳定加速比,优化后的更新算法可达到2倍以上的加速比.无论是查询密集型或是更新密集型应用场景均有介于两者之间的加速比. 展开更多
关键词 固态硬盘 内部并行性 批量提交 R-树 加速
在线阅读 下载PDF
两种并行标牌布局优化算法对比研究 预览
18
作者 周东伟 王家润 仇建伟 《信息技术》 2018年第3期55-61,共7页
在三维地球中,已有标牌布局算法采用串行计算对标牌进行碰撞检测,无法满足大数 量三维动目标场景的实时显示要求.文中设计基于CUDA与 OpenMP的两种优化算法并行加速标 牌碰撞检测过程,对不同数量三维动目标场景下两种并行优化方法性能... 在三维地球中,已有标牌布局算法采用串行计算对标牌进行碰撞检测,无法满足大数 量三维动目标场景的实时显示要求.文中设计基于CUDA与 OpenMP的两种优化算法并行加速标 牌碰撞检测过程,对不同数量三维动目标场景下两种并行优化方法性能进行实验分析对比.实 验表明,在大数量动目标场景下,基于 CUDA的标牌碰撞检测加速比高达18. 98 ,基于 OpenMP 的标牌碰撞检测加速比近似等于CPU最大线程数. 展开更多
关键词 碰撞检测 CUDA 并行 加速 OPENMP
在线阅读 下载PDF
集群计算的多路径并发传输性能研究 预览 被引量:1
19
作者 王文鼐 黄振华 +1 位作者 吴炜 王斌 《南京邮电大学学报:自然科学版》 北大核心 2018年第6期48-53,共6页
聚合集群计算节点机的多接口用于多路径并发传输,引入多路传输控制协议(MPTCP)以提升开放消息传递接口(OpenMPI)的通信吞吐能力和并行计算性能,给出实验原型的组织结构及软硬件配置,重点分析传输路径宽带对称性与吞吐量的变化关系,以及... 聚合集群计算节点机的多接口用于多路径并发传输,引入多路传输控制协议(MPTCP)以提升开放消息传递接口(OpenMPI)的通信吞吐能力和并行计算性能,给出实验原型的组织结构及软硬件配置,重点分析传输路径宽带对称性与吞吐量的变化关系,以及不同传输控制协议栈的LIN-PACK基准测试的加速性能和单链路故障的自愈性能。结果表明,MPTCP双路并发的吞吐量较传统TCP提高89%,并行计算的最大加速比可达2.63,并具备较好的故障自愈性能。 展开更多
关键词 并发传输 并行计算 多路传输控制协议 加速 容错
在线阅读 下载PDF
基于MPI的多核并行模式的性能测试与分析 预览
20
作者 王亚茹 王鹏 王德志 《成都信息工程大学学报》 2018年第6期617-623,共7页
为了对蒙特卡洛并行程序进行有效的表达,提出一种并行计算程序流程图的表示方法,并行算法在实际应用中对效率制约的瓶颈就是进程间的通信过程。在"多计算、少通信"与"少计算、多通信"两种不同并行模式下,通过控制... 为了对蒙特卡洛并行程序进行有效的表达,提出一种并行计算程序流程图的表示方法,并行算法在实际应用中对效率制约的瓶颈就是进程间的通信过程。在"多计算、少通信"与"少计算、多通信"两种不同并行模式下,通过控制集群节点数以及节点核数来测试基于MPI实现的蒙特卡洛算法的加速比与效率,分析并行程序在多核并行模式下的计算性能。结果表明采取"计算换通信"的策略能有效地实现对算法的并行加速,提高了系统的可扩展性,为今后提升并行编程效率提供了参考,弥补了传统的串行程序流程图无法表述多进程之间信息沟通及协作的不足。 展开更多
关键词 并行算法 蒙特卡洛 加速 效率 计算换通信 并行计算程序流程图
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部 意见反馈