期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向GPU计算平台的归约算法的性能优化研究 预览
1
作者 张逸然 陈龙 +1 位作者 安向哲 颜深根 《计算机科学》 CSCD 北大核心 2019年第2期306-314,共9页
归约算法在科学计算和图像处理等领域有着十分广泛的应用,是并行计算的基本算法之一,因此对归约算法进行加速具有重要意义。为了充分挖掘异构计算平台下GPU的计算能力以对归约算法进行加速,文中提出基于线程内归约、work-group内归约和w... 归约算法在科学计算和图像处理等领域有着十分广泛的应用,是并行计算的基本算法之一,因此对归约算法进行加速具有重要意义。为了充分挖掘异构计算平台下GPU的计算能力以对归约算法进行加速,文中提出基于线程内归约、work-group内归约和work-group间归约3个层面的归约优化方法,并打破以往相关工作将优化重心集中在work-group内归约上的传统思维,通过论证指出线程内归约才是归约算法的瓶颈所在。实验结果表明,在不同的数据规模下,所提归约算法与经过精心优化的OpenCV库的CPU版本相比,在AMDW8000和NVIDIATeslaK20M平台上分别达到了3.91~15.93和2.97~20.24的加速比;相比于OpenCV库的CUDA版本与OpenCL版本,在NVIDIATeslaK20M平台上分别达到了2.25~5.97和1.25~1.75的加速比;相比于OpenCL版本,在AMDW8000平台上达到了1.24~5.15的加速比。文中工作不仅实现了归约算法在GPU计算平台上的高性能,而且实现了在不同GPU计算平台间的性能可移植。 展开更多
关键词 归约算法 GPU 线程归约 OPENCL
在线阅读 免费下载
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈