期刊文献+
共找到3,487篇文章
< 1 2 175 >
每页显示 20 50 100
面向GPU计算平台的归约算法的性能优化研究
1
作者 张逸然 陈龙 +1 位作者 安向哲 颜深根 《计算机科学》 CSCD 北大核心 2019年第2期306-314,共9页
归约算法在科学计算和图像处理等领域有着十分广泛的应用,是并行计算的基本算法之一,因此对归约算法进行加速具有重要意义。为了充分挖掘异构计算平台下GPU的计算能力以对归约算法进行加速,文中提出基于线程内归约、work-group内归约和w... 归约算法在科学计算和图像处理等领域有着十分广泛的应用,是并行计算的基本算法之一,因此对归约算法进行加速具有重要意义。为了充分挖掘异构计算平台下GPU的计算能力以对归约算法进行加速,文中提出基于线程内归约、work-group内归约和work-group间归约3个层面的归约优化方法,并打破以往相关工作将优化重心集中在work-group内归约上的传统思维,通过论证指出线程内归约才是归约算法的瓶颈所在。实验结果表明,在不同的数据规模下,所提归约算法与经过精心优化的OpenCV库的CPU版本相比,在AMDW8000和NVIDIATeslaK20M平台上分别达到了3.91~15.93和2.97~20.24的加速比;相比于OpenCV库的CUDA版本与OpenCL版本,在NVIDIATeslaK20M平台上分别达到了2.25~5.97和1.25~1.75的加速比;相比于OpenCL版本,在AMDW8000平台上达到了1.24~5.15的加速比。文中工作不仅实现了归约算法在GPU计算平台上的高性能,而且实现了在不同GPU计算平台间的性能可移植。 展开更多
关键词 归约算法 GPU 线程内归约 OPENCL
在线阅读 免费下载
高维空间近邻检索的双层组合量化GPU加速算法
2
作者 邓理睿 包涵 +2 位作者 陈靓 全成斌 赵有健 《小型微型计算机系统》 CSCD 北大核心 2019年第2期390-394,共5页
在大规模视频、图像、文本检索等许多实际应用中,高维空间内海量数据的索引及近邻检索一直是难点和关键问题之一.传统的K-D树等树形索引方法在高维空间中容易陷入'维度灾难',而主流的哈希散列方法(如局部敏感哈希)空间复杂度较... 在大规模视频、图像、文本检索等许多实际应用中,高维空间内海量数据的索引及近邻检索一直是难点和关键问题之一.传统的K-D树等树形索引方法在高维空间中容易陷入'维度灾难',而主流的哈希散列方法(如局部敏感哈希)空间复杂度较高,在大规模数据下难以应用.本文总结了近年来基于向量量化的检索算法的相关研究,提出了一种基于GPU优化的高维数据近似近邻检索算法,在组合量化算法的基础上融合双层索引树结构与局部子空间最优化思想,在提高算法准确率的同时针对GPU模型优化算法,极大改善了检索性能,在单张GPU上实现了十亿量级高维数据的高效近似近邻检索. 展开更多
关键词 近似近邻检索 组合量化 GPU 高维索引
统一渲染架构GPU图形处理量化性能模型研究 预览
3
作者 马城城 田泽 +1 位作者 黎小玉 孙琳娜 《电子技术应用》 2019年第2期27-32,36共7页
统一渲染架构GPU为图形处理提供了丰富的运算、存储资源,也对软件优化提出了更高要求。为了有效地进行性能设计和优化,针对统一渲染架构实现的GPU提出一种量化的图形处理性能模型,在深入研究统一渲染架构GPU架构和工作原理基础上,分析... 统一渲染架构GPU为图形处理提供了丰富的运算、存储资源,也对软件优化提出了更高要求。为了有效地进行性能设计和优化,针对统一渲染架构实现的GPU提出一种量化的图形处理性能模型,在深入研究统一渲染架构GPU架构和工作原理基础上,分析影响图形处理的各种因素:图形指令生成、主机接口数据传输、图形指令解析、图形处理流水数据吞吐和统一染色阵列处理能力。通过仿真验证表明,在研制自主知识产权GPU过程中,采用本方法设计各部分性能指标,评估统一染色GPU图形处理性能与实测相比,误差小于7.5%。 展开更多
关键词 GPU 图形处理 统一渲染架构 性能模型
在线阅读 下载PDF
基于多线程多GPU并行加速的最小二乘逆时偏移算法 预览
4
作者 柯璇 石颖 +2 位作者 张伟 张振 何伟 《石油物探》 EI CSCD 北大核心 2019年第1期88-102,共15页
最小二乘逆时偏移算法可对地下复杂构造精确成像,但由于计算量大,目前仍难以在实际资料处理中广泛推广应用,因此研究该方法的高效计算策略具有重要意义。结合Pthread标准,提出了多线程多图形处理器(GraphicsProcessingUnit,GPU)并行加... 最小二乘逆时偏移算法可对地下复杂构造精确成像,但由于计算量大,目前仍难以在实际资料处理中广泛推广应用,因此研究该方法的高效计算策略具有重要意义。结合Pthread标准,提出了多线程多图形处理器(GraphicsProcessingUnit,GPU)并行加速策略,在共炮点道集域分解计算任务,由多GPU并行计算并实时更新数据;并结合GPU存储器优化方法,调用GPU端共享存储和寄存器等高速存储器,提高波场模拟的计算效率;最终实现了二维空间的时域最小二乘逆时偏移算法大幅加速计算。分别对Marmousi2截断模型和Marmousi模型进行加速成像测试,结果表明:基于多线程多GPU并行加速的最小二乘逆时偏移算法具有普适性;随着数据规模的增加,该方法的加速效率可逐渐逼近线性加速,数据同步延迟小,加速效率显著。 展开更多
关键词 时域最小二乘逆时偏移 GPU 多线程 Pthread 存储器优化 共享存储器 寄存器
在线阅读 下载PDF
SEGY格式地震数据的三维可视化 预览
5
作者 周文辉 石敏 +1 位作者 朱登明 王兆其 《计算机应用与软件》 北大核心 2019年第2期78-84,154共8页
地震数据三维可视化技术作为一个重要的地震解释手段,得到广泛关注。近年来随着勘探技术的进步,地震数据规模增大且结构复杂,给数据解析及数据可视化算法提出新的要求。详细介绍SEGY文件的格式,并给出地震数据的解析方法;针对三维数据... 地震数据三维可视化技术作为一个重要的地震解释手段,得到广泛关注。近年来随着勘探技术的进步,地震数据规模增大且结构复杂,给数据解析及数据可视化算法提出新的要求。详细介绍SEGY文件的格式,并给出地震数据的解析方法;针对三维数据场地震数据的性质,研究地震数据的三维可视化技术,并在GPU下优化体绘制算法,实现OSG框架下地震体模型的旋转、缩放及切片等交互方式;对多组数据进行大量的对比实验。实验结果表明,加速后的算法能够获得比较显著的性能提升。 展开更多
关键词 SEGY格式 地震数据 可视化 GPU 三维交互
在线阅读 下载PDF
基于GPU加速的粒子滤波多说话人跟踪算法及其应用 预览
6
作者 曹洁 黄开杰 王进花 《计算机应用研究》 CSCD 北大核心 2019年第3期796-800,共5页
为了解决粒子滤波多说话人跟踪过程中粒子易发散导致多目标跟踪精度低的问题,提出了并行粒子滤波和基于GPU的K-均值聚类的多声源定位方法。该方法首先分析了粒子滤波在实现多目标跟踪时进行数据关联的过程产生较大的计算量,并且出现多... 为了解决粒子滤波多说话人跟踪过程中粒子易发散导致多目标跟踪精度低的问题,提出了并行粒子滤波和基于GPU的K-均值聚类的多声源定位方法。该方法首先分析了粒子滤波在实现多目标跟踪时进行数据关联的过程产生较大的计算量,并且出现多个目标时,粒子会逐渐发散。针对计算量大和粒子发散的问题,提出了一种并行粒子滤波和K-均值聚类的方法。实验表明,随着粒子数和目标数的增加,计算量以指数增加,并且粒子发散严重,采用基于GPU的K-均值聚类方法的粒子滤波多说话人跟踪方法,相比传统粒子滤波跟踪方法具有更收敛的粒子集并且跟踪精度较高。 展开更多
关键词 GPU 粒子滤波 K-均值 多目标跟踪
在线阅读 下载PDF
面向CPU-GPU异构系统的数据分析负载均衡策略 预览
7
作者 孙婷婷 黄皓 +1 位作者 王嘉伦 翁楚良 《计算机工程与科学》 CSCD 北大核心 2019年第3期417-423,共7页
应用于高性能计算领域的通用GPU拥有强大的并行计算能力,以通用GPU作为主处理器的数据分析系统相较于传统数据库能够提供更好的性能。在大数据场景下,如何根据CPU和GPU的资源在处理器之间合理分配工作负载是亟待解决的问题。提出了一种C... 应用于高性能计算领域的通用GPU拥有强大的并行计算能力,以通用GPU作为主处理器的数据分析系统相较于传统数据库能够提供更好的性能。在大数据场景下,如何根据CPU和GPU的资源在处理器之间合理分配工作负载是亟待解决的问题。提出了一种CPU-GPU异构数据分析系统上的负载均衡处理策略。该策略采用流水线模型将工作负载分解,基于流水线设计了负载均衡模型,将工作负载合理分配至异构处理器,减少系统总执行时间开销,实现了性能提升。实验结果表明,提出的基于流水线的负载均衡模型能适应不同查询请求下的不同数据量场景,具有良好的性能。 展开更多
关键词 GPU 异构负载均衡 流水线并行 数据分析处理
在线阅读 下载PDF
基于TX1和立体相机的无人机避障系统 预览
8
作者 裘希菲 《集成电路应用》 2019年第2期41-44,共4页
提高无人机的精度和处理性能是目前研究的一个热点。提出一种新的无人机图像处理和数据分析方法,使无人机在不同环境下能探测障碍物并找到最佳的飞行方向。该方法利用立体相机拍摄两幅不同的图像,然后利用图形处理单元(GPU)进行数据分... 提高无人机的精度和处理性能是目前研究的一个热点。提出一种新的无人机图像处理和数据分析方法,使无人机在不同环境下能探测障碍物并找到最佳的飞行方向。该方法利用立体相机拍摄两幅不同的图像,然后利用图形处理单元(GPU)进行数据分析。与传统的CPU数据分析相比,可减少计算时间。该方法侧重于探测障碍物,并为无人机确定正确的飞行方向。 展开更多
关键词 无人机 立体相机 GPU 图像处理
在线阅读 下载PDF
人工智能平台在人脸识别中的应用 预览
9
作者 付光 董劲 《信息通信技术》 2019年第1期55-61,共7页
主要描述基于Docker、Kubernetes、TensorFlow、Caffe、Keras实现在GPU上进行并行计算的人工智能训练平台、识别平台、推理平台所涉及的技术和实现思路,在此技术方案的基础上如何以多租户及自服务方式按需申请资源使用人脸可视化建模服... 主要描述基于Docker、Kubernetes、TensorFlow、Caffe、Keras实现在GPU上进行并行计算的人工智能训练平台、识别平台、推理平台所涉及的技术和实现思路,在此技术方案的基础上如何以多租户及自服务方式按需申请资源使用人脸可视化建模服务、训练服务、推理服务,通过大量人脸图像及不同算法进行多次训练达到提高人脸识别的准确率的目的,最终能够在高铁、银行、无人商店等场合下开展人脸验证、人脸识别、人脸聚类等相关业务应用,提升用户体验及满意度。 展开更多
关键词 人工智能 训练平台 GPU TensorFlow 人脸识别
在线阅读 下载PDF
基于GPU加速的冲击滤波图像风格化绘制算法 预览
10
作者 赵杨 《电子测试》 2019年第3期74-75,87共3页
本文提出基于结构张量引导的冲击滤波处理的图像抽象化绘制算法。算法以图像结构张量的特征向量值作为导向向量,对输入图像进行冲击滤波,从而获得具有结构张量场方向特征的风格化图像;本文同时提出运用GPU的并行计算能力,实现对输入图... 本文提出基于结构张量引导的冲击滤波处理的图像抽象化绘制算法。算法以图像结构张量的特征向量值作为导向向量,对输入图像进行冲击滤波,从而获得具有结构张量场方向特征的风格化图像;本文同时提出运用GPU的并行计算能力,实现对输入图像及视频的具有类梵高流线风格的实时渲染及绘制。实验结果表明,该技术能有效生成具有类梵高流线风格的抽象化图像。 展开更多
关键词 非真实感绘制 GPU 结构张量 冲击滤波 梵高风格
在线阅读 下载PDF
Power Consumption Optimization for 3D Graphics Rendering
11
作者 Lidong Xing Tao Li +1 位作者 Hucai Huang Jungang Han 《哈尔滨工业大学学报:英文版》 EI CAS 2019年第1期42-50,共9页
This paper studies some programming techniques for low power rendering for 3D graphics. These techniques are derived from analysis and simulation results of hardware circuits of GPU. Although low power 3D graphics har... This paper studies some programming techniques for low power rendering for 3D graphics. These techniques are derived from analysis and simulation results of hardware circuits of GPU. Although low power 3D graphics hardware design has been studied by other researchers, low power programming techniques from hardware perspective have not been investigated in depth. There are many factors that affect 3D graphics rendering performance, such as the number of vertices, vertex sharing, level of details, texture mapping, and rendering algorithms. An analytical study of graphics rendering workload is performed and the effect of a number of programming tips such as vertex sharing, clock gating and buffering of unmoving or translational objects is deeply studied. The results presented in this paper can be used to guide 3D graphics programming for optimizing both power consumption and performance. 展开更多
关键词 GPU 3D GRAPHICS RENDERING low power WORKLOAD VERTEX SHARING GRAPHICS PROGRAMMING
在线阅读 免费下载
一种面向OpenCL架构的矩阵-向量乘并行算法与实现
12
作者 肖汉 周清雷 姚鹏姿 《小型微型计算机系统》 CSCD 北大核心 2019年第1期26-30,共5页
矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的... 矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的并行度,每个工作组进行矩阵中的行块与列向量的乘积,每个工作项进行行块中行向量与列向量的乘积,并把计算任务分别分配到计算单元和处理单元进行处理.实验结果表明,与基于CPU的串行算法、基于OpenMP并行算法和基于统一计算设备架构(Compute Unified Device Architecture,CUDA)并行算法性能相比,矩阵-向量乘并行算法在OpenCL架构下NVIDIA图形处理器(Graphic Processing Unit,GPU)计算平台上分别获得了20. 86倍、6. 39倍和1. 49倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性. 展开更多
关键词 矩阵-向量乘 图形处理器 开放式计算语言 并行算法
CUDA下地质图像边缘检测算法并行优化 预览
13
作者 张晗 钱育蓉 侯海耀 《计算机工程与设计》 北大核心 2019年第3期691-698,共8页
为提高地质图像边缘检测Prewitt算法计算速度,结合算法计算密集和数据密集的特点,从核函数计算层面,提出基于调整线程块坐标优化线程发散方法和采用本地变量访存优化指令延迟设计思想;从CPU-GPU数据传输开销层面,提出基于CUDA流优化数... 为提高地质图像边缘检测Prewitt算法计算速度,结合算法计算密集和数据密集的特点,从核函数计算层面,提出基于调整线程块坐标优化线程发散方法和采用本地变量访存优化指令延迟设计思想;从CPU-GPU数据传输开销层面,提出基于CUDA流优化数据传输开销方法。经测试,当设置线程块规模为32*32、采用独立的局部变量替代索引访存和使用CUDA工作流分块计算时,对大于6168*6168尺寸的地质图像加速比可提高120倍以上。该并行优化方案易于实现,可应用于大规模地质图像边缘检测领域。 展开更多
关键词 边缘检测 PREWITT算子 并行计算 图形处理器 统一计算设备架构
在线阅读 下载PDF
基于GPU的降雨天气实时仿真
14
作者 潘泽云 丁利琼 程鹏 《现代计算机》 2019年第7期67-70,共4页
尝试一种基于GPU的粒子系统的方法对降雨天气进行实时绘制仿真,引入真实世界中雨点的受力情况和运动情况,并将光源及视点位置作为可控变量,以此保证场景真实性及复用性。该方法在雨点粒子的速度、位置方面需要大量计算,为保证实时性,将... 尝试一种基于GPU的粒子系统的方法对降雨天气进行实时绘制仿真,引入真实世界中雨点的受力情况和运动情况,并将光源及视点位置作为可控变量,以此保证场景真实性及复用性。该方法在雨点粒子的速度、位置方面需要大量计算,为保证实时性,将包含在不同光源、视点位置情况下的雨点图片数据库存于二维纹理数组,合理利用GPU强大的图形处理能力。试验证明,降雨天气真实度高、可复用性强、实时性好。 展开更多
关键词 粒子系统 受力模型 运动模型 实时渲染 图形处理器
在线阅读 免费下载
PowerVR虚拟化和Series8XT为汽车行业带来变革 预览
15
作者 Imagination公司 《中国集成电路》 2019年第1期86-89,共4页
过去的几年里,虚拟化的概念———将软件从承载其的硬件中分离出来———已经为许多人所熟知。在本文中,我们将描述虚拟化是什么,看看它在PowerVR GPU 中是如何工作的,并解释它是如何给各种市场(尤其是汽车行业)带来巨大的利益。
关键词 汽车行业 虚拟化 GPU 硬件 软件
在线阅读 下载PDF
基于细分着色的飞行仿真地形建模方法 预览
16
作者 宋歌 潘卫军 季玉龙 《工程科学与技术》 EI CAS CSCD 北大核心 2019年第1期197-204,共8页
针对飞行仿真中大地形数据量大、细节丰富导致的渲染负载重、帧率不稳定问题,提出一种基于细分着色的地形建模方法。该方法以几何裁剪图为框架构建视点相关的多分辨率地形结构。首先,在CPU中生成若干个细分控制点并存入顶点缓存。每层... 针对飞行仿真中大地形数据量大、细节丰富导致的渲染负载重、帧率不稳定问题,提出一种基于细分着色的地形建模方法。该方法以几何裁剪图为框架构建视点相关的多分辨率地形结构。首先,在CPU中生成若干个细分控制点并存入顶点缓存。每层几何裁剪图根据顶点缓存中的细分控制点在索引缓存中生成能够表示几何裁剪图结构框架和状态的索引点,经CPU传至GPU。其次,在GPU读取索引点后通过细分着色器生成自适应三角形面片。在渲染循环的更新阶段,仅需对几何裁剪图的变化区域进行索引点替换,可完成几何裁剪图的状态切换。最后,按照自内向外的顺序,依次对每层(最内层除外)几何裁剪图的内侧边(与下一层的共享边)进行增加细分着色控制点的操作,从而增加内侧边三角形面片,使其与内层几何裁剪图相对应,消除几何裁剪图相邻层次间因分辨率不同引起的"裂缝"现象。实验证明,该方法能充分利用显卡硬件的最新特性,在实时渲染中减少CPU向GPU传输的顶点数量,使渲染负载相对平衡,提升渲染效率和地形实时漫游的帧率稳定性,并提供一种简单有效的"裂缝"消除方法,在保证大地形细节真实程度的同时,满足飞行仿真中对大地形绘制实时性与稳定性的要求。 展开更多
关键词 飞行仿真 细分着色 几何裁剪图 图形处理器 地形建模
在线阅读 下载PDF
年度收官之作荣耀V20 预览
17
作者 陈思霖(文/图) 《微型计算机》 2019年第4期18-22,共5页
今年一整年,荣耀都不断地用“吓人的技术”冲击着消费者的眼球,从GPU Turbo到CPU Turbo,再从蝶式五轨滑盖设计到THE NINE液冷散热技术,黑科技似乎成为每次说起荣耀手机就不得不提的一个词。2018无疑是荣耀手机表现出色的一年,而作为201... 今年一整年,荣耀都不断地用“吓人的技术”冲击着消费者的眼球,从GPU Turbo到CPU Turbo,再从蝶式五轨滑盖设计到THE NINE液冷散热技术,黑科技似乎成为每次说起荣耀手机就不得不提的一个词。2018无疑是荣耀手机表现出色的一年,而作为2018年年末发布的旗舰手机,荣耀V20又会带来哪些新“科技”呢? 展开更多
关键词 散热技术 滑盖设计 消费者 GPU CPU 手机 科技
在线阅读 下载PDF
实景虚拟技术在实验场馆建设中的应用分析 预览
18
作者 侯国栋 《科技与创新》 2019年第5期160-160,I0002共2页
实验场馆既是提高教学质量的保证也是体现办学水平的标志,是高校建设的重点领域。在实验场馆数字化建设中,实现数字虚拟是其中一个方向。主要研究了实景虚拟漫游技术在实验场馆中的应用,结合场馆特征分析了实景虚拟漫游建设的总目标和... 实验场馆既是提高教学质量的保证也是体现办学水平的标志,是高校建设的重点领域。在实验场馆数字化建设中,实现数字虚拟是其中一个方向。主要研究了实景虚拟漫游技术在实验场馆中的应用,结合场馆特征分析了实景虚拟漫游建设的总目标和实现方法。 展开更多
关键词 实验场馆 实景 虚拟现实 GPU
在线阅读 下载PDF
CPU与GPU的计算性能对比 预览
19
作者 韩菲 李炜 《电子技术与软件工程》 2019年第1期125-126,共2页
本文首先对CPU与GPU的硬件架构进行简单介绍,其次采用CPU串行计算地球物理中反射点旅行时,再次采用GPU与CPU协同异构的方式,CUDA编程语言同样计算相同反射点旅行时,对比分析两种核处理器的计算速度,得出在计算10000个反射点旅行时时,GP... 本文首先对CPU与GPU的硬件架构进行简单介绍,其次采用CPU串行计算地球物理中反射点旅行时,再次采用GPU与CPU协同异构的方式,CUDA编程语言同样计算相同反射点旅行时,对比分析两种核处理器的计算速度,得出在计算10000个反射点旅行时时,GPU的计算效率比CPU高14倍。 展开更多
关键词 GPU 并行计算 计算效率 高性能计算
在线阅读 下载PDF
新图形、新AI解析Imagination新一代GPU及神经网络加速器 预览
20
作者 张平(文/图) 《微型计算机》 2019年第1期89-92,共4页
Imagination是图形业界的老玩家了。说起来最近一次Imagination受到从行业到终端用户的关注,还是苹果宣布全面使用自研GPU架构,放弃使用Imagination授权的消息被爆出的时候,彼时Imagination的股票暴跌,大家都对这家企业的未来发展表示... Imagination是图形业界的老玩家了。说起来最近一次Imagination受到从行业到终端用户的关注,还是苹果宣布全面使用自研GPU架构,放弃使用Imagination授权的消息被爆出的时候,彼时Imagination的股票暴跌,大家都对这家企业的未来发展表示担忧。不过在经过一些财务运作之后,Imagination找好了新东家,又继续在产业道路上努力。这一次,Imagination带来的是全新第九代PowerVR的高端产品系列GPU和第三代神经网络加速器。 展开更多
关键词 网络加速器 GPU 图形 神经 解析 AI 终端用户 第三代
在线阅读 下载PDF
上一页 1 2 175 下一页 到第
使用帮助 返回顶部 意见反馈