期刊文献+
共找到131篇文章
< 1 2 7 >
每页显示 20 50 100
GPU加速的SPH方法在溢洪道水流模拟中的应用 预览
1
作者 王巍 《人民长江》 北大核心 2019年第3期216-221,226共7页
基于拉格朗日描述的光滑粒子动力学方法(SPH)擅长于处理自由面剧烈变化的水流现象,十分适合水利工程中泄洪等问题的数值模拟。然而,SPH方法通常采用均匀分布的粒子对流体计算域进行空间离散,对于工程问题而言需要的粒子数量较多、计算... 基于拉格朗日描述的光滑粒子动力学方法(SPH)擅长于处理自由面剧烈变化的水流现象,十分适合水利工程中泄洪等问题的数值模拟。然而,SPH方法通常采用均匀分布的粒子对流体计算域进行空间离散,对于工程问题而言需要的粒子数量较多、计算量大。为了突破SPH方法在实际大规模计算中的适用范围,采用C++和CUDA混合编程的技术,借助GPU实现了对SPH方法的并行加速。通过WES三圆弧段组成的光滑溢洪道过流问题,验证了GPU加速的SPH方法的计算精度和可靠性,计算效率相对原始的SPH仿真过程提高了61.8倍。最后,将GPU加速的SPH方法应用于水利工程的溢洪道泄流问题,分别模拟了光滑溢洪道和台阶式溢洪道流动特性,通过自由面的演化过程及泄流沿程截面上的速度分布状态,对比分析了台阶对泄流现象的影响。 展开更多
关键词 光滑粒子动力学方法 GPU加速 台阶式溢洪道 消能率
在线阅读 下载PDF
高性能联盟区块链技术研究 预览
2
作者 朱立 俞欢 +2 位作者 詹士潇 邱炜伟 李启雷 《软件学报》 EI CSCD 北大核心 2019年第6期1577-1593,共17页
以上海证券交易所“去中心化的主板核心交易系统”作为业务场景,旨在研究高性能联盟区块链的优化算法.在联盟链关键技术研究的基础上,结合现有主板证券竞价交易系统的业务,提出了系统架构以及关键技术的实现.对业务逻辑与共识分离、存... 以上海证券交易所“去中心化的主板核心交易系统”作为业务场景,旨在研究高性能联盟区块链的优化算法.在联盟链关键技术研究的基础上,结合现有主板证券竞价交易系统的业务,提出了系统架构以及关键技术的实现.对业务逻辑与共识分离、存储优化和数字签名验证优化(包括合并验签和 GPU 加速)等可提高联盟链性能的优化策略进行了详细的介绍和分析.最后,通过一系列对比实验来验证优化策略的有效性.实验结果表明,这些优化手段极大地提高了去中心化的主板核心交易系统的性能. 展开更多
关键词 联盟链性能 业务逻辑与共识分离 合并验签 GPU 加速 存储优化
在线阅读 下载PDF
γ辐照装置多目标优化排源算法研究及其应用 预览
3
作者 杨磊 刘燕 +3 位作者 罗志平 李文革 周毅吉 张美琴 《原子能科学技术》 EI CAS CSCD 北大核心 2019年第5期932-938,共7页
本文介绍了新评价模型并定义了新目标函数,对求解模型所采用的模拟植物生长算法进行了改进,相关代码利用C++、CUDA编写并用GPU加速。利用两座大型γ辐照装置进行了排源实践,新剂量场分布采用不同的重铬酸银剂量计测量。结果表明:测量结... 本文介绍了新评价模型并定义了新目标函数,对求解模型所采用的模拟植物生长算法进行了改进,相关代码利用C++、CUDA编写并用GPU加速。利用两座大型γ辐照装置进行了排源实践,新剂量场分布采用不同的重铬酸银剂量计测量。结果表明:测量结果与理论计算结果符合较好,剂量不均匀度(DUR)相对偏差小于4.125%;新评价模型与原模型相比,DUR增加不明显,能量利用率提高了若干倍,计算时间从h量级缩短到min量级。检测结果验证了新方法的可行性和有效性。 展开更多
关键词 Γ辐照 优化排列 多目标优化方法 GPU加速
在线阅读 下载PDF
基于EFG法的GPU加速研究综述 预览
4
作者 吴辉 罗清海 彭文武 《教育教学论坛》 2019年第4期84-85,共2页
无网格伽辽金法(Element-Free Galerkin Method,EFG法)是无网格法(Element-Free Method,EFM)的一种,随着有限元法在解决不连续问题和结构大变形问题,例如材料的相变、材料的破坏和失效以及冲击裂纹扩展等问题遇到瓶颈,EFG法在国内外被... 无网格伽辽金法(Element-Free Galerkin Method,EFG法)是无网格法(Element-Free Method,EFM)的一种,随着有限元法在解决不连续问题和结构大变形问题,例如材料的相变、材料的破坏和失效以及冲击裂纹扩展等问题遇到瓶颈,EFG法在国内外被广泛研究与应用,大量的研究显示,EFG法在求解上述问题时具有独特的优势,但也存在计算量大的劣势,同时GPU在数据处理上优势明显,所以将GPU应用于EFG法加速一直是学术界研究的热点。 展开更多
关键词 EFG法 GPU加速 研究
在线阅读 下载PDF
基于GPU加速的水文模型参数率定 预览
5
作者 阚光远 洪阳 +3 位作者 梁珂 何晓燕 丁留谦 张大伟 《人民长江》 北大核心 2019年第5期65-69,75共6页
针对水文模型参数率定问题,为显著提升计算效率,选择 SCE-UA算法和新安江模型为研究对象,围绕SCE-UA算法并行化与程序化实现、并行 SCE-UA算法在图形处理器(GPU)上的加速效果这两个关键科学问题,以 GPU硬件平台和通用计算设备架构(CUDA... 针对水文模型参数率定问题,为显著提升计算效率,选择 SCE-UA算法和新安江模型为研究对象,围绕SCE-UA算法并行化与程序化实现、并行 SCE-UA算法在图形处理器(GPU)上的加速效果这两个关键科学问题,以 GPU硬件平台和通用计算设备架构(CUDA)软件平台为工具,采用时空复杂度分析、算法并行性挖掘、代码深度优化、数值模拟实验等多种手段相结合的方法,进行了水文模型参数率定提速研究。内容包括:①搭建基于 CUDA和 GPU的并行计算软硬件平台,进行配置与调优;②并行 SCE-UA算法及其程序化实现;③并行 SCE-UA算法在 GPU上的加速效果。研究结果表明:所提出的方法显著提升了参数率定效率,能够促进水文模拟、最优化方法、计算机科学与技术等多学科的交叉、融合与发展,对水文模拟与预报、防洪快速应急响应具有科学意义和实用价值。 展开更多
关键词 参数率定 GPU加速 CUDA 水文模型 并行计算
在线阅读 下载PDF
基于全矩阵数据的阵列超声检测与评价技术研究和应用概述 预览
6
作者 李洋 周正干 《航空制造技术》 2019年第14期28-39,共12页
全矩阵数据是阵列超声换能器以特殊的激发接收模式工作时,从被测试件内部采集到的所有超声A型信号构成的集合。基于全矩阵数据的阵列超声无损检测与评价方法采用特定算法对全矩阵数据进行后处理运算,实现被测试件内部缺陷的成像和定量... 全矩阵数据是阵列超声换能器以特殊的激发接收模式工作时,从被测试件内部采集到的所有超声A型信号构成的集合。基于全矩阵数据的阵列超声无损检测与评价方法采用特定算法对全矩阵数据进行后处理运算,实现被测试件内部缺陷的成像和定量。与基于相位控制的常规阵列超声检测技术相比,基于全矩阵数据的阵列超声检测方法具有更高的缺陷成像及定量精度,可针对具有复杂几何外形或者复杂材料属性的被测试件进行检测与评价算法的定制,是近年来阵列超声检测与评价技术的研究热点和发展方向。对基于全矩阵数据的阵列超声检测与评价技术的基本原理、典型算法、关键技术以及应用案例进行了系统概述,旨在推广该项技术和降低使用门槛,为我国高端制造领域存在的无损检测与评价难题提供新思路和新方法。 展开更多
关键词 阵列超声 无损检测与评价 全矩阵数据 全聚焦方法 GPU加速
在线阅读 免费下载
一种基于GPU的实验变差函数计算优化算法 预览
7
作者 朱家成 田善君 《计算机与数字工程》 2018年第7期1273-1278,1426共7页
在地质统计学中,有效克里格插值的第一步是得到稳健的变差函数计算结果。目前主流的变差函数研究都是集中在对实验变差函数的拟合过程,而对实验变差函数计算过程的优化却非常少。然后在实际应用中,稳健的变差函数需要对大量的数据进行... 在地质统计学中,有效克里格插值的第一步是得到稳健的变差函数计算结果。目前主流的变差函数研究都是集中在对实验变差函数的拟合过程,而对实验变差函数计算过程的优化却非常少。然后在实际应用中,稳健的变差函数需要对大量的数据进行配对计算,并进行多次调试,三维环境下,计算量则更为庞大,使用传统的方法会将克里格插值过程中大部分时间花费在实验变差函数的计算过程中。论文在实验变差函数计算过程中,采用重新搜索空间样品对,GPU并行计算的方式优化计算过程,得到基于GPU的优化算法。最后使用了不同规格的数据进行算法分析,论文优化算法有着显著的性能提高,该算法现已初步应用到武汉地大坤迪公司储量估算软件平台中。 展开更多
关键词 并行计算 实验变差函数 GPU加速
在线阅读 下载PDF
基于MobileNet的敏感图像识别系统设计 预览
8
作者 邢艳芳 卓文鑫 段红秀 《电视技术》 2018年第7期53-56,共4页
目前人工智能技术已经渗透到媒体日常生产的全部环节,研究面向内容安全的图像识别技术,对网络中的违法不良图像信息进行识别和监管,具有重要的现实意义。本设计利用深度可分离卷积神经网络和MobileNet模型,配合cDNN的GPU并行计算架构,... 目前人工智能技术已经渗透到媒体日常生产的全部环节,研究面向内容安全的图像识别技术,对网络中的违法不良图像信息进行识别和监管,具有重要的现实意义。本设计利用深度可分离卷积神经网络和MobileNet模型,配合cDNN的GPU并行计算架构,对构建的敏感图像数据集进行训练。保存训练完成的模型,对敏感图像实现较高准确度的识别。 展开更多
关键词 MobileNet模型 深度可分离卷积神经网络 GPU加速
在线阅读 下载PDF
一种基于改进粒子系统的池火灾实时渲染方法
9
作者 苏谟 郭锐锋 +3 位作者 王丽丽 王鸿亮 马元婧 赵玉彬 《小型微型计算机系统》 CSCD 北大核心 2018年第10期2303-2308,共6页
为解决池火灾模拟难以实现实时性和真实感的问题,提出一种基于改进粒子系统的池火灾实时渲染方法.首先分析了池火灾数学模型,在此基础上,建立了改进的粒子系统模型并考虑外力因素(如风速等),再通过基于GPU的粒子系统实现模型,利... 为解决池火灾模拟难以实现实时性和真实感的问题,提出一种基于改进粒子系统的池火灾实时渲染方法.首先分析了池火灾数学模型,在此基础上,建立了改进的粒子系统模型并考虑外力因素(如风速等),再通过基于GPU的粒子系统实现模型,利用GPU强大的并行计算能力对粒子状态更新加速,并使用基于自适应二叉树的剖分算法对燃液碰撞检测进行优化加速,从而实现池火灾实时渲染过程优化,使性能得到显著提高.实验结果表明,该方法实现简单,有效地降低渲染时间,显示的效果更为真实. 展开更多
关键词 粒子系统 池火灾 GPU加速 实时渲染
Canny算子检测焊缝的GPU并行加速研究 预览
10
作者 白东阳 刘健 +1 位作者 王晓曼 景文博 《长春理工大学学报:自然科学版》 2018年第5期93-96,110共5页
提出了一种基于GPU并行加速的Canny算子检测焊缝边缘的方法。焊缝边缘是焊缝图像的最主要特征,选用Canny算子可以得到较为准确的焊缝信息,然而Canny算法执行速度较慢,无法完成快速实时的检测,这极大地限制了其实用性。在前人使用Canny... 提出了一种基于GPU并行加速的Canny算子检测焊缝边缘的方法。焊缝边缘是焊缝图像的最主要特征,选用Canny算子可以得到较为准确的焊缝信息,然而Canny算法执行速度较慢,无法完成快速实时的检测,这极大地限制了其实用性。在前人使用Canny算子检测焊缝的基础上进行更深的优化和改进,首先对Canny算子检测算法进行并行化改造,再使用GPU+CPU并行化处理,在不影响边缘检测效果的前提下速度得以加快,一幅1280×960的图像边缘检测时间可以缩短到10ms以内,极大地提高了算法的实用性,为焊缝图像后续处理奠定基础。 展开更多
关键词 焊缝边缘检测 CANNY算子 GPU加速
在线阅读 下载PDF
GPU加速的中子输运稳态格子Boltzmann方法
11
作者 马宇 王亚辉 +1 位作者 彭星杰 夏榜样 《核动力工程》 CSCD 北大核心 2018年第S2期6-9,共4页
采用具有强局部特性的格子Boltzmann方法(LBM)对多维介质中的中子输运过程进行模拟。同时,为了提高LBM计算的速度,应用了图形处理器(GPU)加速技术对LBM计算过程进行了并行加速。典型中子输运问题的数值模拟结果表明,LBM能准确的模拟中... 采用具有强局部特性的格子Boltzmann方法(LBM)对多维介质中的中子输运过程进行模拟。同时,为了提高LBM计算的速度,应用了图形处理器(GPU)加速技术对LBM计算过程进行了并行加速。典型中子输运问题的数值模拟结果表明,LBM能准确的模拟中子输运问题,同时GPU加速技术能有效的提高LBM的计算效率。二者的结合能够实现中子输运问题的高效准确计算。 展开更多
关键词 中子输运 格子BOLTZMANN方法 GPU并行计算 加速比
基于动态任务调度的层次包围盒构建算法 预览
12
作者 张正昌 何发智 周毅 《计算机辅助设计与图形学学报》 CSCD 北大核心 2018年第3期491-498,共8页
交点计算是光线跟踪算法中开销最大的部分,层次包围盒(BVH)则是主流加速结构.为了提高BVH的构建速度,提出一种基于动态任务调度和warp线程优化的BVH构建算法,并针对目前主流GPU架构特点进行优化.该算法根据表面积启发式(SAH)值对BVH进... 交点计算是光线跟踪算法中开销最大的部分,层次包围盒(BVH)则是主流加速结构.为了提高BVH的构建速度,提出一种基于动态任务调度和warp线程优化的BVH构建算法,并针对目前主流GPU架构特点进行优化.该算法根据表面积启发式(SAH)值对BVH进行自底向上多轮优化;在每次循环的开始阶段判断当前线程是否空闲,若空闲,则根据记录任务进度的全局变量进行任务分配,否则,继续遍历BVH;当遍历到符合条件的节点时以该节点为幼树根节点进行幼树重构,这一阶段使用同一warp中的32个线程协同进行幼树重构,并且可以依据幼树叶子节点数调整同时处理的幼树个数.对经典的三维场景进行实验的结果表明,在BVH构建质量相同的情况下,当场景中三角元片数超过10万时,BVH构建速度会得到提升;当三角元片数大于100万时,该算法比聚类幼树重构层次包围盒(AtrBVH)算法在BVH优化阶段速度提升47%,从而使整个构建速度提高25%. 展开更多
关键词 GPU加速 动态任务调度 光线跟踪 层次包围盒
在线阅读 下载PDF
基于GPU的并行八叉树生成算法 预览
13
作者 王吉强 贾世宇 《青岛大学学报:自然科学版》 CAS 2018年第4期69-75,共7页
提出了一种新颖的完全在GPU端以并行方式构造八叉树的算法。克服了以往GPU八叉树生成算法难以构建结点间的邻接关系以及对应用领域的局限性等困难,适用于在GPU中对散乱点云数据、三角网数据以及离散数据场数据构建八叉树。该方法以紧密... 提出了一种新颖的完全在GPU端以并行方式构造八叉树的算法。克服了以往GPU八叉树生成算法难以构建结点间的邻接关系以及对应用领域的局限性等困难,适用于在GPU中对散乱点云数据、三角网数据以及离散数据场数据构建八叉树。该方法以紧密排列的方式线性存储各层八叉树结点同时避免存储空结点信息,有效节约了存储空间并且提高了逐层并行遍历八叉树的效率。与传统的CPU单线程递归分割构造八叉树的算法相比较,速度可以提高一个数量级。 展开更多
关键词 八叉树 GPU加速 并行
在线阅读 下载PDF
一种基于改进的多层法和GPU加速的透射电镜图像模拟算法和程序 预览
14
作者 明文全 陈江华 +3 位作者 牛凤姣 沈若涵 何玉涛 陈志逵 《电子显微学报》 CAS CSCD 北大核心 2018年第5期427-435,共9页
透射电镜高角环形暗场图像由于易于直观解释,已成为材料结构表征的重要手段。借助图像模拟技术对图像进行定量研究,可以获得材料中原子的三维排列和成分的信息。但由于高角环形暗场图像模拟计算量太大,其计算速度非常缓慢,限制了该技术... 透射电镜高角环形暗场图像由于易于直观解释,已成为材料结构表征的重要手段。借助图像模拟技术对图像进行定量研究,可以获得材料中原子的三维排列和成分的信息。但由于高角环形暗场图像模拟计算量太大,其计算速度非常缓慢,限制了该技术的应用。本文提出一种改进的而且可用图像处理单元加速的图像模拟算法和程序,该算法通过使用图像处理硬件单元对矩阵进行并行计算,提高了图像模拟的速度。另外,通过缩小入射电子束矩阵的大小,可以在保证计算精度的同时减小图像的计算量。研究发现使用较小的入射电子束矩阵会在会聚束电子衍射低散射角区域引入明显误差,但对高角度散射的影响较小。针对低电压(扫描)透射电镜图像模拟,本算法采用了球面传播矫正多片层法以及全矫正多片层法,从而保证了低电压电镜图像模拟的精确计算。基于该改进的图像模拟计算方法,作者发展和编制了C++语言程序。该程序拥有简单易用的操作界面,也可以作为插件在Gatan Microscopy Suit图像处理程序中调用。 展开更多
关键词 图像模拟 GPU加速 高角环形暗场像 低能电子衍射
在线阅读 下载PDF
基于非结构网格隐式算法的GPU加速研究 预览
15
作者 陈龙 徐添豪 田书玲 《计算机系统应用》 2018年第5期238-243,共6页
针对非结构网格隐式算法在GPU上的加速效果不佳的问题,通过分析GPU的架构及并行模式,研究并实现了基于非结构网格格点格式的隐式LU-SGS算法的GPU并行加速.通过采用RCM和Metis网格重排序(重组)方法,优化非结构网格的数据局部性,改善非... 针对非结构网格隐式算法在GPU上的加速效果不佳的问题,通过分析GPU的架构及并行模式,研究并实现了基于非结构网格格点格式的隐式LU-SGS算法的GPU并行加速.通过采用RCM和Metis网格重排序(重组)方法,优化非结构网格的数据局部性,改善非结构网格的隐式算法在GPU上的并行加速效果.通过三维机翼算例验证了本文实现的正确性及效率.结果表明两种网格重排序(重组)方法分别得到了63%和69%的加速效果提高.优化后的LU-SGS隐式GPU并行算法获得了相较于CPU串行算法27倍的加速比,充分说明了本文方法的高效性. 展开更多
关键词 GPU加速 并行计算 网格排序 计算流体力学 隐式格式
在线阅读 下载PDF
三维医学图像核回归算法的GPU加速研究 预览
16
作者 王玉琨 刘蓉 +1 位作者 温铁祥 李凌 《中国医学物理学杂志》 CSCD 2018年第12期1417-1425,共9页
核回归理论被广泛应用于医学图像处理和医学图像重建领域,并取得了十分显著的效果。它包括传统核回归方法(CKR)和控制核回归方法(SKR)。三维SKR算法比三维CKR算法具有更优的去噪效果和边缘保持效果,但三维SKR算法的计算量过于庞大且复杂... 核回归理论被广泛应用于医学图像处理和医学图像重建领域,并取得了十分显著的效果。它包括传统核回归方法(CKR)和控制核回归方法(SKR)。三维SKR算法比三维CKR算法具有更优的去噪效果和边缘保持效果,但三维SKR算法的计算量过于庞大且复杂,使其应用领域受到限制。目前,医学图像重建使用的是基于GPU的三维CKR算法,所以基于GPU的三维SKR算法的实现是一项有研究价值且具有挑战性的工作。本文首先优化三维SKR算法的计算过程,然后利用GPU进行CUDA编程实现三维SKR并行加速算法。实验表明,基于GPU的三维SKR算法与基于CPU单线程三维SKR算法相比能获得约244.9~246.3倍的加速比,与基于CPU多线程三维SKR算法相比能获得约123.0~137.4倍的加速比。 展开更多
关键词 GPU加速 CUDA编程 三维传统核回归方法 三维控制核回归方法
在线阅读 免费下载
基于Faster-RCNN的智能家居行人检测系统设计与实现 预览 被引量:1
17
作者 朱虹 翟超 +1 位作者 吕志 程风 《工业控制计算机》 2018年第4期68-70,共3页
行人检测是目标检测领域的重要应用,卷积神经网络(CNN)在目标识别中表现优异。设计与实现了运用Faster-RCNN算法在智能家居中的行人检测系统,并且通过GPU加速实现实时检测,该系统的基本功能有:①运用Faster-RCNN算法检测行人并保存下图... 行人检测是目标检测领域的重要应用,卷积神经网络(CNN)在目标识别中表现优异。设计与实现了运用Faster-RCNN算法在智能家居中的行人检测系统,并且通过GPU加速实现实时检测,该系统的基本功能有:①运用Faster-RCNN算法检测行人并保存下图像;②发送该图像到网络服务器;③将保存的图片推送到手机,对智能家庭的安全性提供保障。实验证明,该系统在复杂的场景中具有良好的性能,且每张图片78ms的检测时间可以满足实时性的要求。 展开更多
关键词 Faster-RCNN 智能家居 行人检测 GPU加速 实时检测图片推送
在线阅读 下载PDF
基于TSDF模型的点云孔洞修复方法 预览
18
作者 宋文龙 李双 +2 位作者 张永超 谢冰 王琢 《黑龙江大学自然科学学报》 2018年第1期102-106,共5页
深度摄像头的点云集合一般存在黑色孔洞闪烁的现象,在识别机械臂静态目标抓取时,点云集合数据的关键位置的体素不规则出现,就会对目标中心点的识别造成无法修正的偏差。因此,引入多个点云集合累积的思想,提出了一种基于TSDF模型的点云... 深度摄像头的点云集合一般存在黑色孔洞闪烁的现象,在识别机械臂静态目标抓取时,点云集合数据的关键位置的体素不规则出现,就会对目标中心点的识别造成无法修正的偏差。因此,引入多个点云集合累积的思想,提出了一种基于TSDF模型的点云孔洞修复算法。在图形处理器(Graphics Processing Unit,GPU)中构建长宽高都是512体素的截断符号距离函数(Truncated Signed Distance Function,TSDF)模型,给定深度摄像头相对于世界坐标系的初始位姿,便可以得到相机坐标系到世界坐标系的坐标变换矩阵。根据当前图像坐标点的深度值和模型体素值,动态计算权值,更新模型,经过多次迭代,从而形成稳定的点云坐标集合。实验结果表明,所提出的算法应用在机械臂静态目标抓取后,被识别目标中心点重定位精度误差在2.0 mm内,机械臂抓取目标的成功率显著提高。由于模型在GPU中构建,并不会降低计算机工作性能。所提算法在修复方面的可靠性强于常规修复算法,对于颜色复杂的物体和对于没有彩色图像的深度摄像头依然适用。 展开更多
关键词 点云孔洞 孔洞修复 TSDF模型 GPU加速
在线阅读 下载PDF
基于蒙特卡洛的医学图像重建体积计算算法GPU加速研究 预览 被引量:1
19
作者 何冬林 勾成俊 +4 位作者 文玉梅 陈昭 雷琴 杨鹏 吴章文 《中国医学物理学杂志》 CSCD 2018年第3期260-264,共5页
目的:确定基于蒙特卡洛算法计算体积的精度及提高其速度,为医学图像的应用领域快速提供可靠的数据。方法:在Fonics Plan计划系统平台上,实现基于蒙特卡洛方法的体积计算,并使用C++AMP对算法做GPU并行加速,然后对体积计算结果在精度... 目的:确定基于蒙特卡洛算法计算体积的精度及提高其速度,为医学图像的应用领域快速提供可靠的数据。方法:在Fonics Plan计划系统平台上,实现基于蒙特卡洛方法的体积计算,并使用C++AMP对算法做GPU并行加速,然后对体积计算结果在精度和速度上进行比较分析。结果:与像素累加法、体元累加法相比,蒙特卡洛算法的准确性最高但其算法用时也最长。通过充分利用计算机的显卡计算性能,可将计算速度平均提高50倍。结论:经GPU加速后的蒙特卡洛算法在计算体积的速度和精度两方面都能满足临床要求,在医学图像处理及临床诊疗具有较高的应用价值。 展开更多
关键词 蒙特卡洛算法 体积测量 C++AMP GPU加速
在线阅读 免费下载
GPU技术的最新进展及其在电力系统中的应用前景探讨(英文) 预览 被引量:2
20
作者 陈铉 阚博文 刘广一 《电力信息与通信技术》 2018年第3期16-25,共10页
随着电力电子技术的日趋成熟,以新能源为主的分布式发电正在逐步取代传统的集中发电模式。为保障电力系统安全稳定运行,智能电网中采用了新型量测设备对系统进行实时状态监测并对故障进行快速响应。与传统电网相比,由新型量测设备所产... 随着电力电子技术的日趋成熟,以新能源为主的分布式发电正在逐步取代传统的集中发电模式。为保障电力系统安全稳定运行,智能电网中采用了新型量测设备对系统进行实时状态监测并对故障进行快速响应。与传统电网相比,由新型量测设备所产生的数据量以几何级数增长。另外,随着分布式发电、储能、需求侧响应负荷以及电动汽车等可控设备的大幅增加,电力系统中决策变量的数目日益增长,拓扑关系也日益复杂,因此更强大的计算能力是未来电网需求的核心。图形处理器(GPU)的海量数据并行特性使其在高性能计算(HPC)和大数据领域中占有一席之地。该特性使得GPU在电力系统高性能计算、机器学习以及电力系统大数据分析中拥有广阔的应用前景。文章从计算架构、软件生态、经济性等方面介绍了GPU的最新进展,并对GPU技术在智能电网中的应用前景进行了探讨。 展开更多
关键词 图形处理器 智能电网 高性能计算 大数据 机器学习
在线阅读 免费下载
上一页 1 2 7 下一页 到第
使用帮助 返回顶部 意见反馈