期刊文献+
共找到1,085篇文章
< 1 2 55 >
每页显示 20 50 100
基于GPU加速的恶意代码字节码特征提取方法研究 预览
1
作者 周紫瞻 王俊峰 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第2期227-234,共8页
随着恶意代码的数量和种类增长,快速有效地检测恶意代码显得十分有必要,其中关键技术就是恶意代码特征提取.针对现有恶意代码字节码序列特征提取速度的不足,提出了一种GPU加速提取恶意代码字节码序列特征的方法.使用目前比较成熟的统一... 随着恶意代码的数量和种类增长,快速有效地检测恶意代码显得十分有必要,其中关键技术就是恶意代码特征提取.针对现有恶意代码字节码序列特征提取速度的不足,提出了一种GPU加速提取恶意代码字节码序列特征的方法.使用目前比较成熟的统一计算设备架构CUDA,将传统恶意代码字节码序列特征提取方法中字节码N-Gram特征的提取、TFIDF特征的计算等密集计算型任务移交给GPU进行并行计算.实验表明,针对不同样本文件大小的数据集,该方法均有2~4倍以上的速度提升,大幅提高恶意代码字节码序列特征提取的速度. 展开更多
关键词 恶意代码 特征提取 CUDA 字节码序列 N-GRAM
在线阅读 免费下载
基于PMVS算法的大规模数据细粒度并行优化方法
2
作者 刘金硕 李扬眉 +3 位作者 江庄毅 邓娟 眭海刚 PanJeff 《武汉大学学报:信息科学版》 EI CSCD 北大核心 2019年第4期608-616,共9页
三维多视角立体视觉算法(patch-based multi-view stereo, PMVS)以其良好的三维重建效果广泛应用于数字城市等领域,但用于大规模计算时算法的执行效率低下。针对此,提出了一种细粒度并行优化方法,从任务划分和负载均衡、主系统存储和GP... 三维多视角立体视觉算法(patch-based multi-view stereo, PMVS)以其良好的三维重建效果广泛应用于数字城市等领域,但用于大规模计算时算法的执行效率低下。针对此,提出了一种细粒度并行优化方法,从任务划分和负载均衡、主系统存储和GPU存储、通信开销等3方面加以优化;同时,设计了基于面片的PMVS算法特征提取的GPU和多线程并行改造方法,实现了CPUs_GPUs多粒度协同并行。实验结果表明,基于CPU多线程策略能实现4倍加速比,基于统一计算设备架构(compute unified device architecture, CUDA)并行策略能实现最高34倍加速比,而提出的策略在CUDA并行策略的基础上实现了30%的性能提升,可以用于其他领域大数据处理中快速调度计算资源。 展开更多
关键词 CPUs_GPUs多粒度并行 GPU并行优化 CUDA 负载均衡 存储与通信优化 图像处理
天气雷达体扫数据的GPU并行处理 预览
3
作者 谢千里 林光 朱伟伟 《装备制造技术》 2019年第6期156-159,共4页
介绍了一种利用GPU的并行运算能力对单部天气雷达强度回波体扫数据进行三维栅格化处理,大大提高了处理速度,减轻CPU的运算压力,使多部天气雷达数据解析和拼图处理速度得到极大提高。
关键词 天气雷达 GPU CUDA 栅格化
在线阅读 下载PDF
基于CUDA和布谷鸟算法的SVM在工控入侵检测中的应用 预览
4
作者 陈汉宇 王华忠 颜秉勇 《华东理工大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期101-109,共9页
为了提升SVM算法的分类速度和精度,提出了一种基于CUDA和布谷鸟搜索算法(CSA)的CCS-SVM(CUDA and Cuckoo Search based Support Vector Machine)算法。考虑到SVM算法在大规模数据下训练速度慢的缺点,利用基于CUDA的并行技术对SVM进行并... 为了提升SVM算法的分类速度和精度,提出了一种基于CUDA和布谷鸟搜索算法(CSA)的CCS-SVM(CUDA and Cuckoo Search based Support Vector Machine)算法。考虑到SVM算法在大规模数据下训练速度慢的缺点,利用基于CUDA的并行技术对SVM进行并行化。针对布谷鸟搜索算法寻优精度低和收敛速度慢的问题,提出了两点改进:第一,考虑了寻优过程中个体适应度对莱维飞行步长因子α的影响;第二,在偏好随机游动环节引入惯性权重。最后利用CCS-SVM算法对工控网络标准数据集进行入侵检测仿真实验,结果表明:该算法在保证入侵检测准确率的同时,检测速度提升了近3倍。 展开更多
关键词 布谷鸟搜索算法 CUDA 支持向量机 工业控制系统 入侵检测
在线阅读 下载PDF
基于CUDA架构的有向距离函数三维重建 预览
5
作者 杨科 张之江 《工业控制计算机》 2019年第7期90-91,94共3页
为了解决三维重建中运算复杂、计算量大导致的重建实时性较低的问题,通过对有向距离函数三维重建算法进行并行性研究,设计出一种基于CUDA框架的并行处理算法。采用“共享内存”、“两次归约”求和等策略在GPU上进行并行加速。实验结果表... 为了解决三维重建中运算复杂、计算量大导致的重建实时性较低的问题,通过对有向距离函数三维重建算法进行并行性研究,设计出一种基于CUDA框架的并行处理算法。采用“共享内存”、“两次归约”求和等策略在GPU上进行并行加速。实验结果表明,并行的算法相比于串行算法具有明显的加速效果,位姿估计部分最高加速比为17.88倍,可以稳定、实时地进行物体或场景的三维重建。 展开更多
关键词 CUDA 有向距离函数(SDF) 共享内存 两次归约
在线阅读 下载PDF
GPU并行计算在FD-OCT成像中加速插值计算的应用 预览
6
作者 易俊 秦晓萌 +4 位作者 岑颖珊 刘碧旺 韩定安 王茗祎 周月霞 《仪器仪表用户》 2019年第9期40-44,共5页
FD-OCT(频域光学相干层析成像技术)成像中需要对相机采集到的光谱信号进行插值从而获得干涉信号,插值计算是FD-OCT成像重建的重要步骤,占据了三分之二的计算时间.因而如何加快插值计算的速度,是FD-OCT实时成像的主要问题.本文将基于GPU... FD-OCT(频域光学相干层析成像技术)成像中需要对相机采集到的光谱信号进行插值从而获得干涉信号,插值计算是FD-OCT成像重建的重要步骤,占据了三分之二的计算时间.因而如何加快插值计算的速度,是FD-OCT实时成像的主要问题.本文将基于GPU的CUDA语言引入FD-OCT系统成像的三次样条插值的计算过程中,把整个插值的计算过程并行化,并对其进行优化.从实验结果中可以看出,执行相同的数据处理任务,将GPU作为主要并行计算处理器,与传统基于CPU平台的串行计算模式比较,速度有大幅度的提高,可实现每秒52帧的实时成像. 展开更多
关键词 GPU CUDA FD-OCT 三次样条插值
在线阅读 下载PDF
基于GPU加速的水文模型参数率定 预览
7
作者 阚光远 洪阳 +3 位作者 梁珂 何晓燕 丁留谦 张大伟 《人民长江》 北大核心 2019年第5期65-69,75共6页
针对水文模型参数率定问题,为显著提升计算效率,选择 SCE-UA算法和新安江模型为研究对象,围绕SCE-UA算法并行化与程序化实现、并行 SCE-UA算法在图形处理器(GPU)上的加速效果这两个关键科学问题,以 GPU硬件平台和通用计算设备架构(CUDA... 针对水文模型参数率定问题,为显著提升计算效率,选择 SCE-UA算法和新安江模型为研究对象,围绕SCE-UA算法并行化与程序化实现、并行 SCE-UA算法在图形处理器(GPU)上的加速效果这两个关键科学问题,以 GPU硬件平台和通用计算设备架构(CUDA)软件平台为工具,采用时空复杂度分析、算法并行性挖掘、代码深度优化、数值模拟实验等多种手段相结合的方法,进行了水文模型参数率定提速研究。内容包括:①搭建基于 CUDA和 GPU的并行计算软硬件平台,进行配置与调优;②并行 SCE-UA算法及其程序化实现;③并行 SCE-UA算法在 GPU上的加速效果。研究结果表明:所提出的方法显著提升了参数率定效率,能够促进水文模拟、最优化方法、计算机科学与技术等多学科的交叉、融合与发展,对水文模拟与预报、防洪快速应急响应具有科学意义和实用价值。 展开更多
关键词 参数率定 GPU加速 CUDA 水文模型 并行计算
在线阅读 下载PDF
基于CUDA的KNN算法并行化研究
8
作者 刘端阳 郑江帆 刘志 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1197-1202,共6页
KNN分类算法在面对大规模数据集时,计算时间将随着数据集的增大而成倍增长,为了提升算法的运算性能,设计了一种基于CUDA模型的并行KNN算法,即GS_KNN算法.针对KNN算法进行了并行化分析,在距离计算阶段采用通用矩阵乘加速,提高了计算速度... KNN分类算法在面对大规模数据集时,计算时间将随着数据集的增大而成倍增长,为了提升算法的运算性能,设计了一种基于CUDA模型的并行KNN算法,即GS_KNN算法.针对KNN算法进行了并行化分析,在距离计算阶段采用通用矩阵乘加速,提高了计算速度;在距离排序阶段根据k值的大小提出两种策略,分别是基于k次最小值查找的最近邻选择和基于双调排序的最近邻选择;在决定分类标号阶段采用CUDA内部的原子加法操作,从而提高整体性能.使用KDDCUP99数据集对改进算法进行实验,结果表明,在保证实验结果准确性的情况下,改进算法提高了计算速度,与经典的BF-CUDA算法相比加速比达到2. 8倍. 展开更多
关键词 KNN CUDA 并行计算 大数据
N3LDG:一种轻量级自然语言处理深度学习库 预览
9
作者 王潜升 余南 +2 位作者 张梅山 韩子嘉 付国宏 《北京大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期113-119,共7页
提出一种用于自然语言处理的轻量级深度学习库N3LDG,可以支持动态地构建计算图,并能自动地批量化执行计算图。实验显示,当训练卷积神经网络、双向LSTM和树结构LSTM时,N3LDG都能高效地构建与执行计算图;当使用CPU训练上述模型时,N3LDG的... 提出一种用于自然语言处理的轻量级深度学习库N3LDG,可以支持动态地构建计算图,并能自动地批量化执行计算图。实验显示,当训练卷积神经网络、双向LSTM和树结构LSTM时,N3LDG都能高效地构建与执行计算图;当使用CPU训练上述模型时,N3LDG的训练速度优于PyTorch;当使用GPU训练卷积神经网络和树结构LSTM模型时,N3LDG的训练速度优于PyTorch。 展开更多
关键词 深度学习库 自然语言处理 轻量级 CUDA
在线阅读 免费下载
基于CUDA架构的GF4影像快速正射纠正
10
作者 肖聆元 李欣 杨博 《测绘地理信息》 2019年第1期74-78,共5页
传统串行正射纠正算法已无法满足GF4卫星影像的实时应用需求,以GPU为代表的高性能处理架构和并行算法已逐渐成为卫星数据处理的热点。本文提出一种基于CUDA架构的快速正射纠正算法,可在GPU设备上并行运算,通过实验对比分析,该方法具有... 传统串行正射纠正算法已无法满足GF4卫星影像的实时应用需求,以GPU为代表的高性能处理架构和并行算法已逐渐成为卫星数据处理的热点。本文提出一种基于CUDA架构的快速正射纠正算法,可在GPU设备上并行运算,通过实验对比分析,该方法具有较高准确性和加速比。此外,在正射纠正流程之前,本文利用DOM和DEM对GF4的RPC模型进行精化处理,以精化RPC模型作为纠正变换模型,保证了最终纠正结果的几何精度。 展开更多
关键词 GF4 GPU CUDA RPC精化 正射纠正 加速比
天空区域分割的图像去雾及CUDA并行实现
11
作者 曾浩洋 张红英 《小型微型计算机系统》 CSCD 北大核心 2019年第3期655-659,共5页
针对暗原色先验去雾算法对大面积天空区域处理不理想等问题,提出了一种基于天空区域分割的图像去雾算法.该算法首先使用最大类间方差法(Otsu)求得阈值将天空与非天空区域分割开,然后再对天空区域求大气光值A,作为整幅雾天图像的大气光值... 针对暗原色先验去雾算法对大面积天空区域处理不理想等问题,提出了一种基于天空区域分割的图像去雾算法.该算法首先使用最大类间方差法(Otsu)求得阈值将天空与非天空区域分割开,然后再对天空区域求大气光值A,作为整幅雾天图像的大气光值,进而精细化透射率,得到较好的复原效果.为了提高去雾效率,基于CUDA(Common Unified Device Architecture)并行编程算法,通过GPU并行处理和CPU任务调度的协同,在保证去雾效果的同时快速去雾.实验结果表明,该方法能很好的解决天空区域去雾出现的光晕和色彩失真现象.优化后的并行算法,针对高清图像基本上达到了实时去雾的效果. 展开更多
关键词 图像去雾 暗原色先验 OTSU CUDA GPU 并行
一种基于异构集群的在线密码破解系统 预览
12
作者 刘成 罗杰 臧今宇 《通信技术》 2019年第8期1992-1997,共6页
市面上的密码破解软件多为单机版,需要用户安装、设置软件,使用成本较高;或需要用户自行搭建服务器或机房,物理系统的建设和维护成本很高。为了解决上述问题,提出了一种基于异构集群的在线密码破解系统。该系统基于B/S架构,通过WEB页面... 市面上的密码破解软件多为单机版,需要用户安装、设置软件,使用成本较高;或需要用户自行搭建服务器或机房,物理系统的建设和维护成本很高。为了解决上述问题,提出了一种基于异构集群的在线密码破解系统。该系统基于B/S架构,通过WEB页面提供在线破解能力,易于使用;基于PBS系统,实现了多种密码破解所需的调度模式;设计了GPU代理程序,弥补了PBS系统的不足;基于CUDA的GPGPU异构计算集群,实现了数百倍的性能提升。 展开更多
关键词 集群系统 在线密码破解 GPU PBS CUDA
在线阅读 下载PDF
ARL中Gridding算法的并行化实现 预览
13
作者 吴怀广 刘琳琳 +2 位作者 石永生 李代祎 谢鹏杰 《轻工学报》 CAS 2019年第2期82-87,共6页
针对海量天文数据实时性处理效率低的问题,通过对SKA图像采集及成像ARL算法库中耗时较长的Gridding算法进行耗时分析,找出了该算法中调用频率高且运行时间长的两个函数convolutional-grid和convolutional-degrid,利用GPU的多线程并行化... 针对海量天文数据实时性处理效率低的问题,通过对SKA图像采集及成像ARL算法库中耗时较长的Gridding算法进行耗时分析,找出了该算法中调用频率高且运行时间长的两个函数convolutional-grid和convolutional-degrid,利用GPU的多线程并行化处理降低两个函数的循环迭代,实现了Gridding算法在GPU和CPU上的协同运行.验证实验结果表明,在相同的数据量下,改进后的Gridding算法运行时间大大缩短,特别是在处理海量数据时,有效提高了ARL的整体运行效率. 展开更多
关键词 ARL 并行化算法 Gridding算法 CUDA
在线阅读 免费下载
ARL中Clean算法的并行化研究 预览
14
作者 刘慧慧 闻萌莎 +3 位作者 钱慎一 吴怀广 张伟伟 李代祎 《轻工学报》 CAS 2019年第2期88-94,共7页
针对SKA算法参考库ARL中的去卷积算法运行效率低、无法满足海量数据实时处理的问题,提出了CPU和GPU协同工作模式下的并行化Clean算法.该方法将Clean算法中可以并行计算的步骤利用多线程在GPU上并行执行,将无法并行计算的步骤在CPU上串... 针对SKA算法参考库ARL中的去卷积算法运行效率低、无法满足海量数据实时处理的问题,提出了CPU和GPU协同工作模式下的并行化Clean算法.该方法将Clean算法中可以并行计算的步骤利用多线程在GPU上并行执行,将无法并行计算的步骤在CPU上串行执行.验证实验结果表明,在数据逐渐增大的过程中,并行化Clean算法比在CPU上的串行处理运行时间显著减少,当图达到4096像素×4096像素时,可以有10倍的提速.这说明并行化Clean算法在处理海量数据时,能够显著提高运算效率. 展开更多
关键词 ARL 去卷积算法 CUDA 并行计算 CLEAN算法
在线阅读 免费下载
层析法计算三维物体全息图的并行加速研究 预览
15
作者 肖波 郑华东 +2 位作者 刘柯健 李飞 高智方 《应用光学》 CAS CSCD 北大核心 2019年第4期620-626,共7页
随着计算空间光调制器的分辨率的尺寸逐渐变大,全息图三维动态显示的计算量也越来越大,使得对全息计算速度提出了新的要求。利用GPU并行计算处理的方式实现全息图的快速层析法计算,该方法利用GPU并行多线程和层析法中的图像二维傅里叶... 随着计算空间光调制器的分辨率的尺寸逐渐变大,全息图三维动态显示的计算量也越来越大,使得对全息计算速度提出了新的要求。利用GPU并行计算处理的方式实现全息图的快速层析法计算,该方法利用GPU并行多线程和层析法中的图像二维傅里叶变换的优势对菲涅尔衍射变换算法加速计算;同时通过对GPU底层资源的调用和对CUDA中程序的流处理过程,有效减少中间的延时等待。通过对计算速度对比分析表明:与在CPU上运算相比,计算速度大幅提升,基于GPU并行计算的方法比基于CPU计算的方法速度快10倍左右。 展开更多
关键词 计算全息 GPU CUDA 层析法 优化
在线阅读 下载PDF
基于CUDA并行化的K-Means聚类算法优化 预览
16
作者 丁芙蓉 张功萱 《计算机与数字工程》 2019年第7期1662-1666,共5页
论文分析了基于CUDA并行化的K-means聚类算法在CPU和GPU上的执行特征,提出了一种基于CPU/GPU异步计算模式的并行优化方法。该方法将聚类的各步骤映射到CPU和GPU上,通过异步执行方式使CPU和GPU的计算重叠,对聚类过程进一步并行化,提高了... 论文分析了基于CUDA并行化的K-means聚类算法在CPU和GPU上的执行特征,提出了一种基于CPU/GPU异步计算模式的并行优化方法。该方法将聚类的各步骤映射到CPU和GPU上,通过异步执行方式使CPU和GPU的计算重叠,对聚类过程进一步并行化,提高了程序运行效率。最后,在多核CPU和GPU异构平台上对UCI数据集和人工合成的数据集进行实验,结果表明,论文提出的优化方法比经典的基于CUDA并行化的K-Means聚类算法性能有所提升。 展开更多
关键词 CUDA 多核 聚类算法 异构计算
在线阅读 下载PDF
利用数据并行对程序进行优化的一般方法探析 预览
17
作者 谢玉枚 卓琳 张洁玲 《信息系统工程》 2019年第3期14-16,共3页
随着现代科学计算数据量的倍增,对计算性能的要求越来越高,基于数据并行的优化技术在很多应用场景中都取得了非常好的效果。论文给出对工程进行数据并行优化的一般步骤,深入研究使用CUDA进行数据并行优化的特点,给出几种典型优化方法的... 随着现代科学计算数据量的倍增,对计算性能的要求越来越高,基于数据并行的优化技术在很多应用场景中都取得了非常好的效果。论文给出对工程进行数据并行优化的一般步骤,深入研究使用CUDA进行数据并行优化的特点,给出几种典型优化方法的优化效果,根据优化效果及优化策略的使用范围进行分级,给出CUDA架构下对工程逐步优化的一般方法。 展开更多
关键词 GPU CUDA 数据并行 优化策略
在线阅读 下载PDF
基于嵌入式平台双目测量的CUDA优化 预览
18
作者 尚裕之 韩军 +1 位作者 陈方杰 王祖武 《计算机工程与设计》 北大核心 2019年第3期667-671,共5页
为提高双目测量算法运算的速度,提出一种包括减少搬移、增大并行度和异步工作的方法来进行优化。基于快速双边滤波算法(fast bilateral stereo matching),它的匹配精度接近于全局匹配算法。对于标准测试样本,实现的方法在NVDIATX1开发... 为提高双目测量算法运算的速度,提出一种包括减少搬移、增大并行度和异步工作的方法来进行优化。基于快速双边滤波算法(fast bilateral stereo matching),它的匹配精度接近于全局匹配算法。对于标准测试样本,实现的方法在NVDIATX1开发板上计算得到视差图所需要的时间更短,相比原来的CPU计算方法,代价聚合的效率有80倍的提升。实时双目测量方法为在嵌入式平台获取高质量双目视觉深度信息提供了有效、可靠的途径。 展开更多
关键词 无人机 实时性 双目测量 统一计算设备架构 并行编程
在线阅读 下载PDF
Real-time stereo matching on CUDA using Fourier descriptors and dynamic programming
19
作者 Mohamed Hallek Fethi Smach Mohamed Atri 《计算可视媒体(英文版)》 CSCD 2019年第1期59-71,共13页
Computation of stereoscopic depth and disparity map extraction are dynamic research topics.A large variety of algorithms has been developed,among which we cite feature matching, moment extraction, and image representa... Computation of stereoscopic depth and disparity map extraction are dynamic research topics.A large variety of algorithms has been developed,among which we cite feature matching, moment extraction, and image representation using descriptors to determine a disparity map. This paper proposes a new method for stereo matching based on Fourier descriptors. The robustness of these descriptors under photometric and geometric transformations provides a better representation of a template or a local region in the image. In our work, we specifically use generalized Fourier descriptors to compute a robust cost function.Then, a box filter is applied for cost aggregation to enforce a smoothness constraint between neighboring pixels. Optimization and disparity calculation are done using dynamic programming, with a cost based on similarity between generalized Fourier descriptors using Euclidean distance. This local cost function is used to optimize correspondences. Our stereo matching algorithm is evaluated using the Middlebury stereo benchmark;our approach has been implemented on parallel high-performance graphics hardware using CUDA to accelerate our algorithm, giving a real-time implementation. 展开更多
关键词 generalized Fourier DESCRIPTORS STEREO MATCHING dynamic PROGRAMMING CUDA
梯度方向直方图的嵌入式GPU并行加速计算 预览
20
作者 陈晓旭 钱慧 李方舒 《有线电视技术》 2019年第5期95-99,共5页
本文针对HOG 算法进行特征计算过程中,计算复杂度高和耗时长的问题,提出了基于GPU 并行架构的加速算法。该算法依次分析了HOG 算子中梯度计算、梯度投票和归一化三个步骤的特点,结合CUDA 的GPU架构特性,对它们进行了并行化设计。
关键词 梯度方向直方图 CUDA GPU 并行化设计 嵌入式开发平台
在线阅读 下载PDF
上一页 1 2 55 下一页 到第
使用帮助 返回顶部 意见反馈