期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
Hash索引算法综述
1
作者 颜文 陈征 《无线通信技术》 2019年第2期19-24,29共7页
在这个数据量爆炸增长的时代,如何在海量数据中实现对所需数据快速精准的查找成为必须面对的难题。哈希索引(Hash Index)将数据相关值输入哈希函数中,通过哈希函数计算得到哈希码,从而找到数据对应的存储地址。这种方法大大提高了数据... 在这个数据量爆炸增长的时代,如何在海量数据中实现对所需数据快速精准的查找成为必须面对的难题。哈希索引(Hash Index)将数据相关值输入哈希函数中,通过哈希函数计算得到哈希码,从而找到数据对应的存储地址。这种方法大大提高了数据检索的速度和准确度并优化了存储空间结构,一定程度上解决了海量数据处理较慢的难题,因此被当今学者广为研究。本文将综述哈希索引的定义和特点,介绍哈希索引的传统算法和新兴算法,最后总结全文并展望未来的研究方向。 展开更多
关键词 哈希索引 哈希码 键值 数据检索
基于区块链的P2P节点信任评价模型 预览
2
作者 张方 王凤英 《山东理工大学学报:自然科学版》 CAS 2019年第3期13-18,共6页
由于P2P网络去中心化特性,导致无法直接使用传统集中式网络的节点信用评价指标。为了得到可信的数据,融合hash链的帕特里夏树和电商行业区块链,通过对经典模型的剖析,给出了较为完善的信用指标体系,引入节点信用指标的时间敏感函数,构... 由于P2P网络去中心化特性,导致无法直接使用传统集中式网络的节点信用评价指标。为了得到可信的数据,融合hash链的帕特里夏树和电商行业区块链,通过对经典模型的剖析,给出了较为完善的信用指标体系,引入节点信用指标的时间敏感函数,构建节点信任评价模型,并进行了效能分析。通过分析表明,该模型能保证P2P网络数据安全性。 展开更多
关键词 P2P网络 HASH 区块链 信用指标 信任评价模型 时间敏感函数
在线阅读 免费下载
加密环境下大数据特征集并行存储方法研究 预览
3
作者 李蓉蓉 《现代电子技术》 北大核心 2019年第18期69-72,共4页
针对传统方法存在数据存储速度慢,容量小的问题,提出一种加密环境下大数据特征集并行存储方法.采用MMSE算法对大数据特征集进行优化处理,以获得并行的大数据特征集.在加密环境下,当内存中保留数据记录达到一定数量时,在并行处理后的数... 针对传统方法存在数据存储速度慢,容量小的问题,提出一种加密环境下大数据特征集并行存储方法.采用MMSE算法对大数据特征集进行优化处理,以获得并行的大数据特征集.在加密环境下,当内存中保留数据记录达到一定数量时,在并行处理后的数据中插入批量Hash索引.以此为基础,基于Map函数对数据进行映射处理,进而完成对大数据特征集的并行存储.实验结果表明,利用所提方法的存储过程中数据分布通道具有较好的一致性,且存储速度约为传统方法的3倍,存储容量大. 展开更多
关键词 大数据特征集 并行存储 MMSE算法 Hash索引 结果分析 映射处理
在线阅读 下载PDF
基于动态阈值哈希的大规模遥感影像快速内容检索方法
4
作者 强永刚 肖志峰 +1 位作者 陈欢欢 闫丽阳 《测绘通报》 CSCD 北大核心 2019年第8期34-38,53,共6页
随着我国遥感对地观测技术的快速发展,接收和存档的遥感影像数据量呈指数级增长,传统的检索方法难以在超大的遥感影像数据量上进行快速内容检索,造成遥感影像检索技术缺乏突破性进展,使得我国遥感影像利用率和利用效率受到限制。本文提... 随着我国遥感对地观测技术的快速发展,接收和存档的遥感影像数据量呈指数级增长,传统的检索方法难以在超大的遥感影像数据量上进行快速内容检索,造成遥感影像检索技术缺乏突破性进展,使得我国遥感影像利用率和利用效率受到限制。本文提出了一种创新的哈希索引方法,该方法根据特征向量的空间分布情况动态生成向量的哈希编码,可对高维的遥感影像特征向量进行低维编码,大大降低了检索计算量,可显著提高大规模遥感影像库内容检索的准确率和效率。在天地图数据集的检索试验表明本文提出方法在准确度和检索效率上均有显著提升,有较大的应用潜力。 展开更多
关键词 遥感影像检索 哈希算法 特征索引 降维
基于私有云的邮件传输处理优化算法 预览
5
作者 常晓洁 徐锋 +1 位作者 郭晔 厉晓华 《通信学报》 CSCD 北大核心 2018年第A01期195-199,共5页
从大附件上传及传输过程缓慢造成的用户体验下降、附件重复数据导致的计算资源浪费等问题出发,提出了基于层次化的系统架构,依托该物理架构,进一步研究了大附件传输的优化算法及趋同分析的管理机制。实验测试表明,该算法在用户体验、大... 从大附件上传及传输过程缓慢造成的用户体验下降、附件重复数据导致的计算资源浪费等问题出发,提出了基于层次化的系统架构,依托该物理架构,进一步研究了大附件传输的优化算法及趋同分析的管理机制。实验测试表明,该算法在用户体验、大附件高速传输和附件存储的节约化管理方面是最优方法。 展开更多
关键词 分布式集群 传输优化 散列算法 去重 索引
在线阅读 下载PDF
数据库索引技术概述 预览
6
作者 母凤雯 《电脑知识与技术:学术交流》 2017年第9期9-11,13共4页
随着数据库技术的发展,数据库索引技术面临着巨大的挑战,为了了解数据库索引技术的发展方向,文章对数据库索引技术的发展现状进行了简要概述。文章从数据库技术的发展出发,阐述了数据库索引技术发展的必然方向,简单说明了传统的数据库... 随着数据库技术的发展,数据库索引技术面临着巨大的挑战,为了了解数据库索引技术的发展方向,文章对数据库索引技术的发展现状进行了简要概述。文章从数据库技术的发展出发,阐述了数据库索引技术发展的必然方向,简单说明了传统的数据库索引技术,例如ISAM索引、b+树、Hash索引,并对可能成第三阶段数据库主流的面向对象数据库的索引技术,例如结构索引、路径索引、多重索引进行了阐述。文章重点对当前大数据时代下,基于大数据的数据库索引技术进行梳理和总结,指出大数据环境中为应对数据容量大、速度快、种类多、价值密度低的4v特点而发展出的索引机制的特点。文章最后对数据库索引的发展方向进行思考讨论,进一步说明数据库索引技术下一步的发展可能方向。 展开更多
关键词 数据库索引 ISAM索引 B+树 Hash索引 结构索引 路径索引 多重索引 大数据
在线阅读 下载PDF
一种改进的基于Hash算法及概率的k-mer索引方法 预览 被引量:2
7
作者 史晓楠 徐澜 +1 位作者 徐丹丹 高慧慧 《通信电源技术》 2017年第3期70-72,74共4页
文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表... 文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表,在每个Hash位置下以链表的形式挂接位置信息,从而建立了索引模型。提出一种将四叉树进行编码压缩的索引方案——"线性Hash编码索引模型",消除了四叉树索引模型中父节点内存浪费问题。同时,查询速度从树形的O(log4^n)降到了线性的0(1),得到很大地提高。 展开更多
关键词 k-mer 树形索引 Hash索引 哈弗曼编码 概率模型
在线阅读 下载PDF
基于本地代理和索引信息的代码侵权检测方法 预览
8
作者 寨亮 张刚 赵逢禹 《软件导刊》 2017年第6期5-10,共6页
开源软件越来越丰富,企业开发人员可以方便地通过复用开源代码提高开发效率。但是开源代码的许可证非常复杂,未加管理的代码复用可能给企业带来严重的法律风险。通过侵权检测发现潜在侵权风险是企业自我保护的重要手段,然而一般企业都... 开源软件越来越丰富,企业开发人员可以方便地通过复用开源代码提高开发效率。但是开源代码的许可证非常复杂,未加管理的代码复用可能给企业带来严重的法律风险。通过侵权检测发现潜在侵权风险是企业自我保护的重要手段,然而一般企业都没有能力维护互联网级别的开源代码库,而使用第三方检测系统需要提供企业自己的源码,可能造成企业技术秘密泄露。为解决上述问题,提出了一种基于本地代理的代码侵权检测方案,该方案仅需要对外提交代码的结构和索引信息即可,无需提供完整的源码,既保护了企业源码隐私,又避免了企业维护大量开源代码库的额外负担,实现了高效的侵权检测。 展开更多
关键词 侵权检测 哈希值 索引 代码抄袭 克隆检测 本地代理
在线阅读 免费下载
适应横集纵贯智能电网调控系统实时数据库的设计 被引量:4
9
作者 彭晖 王瑾 +3 位作者 陶洪铸 严亚勤 吴庆曦 靳晶 《电力系统自动化》 EI CSCD 北大核心 2016年第9期118-123,共6页
为了适应智能电网调度控制系统横向集成、纵向贯通的体系架构,并满足其对实时数据库大容量、高效率、安全性的要求,亟需研发与之适应的实时数据库。文中首先分析了智能电网调度控制系统对实时数据库的需求,然后介绍了实时数据库的体系... 为了适应智能电网调度控制系统横向集成、纵向贯通的体系架构,并满足其对实时数据库大容量、高效率、安全性的要求,亟需研发与之适应的实时数据库。文中首先分析了智能电网调度控制系统对实时数据库的需求,然后介绍了实时数据库的体系架构、大容量与支持多应用扩展系列技术、实时库高效访问系列技术、实时库安全保障、模型管理和实时库同步等技术。文中测试表明实时库效率相对原有系统有明显的提升,数据访问安全性能得到有效保障。实时数据库为各类应用打下了坚强的数据基础,保障了各级智能电网调度控制系统的稳定运行,有力支撑了智能电网建设。 展开更多
关键词 实时数据库 横向集成 纵向贯通 大容量 高效访问 安全保障 HASH索引
一种基于变参级联混沌的Hash函数算法 预览 被引量:1
10
作者 吴涛 金建国 魏明军 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期674-681,共8页
针对级联混沌可能存在的密钥泄漏风险以及当前Hash函数的不足,提出了一种基于变参级联混沌的Hash函数算法,即在构成Hash函数的级联驱动系统中,引入了另一混沌系统的状态变量作为参数扰动,并在扰动强度的控制下实现安全的变参级联系统.... 针对级联混沌可能存在的密钥泄漏风险以及当前Hash函数的不足,提出了一种基于变参级联混沌的Hash函数算法,即在构成Hash函数的级联驱动系统中,引入了另一混沌系统的状态变量作为参数扰动,并在扰动强度的控制下实现安全的变参级联系统.由此构成的Hash函数不仅具有符合混沌规律的变参特性,同时还具有级联子系统间逐级串扰的性质,能有效降低由计算机有限精度和数字量化可能造成的短周期行为风险,对提高压缩函数内部结构的复杂度和抗碰撞性有着显著意义.实验结果表明:与其他混沌Hash算法和SHA-3算法相比,该算法具有高度的初值敏感性和良好的混乱与扩散性能,抗碰撞能力强,算法实现简单灵活,变参系统可控性强,在混沌保密通信、数字签名等领域具有良好的推广前景. 展开更多
关键词 级联混沌 HASH函数 参数扰动 LYAPUNOV指数 抗碰撞性
在线阅读 下载PDF
基于深度卷积神经网络的服装图像分类检索算法 预览 被引量:8
11
作者 厉智 孙玉宝 +1 位作者 王枫 刘青山 《计算机工程》 CAS CSCD 北大核心 2016年第11期309-315,共7页
针对利用深度学习的服装图像检索算法分类精度较低的问题,提出基于深度卷积神经网络的改进服装图像分类检索算法,并建立一个具有16种属性、10万量级的网络服装图像数据库B_DAT Clothing。依据服装图像的复杂性,采用深度卷积神经网络从B_... 针对利用深度学习的服装图像检索算法分类精度较低的问题,提出基于深度卷积神经网络的改进服装图像分类检索算法,并建立一个具有16种属性、10万量级的网络服装图像数据库B_DAT Clothing。依据服装图像的复杂性,采用深度卷积神经网络从B_DAT Clothing数据库中自动学习服装的属性特征并建立哈希索引,进而构建基于服装属性的检索模型,实现服装图像的高效分类和快速检索。实验结果表明,与传统视觉特征分类算法相比,该算法在服装分类上的准确率更高,属性检索效果更好。 展开更多
关键词 服装属性 卷积神经网络 属性检索 分类排序 哈希索引 服装数据库
在线阅读 下载PDF
面向大规模金融对账文件的近似比对模型及系统 预览
12
作者 尹祥龙 王伟 +4 位作者 陈煜 周继恩 任明 徐景良 万鑫明 《计算机系统应用》 2016年第4期86-90,共5页
针对TB级的大规模金融对账文件的近似比对问题,本文深入分析了金融对账文件的特点,以提升比对速度作为研究目标,提出了一种多层次的近似比对模型—Up Compare模型.Up Compare模型以多进程为扩展基础,采用哈希索引建立映射表结合快速致... 针对TB级的大规模金融对账文件的近似比对问题,本文深入分析了金融对账文件的特点,以提升比对速度作为研究目标,提出了一种多层次的近似比对模型—Up Compare模型.Up Compare模型以多进程为扩展基础,采用哈希索引建立映射表结合快速致胜策略为核心算法.测试结果表明,运用Up Compare模型,我国银行卡清算系统的每日清算文件近似比对效率提升了5倍以上. 展开更多
关键词 海量文件 金融对账文件 近似比对 哈希索引
在线阅读 下载PDF
基于稀疏矩阵面向论文索引排名的启发式算法 预览
13
作者 万晓松 王志海 原继东 《计算机应用》 CSCD 北大核心 2015年第10期2733-2736,2741共5页
为了提高学术论文检索的精准性,进而为学术研究提供便利,提出了针对学术论文检索问题的排名策略。首先,介绍了基于网页排名算法面向论文索引排名的启发式方法,其中利用Hash索引技术有效地减少了稀疏矩阵计算对内存的消耗;其次,定义了论... 为了提高学术论文检索的精准性,进而为学术研究提供便利,提出了针对学术论文检索问题的排名策略。首先,介绍了基于网页排名算法面向论文索引排名的启发式方法,其中利用Hash索引技术有效地减少了稀疏矩阵计算对内存的消耗;其次,定义了论文间引用关系图的密集度均衡值,并通过大量实验阐明了不同排名算法的迭代次数与图密集度均衡值之间的关系;最后,将所提出的基于论文索引排名的启发式算法应用于科学引文索引(SCI)数据库中,并与原被引频次降序的排序结果进行比较与分析。实验结果表明:在三种基于网页排名技术的算法中,基于链接结构分析的随机过程算法比较适合于按关键词搜索得到的相关领域学术论文的排名。 展开更多
关键词 网页排名算法 稀疏矩阵 Hash索引 论文索引排名 SCI数据库
在线阅读 下载PDF
线性散列在全文检索中的应用研究 预览
14
作者 束文杰 时亚南 于国欣 《计算机技术与发展》 2015年第6期197-201,共5页
散列表是一种常见的数据结构,理论上它能以常数级时间复杂度O (1)执行查询操作,因而在计算机技术中具有广泛的应用。在大规模用户并发向全文检索系统请求数据的情况下,系统会出现响应速度慢以及检索效率低等问题。为解决上述问题... 散列表是一种常见的数据结构,理论上它能以常数级时间复杂度O (1)执行查询操作,因而在计算机技术中具有广泛的应用。在大规模用户并发向全文检索系统请求数据的情况下,系统会出现响应速度慢以及检索效率低等问题。为解决上述问题,引入了动态散列技术—线性散列,结合全文检索系统的实际需要,提出了一种分块式线性散列倒排索引的构建方法,并详细阐述了该线性散列索引的索引结构、存储方式、设计思路和实现细节。经大量实验测试,基于线性散列的倒排索引具有极快的响应速度,明显提高了全文检索的查询性能。 展开更多
关键词 散列表 全文检索系统 线性散列 倒排索引
在线阅读 下载PDF
基于Hash算法的DNA序列k-mer index问题的数学建模 预览 被引量:3
15
作者 郭方舟 华阳 +1 位作者 董修伟 蔡志丹 《长春理工大学学报:自然科学版》 2015年第5期116-119,共4页
针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8... 针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8G、操作系统为64位Windows 7的条件下,对100万条长度为100的DNA序列进行了测试,给出了不同k值下建立和查询索引的用时和占用内存情况,有效的解决了DNA序列的k-mer index问题。 展开更多
关键词 HASH算法 索引问题 数学模型 复杂度分析
在线阅读 下载PDF
大数据的空间数据索引技术研究 预览
16
作者 曾凤生 《学术问题研究》 2014年第1期97-100,共4页
详细了解大数据的空间数据索引技术研究现状,对目前的一系列主要空间数据索引进行阐述。对现在的主流空间数据索引技术进行论述,依据R-tree索引、哈希索引、Voronoi图索引和空间填充曲线的原理,从其本质上分析其各自特点,从而为大... 详细了解大数据的空间数据索引技术研究现状,对目前的一系列主要空间数据索引进行阐述。对现在的主流空间数据索引技术进行论述,依据R-tree索引、哈希索引、Voronoi图索引和空间填充曲线的原理,从其本质上分析其各自特点,从而为大数据的空间数据索引技术研究提供理论基础。 展开更多
关键词 大数据 空间数据索引 R-tree索引 哈希索引 空间填充曲线
在线阅读 下载PDF
基于定制协处理器的基因重测序加速技术研究 预览
17
作者 汤文 张春明 +2 位作者 谭光明 张佩珩 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1980-1992,共13页
自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进... 自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进行分析,从而提出了一个现场可编程门阵列(field programmable gate array,FPGA)作为协处理器的架构,并在Convey公司的HC-1ex平台上进行了设计与实现.其基本处理单元内部采用全流水的设计及FIFO隔离计算模块和访存模块,可以完整执行重测序算法的核心流程.通过将基本处理单元和访存端口的一对一绑定,在4块Xilinx Virtex-6LX760上实现了64路并行处理流程,总平均读内存带宽可达22.59GBps.与8核Intel Xeon处理器相比,可以提升28.5倍的性能. 展开更多
关键词 高通量测序技术 短序列比对 Hash索引 现场可编程门阵列 异构体系结构
在线阅读 下载PDF
BTB索引散列算法的研究与设计 预览 被引量:2
18
作者 王国澎 胡向东 +1 位作者 尹飞 朱英 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期2003-2011,共9页
分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存(branch target buffer,BTB)预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法... 分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存(branch target buffer,BTB)预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法充分利用BTB资源,从而造成不必要的冲突缺失,影响分支目标地址的预测精度,采用散列索引方式优化访问映射关系是有效解决方法之一.当前大量文献研究了cache的访问方式,但对BTB的散列索引算法的专门探讨则显不足.为了消除分支指令的分布空洞,离散分支指令和BTB条目的固有映射关系,设计了用于BTB索引的XOR散列算法和优化的bit-select索引算法,使用概率方法对BTB单组最大映射数期望的上界作了估计,并对这两种散列索引算法的效果进行了模拟评估.实验结果表明,散列映射方式能够较好地避免BTB冲突缺失造成的预测失败,XOR散列算法的离散效果更好. 展开更多
关键词 分支目标缓冲 散列索引 XOR散列函数 分支目标地址预测 分支预测
在线阅读 下载PDF
基于Hash链的RFID安全双向认证协议 预览 被引量:10
19
作者 裴小强 卫宏儒 《计算机应用》 CSCD 北大核心 2014年第A01期47-49,54共4页
针对应用于射频识别(RFID)系统中的Hash链协议在可扩展性和安全性方面存在的缺陷,提出了一种高效可扩展的改进协议。协议提供了标签与阅读器之间的双向认证,通过利用标签ID的唯一性建立了数据索引,并引入用于标识标签被访问次数的... 针对应用于射频识别(RFID)系统中的Hash链协议在可扩展性和安全性方面存在的缺陷,提出了一种高效可扩展的改进协议。协议提供了标签与阅读器之间的双向认证,通过利用标签ID的唯一性建立了数据索引,并引入用于标识标签被访问次数的访问计数器来提高后台数据库的检索效率,降低了系统计算载荷。利用共享密值与访问计数器的自更新特性以及哈希函数的单向性使协议能够抵抗重放攻击和标签伪装等安全威胁。分析结果表明,协议在运算效率及安全性方面都有所提高,具有较好的可扩展性,适用于标签数目较多的RFID系统。 展开更多
关键词 射频识别 哈希链 可扩展性 访问计数器 索引
在线阅读 下载PDF
实时数据仓库中一种改进的数据流更新算法 预览
20
作者 潘郑冰 戴牡红 《计算机工程》 CAS CSCD 2014年第10期43-46,51共5页
为实现数据仓库中数据的高效集成,针对数据偏斜分布现象,提出一种改进的数据流更新算法EH-JOIN。该算法对传统散列连接方法进行改进,利用索引将部分频繁使用的主数据存储在内存中,解决了高速数据流下的磁盘频繁访问问题。实验结果表明,... 为实现数据仓库中数据的高效集成,针对数据偏斜分布现象,提出一种改进的数据流更新算法EH-JOIN。该算法对传统散列连接方法进行改进,利用索引将部分频繁使用的主数据存储在内存中,解决了高速数据流下的磁盘频繁访问问题。实验结果表明,与MESHJOIN算法和R-MESHJOIN算法相比,EH-JOIN算法的服务速率在磁盘存储关系集保持适当大小时分别提高了96%和81%,在内存大小不同时提高了57%和48%。 展开更多
关键词 实时数据仓库 数据转换 数据流更新 基于流的连接 哈希索引 偏斜分布
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部 意见反馈