期刊文献+
共找到234篇文章
< 1 2 12 >
每页显示 20 50 100
月球哥白尼纪次级坑的形态特征及其空间分布 预览
1
作者 张珂 刘建忠 程维明 《国土资源遥感》 CSCD 北大核心 2019年第1期255-263,共9页
月球次级坑是月球上的一种地质特征,易与初级坑相混淆,对月表定年影响大,同时对主撞击坑的撞击方向有一定的指示意义,因此识别和筛选出次级坑是一项重要的工作。综合考虑撞击坑空间分布位置和直径关系,选取哥白尼纪5个典型撞击坑为研究... 月球次级坑是月球上的一种地质特征,易与初级坑相混淆,对月表定年影响大,同时对主撞击坑的撞击方向有一定的指示意义,因此识别和筛选出次级坑是一项重要的工作。综合考虑撞击坑空间分布位置和直径关系,选取哥白尼纪5个典型撞击坑为研究对象,基于遥感影像和地形数据,通过总结相关学者对特定形态指标与次级坑定量关系的研究,构建4个形态指标(不规则度、椭圆度、深径比、坑缘高度与直径比)及其参数范围,进行次级坑的智能化识别、提取与空间分布研究。最终识别出次级坑总数量为17 811个,在此基础上构建了包含位置、大小、形状、距离和方向5大类的数据库;并研究了距主坑边缘不同距离范围内次级坑的规模和空间分布特征;提出了基于次级坑主轴方向判定撞击坑入射方向的新方法。研究结果表明:①在规模大小上,月海次级坑直径大小主要集中在初级坑直径的(2. 7±0. 11)%以下;月陆次级坑直径大小主要集中在初级坑直径的(3±0. 3)%以下;在空间分布上,月海与月陆次级坑分布规律相一致,次级坑数量占总次级坑数量的90%时,其分布距离是最大分布距离的(57±7)%;②Tycho撞击坑的入射方向为W-E方向,Copernicus撞击坑和Kepler撞击坑的入射方向为SE-NW方向,Aristarchus撞击坑和Jackson撞击坑的入射方向为NW-SE方向。这些认识将对更准确地开展撞击坑撞击方向的研究提供参考。 展开更多
关键词 次级坑 哥白尼纪 形态指标 次级坑数据库 空间分析 撞击方向
在线阅读 下载PDF
武夷茶区茶园土壤养分状况及其对茶叶品质成分的影响 预览 被引量:1
2
作者 周志 刘扬 +3 位作者 张黎明 许锐能 孙丽莉 廖红 《中国农业科学》 CAS CSCD 北大核心 2019年第8期1425-1434,共10页
[目的]分析乌龙茶主产区武夷茶园中土壤养分状况及其对茶叶品质成分的影响,为改良茶园养分管理和提升茶叶品质提供理论依据。[方法]本研究在 2008 年福建省土壤普查数据的基础上,于 2015 年在武夷 3 大茶区,(桐木区、岩茶区和洲茶区)随... [目的]分析乌龙茶主产区武夷茶园中土壤养分状况及其对茶叶品质成分的影响,为改良茶园养分管理和提升茶叶品质提供理论依据。[方法]本研究在 2008 年福建省土壤普查数据的基础上,于 2015 年在武夷 3 大茶区,(桐木区、岩茶区和洲茶区)随机选取 68 个茶园,包括桐木区 12 个、岩茶区 32 个和洲茶区 24 个,分别采取茶园 0--20 cm 的土壤和一芽三叶的茶青样品。检测土壤 pH,有机质、碱解氮、有效磷和速效钾含量等土壤养分指标,同时利用高效液相色谱系统(HPLC)定量测定茶青中的茶氨酸、咖啡碱、芦丁、ECG、EGCG 和总儿茶素等 6 种次级代谢物含量做品质成分分析。[结果]通过对比 2008 年和 2015 年的土壤养分指标,发现近年来,武夷茶区土壤酸化严重,部分茶园土壤有效磷含量增加显著。三大茶区中,岩茶区茶园土壤养分状况变化最为明显,其土壤 pH、有机质和碱解氮分别下降了 0.65、45.29%和 49.39%;土壤有效磷含量却大幅度上升,从 5.21 mg·kg^-1上升到平均值为 245.70 mg·kg^-1,上升幅度超过 40 倍。说明该区域茶园存在过度施肥的现象。土壤养分状况显著影响茶叶品质成分,并且不同土壤养分指标对不同品质成分的影响有所不同。通过边际效应分析,发现各次级代谢物的最高含量都有其对应的土壤养分范围。在此基础上,拟合了武夷茶区高品质茶园适宜的土壤养分范围:pH4.5 5.0;有机质 20 40g kg-1;碱解氮 60--100 mg·kg^-1;有效磷 10--100 mg·kg^-1;速效钾 100--150 mg·kg^-1。[结论]综合本研究结果,建议武夷岩茶区和洲茶区在养分管理方面,总体采取有机肥取代部分化肥,适量补氮和钾,严格控制磷肥施用等措施。 展开更多
关键词 土壤养分 茶叶 品质成分 次级代谢物 养分指标 武夷茶区
在线阅读 下载PDF
面向大数据存储的HBase二级索引设计 预览
3
作者 李斌 郭景维 彭骞 《计算技术与自动化》 2019年第2期124-129,共6页
针对HBase缺乏二级索引的功能,导致在非行键列上的查询需要使用过滤器并配合全表扫描完来完成。在大数据的场景下性能较差的问题,结合HBase表行键的索引结构与关系型数据库的二级索引结构提出了索引列值聚集的二级索引解决方案。此外,... 针对HBase缺乏二级索引的功能,导致在非行键列上的查询需要使用过滤器并配合全表扫描完来完成。在大数据的场景下性能较差的问题,结合HBase表行键的索引结构与关系型数据库的二级索引结构提出了索引列值聚集的二级索引解决方案。此外,还提出二级索引机制的支持联合索引与特殊的索引列值的处理,提高了二级索引的性能并拓宽了二级索引的适用场景。最后,通过构建系统测试证明了二级索引极大地提高了HBase的查询效率。 展开更多
关键词 计算机软件 HBASE 二级索引 聚集 转义
在线阅读 下载PDF
基于HBase的后勤保障监控数据实时检索方案设计 预览
4
作者 王丹阳 郝福珍 《信息技术》 2019年第11期136-140,共5页
后勤综合保障监控数据有着实时性、流速快、海量以及多维度的特征,对于监控数据的多维度检索、分析和预警都有较高的实时性要求。鉴于此,文中基于HBase设计了一种分布式监控数据实时存取系统。通过Kafka Streams进行流数据清洗解码,并利... 后勤综合保障监控数据有着实时性、流速快、海量以及多维度的特征,对于监控数据的多维度检索、分析和预警都有较高的实时性要求。鉴于此,文中基于HBase设计了一种分布式监控数据实时存取系统。通过Kafka Streams进行流数据清洗解码,并利用ElasticSearch构建二级索引优化查询。实验表明该系统对PB级数据多维度检索性能提高10~30倍,方案可行且高效。 展开更多
关键词 分布式系统 实时存取 HBASE 二级索引 ElasticSearch
在线阅读 下载PDF
基于协处理器的HBase二级索引方法 预览
5
作者 郭红 周健倩 +1 位作者 张瑛瑛 郭昆 《计算机工程与应用》 CSCD 北大核心 2019年第21期87-92,共6页
在大数据时代,海量的非结构化数据增速远大于结构化数据,HBase被广泛用于海量非结构化数据存储中。由于HBase内置的索引是基于行键(rowkey)设计的,具有很高的查询效率。但是,在根据字段进行条件查询时需要进行全表扫描,性能较低,无法应... 在大数据时代,海量的非结构化数据增速远大于结构化数据,HBase被广泛用于海量非结构化数据存储中。由于HBase内置的索引是基于行键(rowkey)设计的,具有很高的查询效率。但是,在根据字段进行条件查询时需要进行全表扫描,性能较低,无法应用于实时场景。针对此问题,提出一种基于协处理器(coprocessor)的HBase二级索引方法。该方法将经常需要查询的字段通过协处理器在HBase中建立映射到行键的索引,在查询时并行扫描索引数据获取行键,并利用行键快速查询记录。同时,在创建表时,通过对Region进行预分区。在插入数据时,在行键中添加Hash值。这不仅能提高数据插入速度,也避免了热点数据现象,同时保证索引数据和主数据位于同一个Region上,查询时就能减少一次RPC请求。在模拟数据集上的实验表明:提出的二级索引方法具有较好的查询性能。不仅高于HBase自带的过滤查询,也高于基于ElasticSearch的二级索引。同时,其空间开销小于基于ElasticSearch的二级索引。 展开更多
关键词 HBASE 二级索引 协处理器 ElasticSearch
在线阅读 下载PDF
中西医结合治疗血液透析患者继发性甲状旁腺功能亢进临床疗效研究 预览
6
作者 郭立军 赵小翠 《临床研究》 2019年第5期17-18,共2页
目的分析血液透析继发性甲状旁腺功能亢进(简称继发性甲亢,SHPT)患者采取中西医结合治疗的临床疗效。方法选取平舆县中心医院2016年1月~2017年12月收治的血液透析SHPT患者60例实施分组研究,根据治疗方式不同分为单用组与中西医组,每组3... 目的分析血液透析继发性甲状旁腺功能亢进(简称继发性甲亢,SHPT)患者采取中西医结合治疗的临床疗效。方法选取平舆县中心医院2016年1月~2017年12月收治的血液透析SHPT患者60例实施分组研究,根据治疗方式不同分为单用组与中西医组,每组30例。单用组予以西医方案治疗,中西医组在单用组基础上加用中医方案治疗。记录两组不良反应,测定治疗前与治疗后血钙(Ca^2+)、碱性磷酸酶(AKP)、血清全段甲状旁腺素(iPTH)、血磷(P^3-),并比较分析。结果两组患者治疗前Ca^2+、AKP、iPTH、P^3-对比无显著差异(P>0.05),治疗后前述指标除P^3-外两组差异显著(P<0.05);两组患者并无恶心呕吐、食欲不振、嗳气、便秘等发生,单用组有2例肌肉痉挛,组间比较无显著差异(P>0.05)。结论血液透析后SHPT患者采取中西医结合治疗方案处理,相比西医治疗可以更好地改善血磷、血钙、碱性磷酸酶及血清全段甲状旁腺素指标,且安全性高,值得应用。 展开更多
关键词 血液透析 继发性甲状旁腺功能亢进 中西医结合 血清指标
在线阅读 下载PDF
基于内存的HBase二级索引设计 预览 被引量:1
7
作者 崔晨 郑林江 +1 位作者 韩凤萍 何牧君 《计算机应用》 CSCD 北大核心 2018年第6期1584-1590,共7页
在大数据时代,具有海量数据存储能力的HBase已被广泛应用。HBase只对行键进行了索引优化,对非行键的列未建立索引,这严重影响了复杂条件查询的效率。针对此问题,提出了基于内存的HBase二级索引方案。该方案对需要查询的列建立了映射到... 在大数据时代,具有海量数据存储能力的HBase已被广泛应用。HBase只对行键进行了索引优化,对非行键的列未建立索引,这严重影响了复杂条件查询的效率。针对此问题,提出了基于内存的HBase二级索引方案。该方案对需要查询的列建立了映射到行键的索引,并将索引存储在Spark搭建的内存环境中,在查询时先通过索引获取行键,然后利用行键在HBase中快速查找对应的记录。由于列的基数大小和是否涉及范围查询决定了建立索引的类型,故针对三种不同情况构建了不同类型的索引,并利用Spark内存计算、并行化的特点来提高索引的查询效率。实验结果表明,该二级索引具有较好的查询性能,查询时间小于基于Solr的二级索引,可以解决HBase中因非行键的列缺乏索引导致查询效率较低的问题,提高基于HBase存储的大数据分析的查询效率。 展开更多
关键词 HBASE SPARK 二级索引 内存索引 并行化
在线阅读 下载PDF
软弱破碎围岩压实–固结二次成岩机制试验研究 被引量:2
8
作者 王平 余伟健 +4 位作者 冯涛 朱永建 黄钟 任恒 赵训 《岩石力学与工程学报》 CSCD 北大核心 2018年第8期1884-1895,共12页
为研究软弱破碎围岩二次成岩机制,采用自制压实装置对二次成岩影响因素和成岩后的力学行为进行试验研究。结果表明:软弱破碎围岩二次成岩过程可分为压实破碎和固结二次成岩2个阶段,偏芯挤压和对芯挤压是压实破碎阶段主要的2种力学机制... 为研究软弱破碎围岩二次成岩机制,采用自制压实装置对二次成岩影响因素和成岩后的力学行为进行试验研究。结果表明:软弱破碎围岩二次成岩过程可分为压实破碎和固结二次成岩2个阶段,偏芯挤压和对芯挤压是压实破碎阶段主要的2种力学机制,自胶结和粗粒块间黏结是固结二次成岩阶段的主要成岩机制。提出采用破断指数和固结指数分别表征岩块破断难易程度和固结二次成岩程度。统计结果表明岩样粒径越大,不规则系数越大,越难以压实成型。二次成岩受含水率影响,粒径〈1 mm的岩粉其含水率需达到4.76%以上才能压实成型。二次成岩试件单轴抗压强度随粒径增大而线性减小,具有细粒试件类岩性,粗粒试件类塑性,应力加载波动性等力学性质。二次成岩试件的三轴抗压强度随含水率呈三次多项式增长,随压实应力线性增长,以及随岩样粒径呈三次多项式减小。 展开更多
关键词 岩石力学 二次成岩 破断指数 固结指数 力学性质
海量配电网调度监测信息的非主行键倒排索引查询技术 预览 被引量:1
9
作者 屈志坚 范明明 +2 位作者 周锐霖 王汉林 朱丹 《电力系统保护与控制》 CSCD 北大核心 2018年第23期162-168,共7页
为解决配电网调度监控系统数据体量不断增大导致数据检索速度越来越慢的问题,结合数据同步技术与倒排索引机制,提出了一种二级索引架构。使用数据库的同步组件与索引器生成非主行键索引,在搜索时先获得数据主行键,再根据主行键检索到需... 为解决配电网调度监控系统数据体量不断增大导致数据检索速度越来越慢的问题,结合数据同步技术与倒排索引机制,提出了一种二级索引架构。使用数据库的同步组件与索引器生成非主行键索引,在搜索时先获得数据主行键,再根据主行键检索到需要的数据,完成非主行键检索,再利用倒排索引技术改变数据的信息结构,缩短检索时间。以某铁路局10kV供电调度监控信息为算例,进行非主行键检索测试。结果表明:完成非主行键检索所用时间为161ms,满足在配电网调度监控系统中对数据进行快速检索的工程应用需求。 展开更多
关键词 调度监控 快速查询 非主行键 二级索引 倒排索引
在线阅读 下载PDF
一种使用索引式备份的范围查询方法
10
作者 薛翔 沈斯杰 陈榕 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1781-1786,共6页
范围查询是数据库支持的重要功能之一.在分布式数据库中,范围查询具有结果不唯一且数据量大的特点,因而中间结果的传输成本较高;同时,在以唯一主键散列存储的数据上查询非主键列上的范围条件,得到的命中数据较为分散,造成传输开... 范围查询是数据库支持的重要功能之一.在分布式数据库中,范围查询具有结果不唯一且数据量大的特点,因而中间结果的传输成本较高;同时,在以唯一主键散列存储的数据上查询非主键列上的范围条件,得到的命中数据较为分散,造成传输开销大和计算复杂度的问题.针对以上问题和基于高可用系统中数据存在多个备份的观察,本文设计了一种使用索引式备份的范围查询方法,通过将备份数据依据索引列重构实现范围查询友好的索引式备份,优化基于非主键列的范围查询任务.使用索引式备份的范围查询具有数据聚集的特点,能够有效减少数据传输成本、提高计算效率.实验结果显示,在TPC-H基准测试中,本方法相对于传统B+树索引方法具有8.4至16.7倍的性能提升,且具有较好的可扩展性. 展开更多
关键词 分布式数据库 范围查询 二级索引 索引式备份
秦岭林区四种典型次生林林下层植物多样性研究 预览
11
作者 蔡殷 康冰 蔡宗科 《陕西林业科技》 2018年第4期6-13,共8页
采用样方法对秦岭马头滩四种典型次生林林下植被进行了群落调查和物种多样性分析。表明物种多样性排序,华山松林>锐齿栎林>冷杉林>红桦林。结论:林下物种多样性的提高,增加了林下植被的服务功能,促进了乔木层的更新速度。要提... 采用样方法对秦岭马头滩四种典型次生林林下植被进行了群落调查和物种多样性分析。表明物种多样性排序,华山松林>锐齿栎林>冷杉林>红桦林。结论:林下物种多样性的提高,增加了林下植被的服务功能,促进了乔木层的更新速度。要提高次生林自我更新能力,可采取间伐、整枝、补植等人工措施,改善其林下群落结构,提高林地生产力和生态功能。 展开更多
关键词 秦岭 次生林 林下物种 多样性指数
在线阅读 下载PDF
基于AHP-灰色综合评价的农村一二三产业融合水平评价研究 预览 被引量:1
12
作者 熊朗羽 韩培培 朱玲萱 《经济研究导刊》 2018年第36期65-69,共5页
根据农村产业融合的内涵,利用层次分析法构建农村一二三产业融合水平指标体系,利用灰色综合评价法度量农村产业融合水平,并选择辽宁省大洼县为对象进行算例分析。结果发现,运用AHP-灰色综合评价法可以有效地评价农村产业融合水平.
关键词 层次分析法 灰色综合评价 一二三产业 产业融合 指标体系
在线阅读 下载PDF
变电设备状态监测大数据的查询优化方法 被引量:11
13
作者 王德文 李静芳 《电力系统自动化》 EI CSCD 北大核心 2017年第2期165-172,共8页
变电设备状态监测数据体积大、价值密度低,传统数据处理方法不能很好地满足状态监视、评估与诊断等应用快速查询的需要。文中通过对状态监测数据特点和分布式列数据存储方法的分析,给出了变电设备状态监测的大数据处理框架。通过对监测... 变电设备状态监测数据体积大、价值密度低,传统数据处理方法不能很好地满足状态监视、评估与诊断等应用快速查询的需要。文中通过对状态监测数据特点和分布式列数据存储方法的分析,给出了变电设备状态监测的大数据处理框架。通过对监测时间、监测设备编号和设备编号等数据属性的组合,设计了3种状态监测数据复合行键结构,以提高状态监测数据行键查询的灵活性。为了解决在行键未知情况下全表扫描效率低下的问题,提出基于协处理器的二级索引构建方法,实现在非行键约束条件下的快速查询。实验结果表明,基于协处理器的二级索引方法在查询效率上比无索引和IHBase二级索引方式有了明显提高,对状态监测数据写入速度影响较小,能够较好地满足大数据环境下变电设备状态监测大数据快速、灵活查询的需要。 展开更多
关键词 状态监测 大数据 行键 协处理器 二级索引
基于建筑垃圾再生复合微粉的混凝土性能对比分析 预览 被引量:3
14
作者 黄修林 卞周宏 +2 位作者 黄绍龙 彭波 查剑平 《混凝土》 北大核心 2017年第8期128-131,共4页
利用对比分析方法,在普通混凝土中分别掺加同掺量的建筑垃圾再生复合微粉和普通粉煤灰,制备出C30~C60等级强度的混凝土。通过混凝土坍落度/扩展度、龄期抗压强度、耐久性和SEM微观结构分析,得出建筑垃圾再生微粉对混凝土性能的影响优劣... 利用对比分析方法,在普通混凝土中分别掺加同掺量的建筑垃圾再生复合微粉和普通粉煤灰,制备出C30~C60等级强度的混凝土。通过混凝土坍落度/扩展度、龄期抗压强度、耐久性和SEM微观结构分析,得出建筑垃圾再生微粉对混凝土性能的影响优劣,为在低等级混凝土中的应用提供参考。 展开更多
关键词 对比分析 建筑垃圾 复合微粉 抗压强度 二次水化 活性指数
在线阅读 下载PDF
基于HBase的气象结构化数据查询优化 预览 被引量:2
15
作者 徐熙超 杨铮 马廷淮 《计算机工程与应用》 CSCD 北大核心 2017年第9期80-84,共5页
海量气象观、探测数据是提高公共气象服务精细化、精准化和个性化水平的关键。日增TB级的海量气象数据在存储、检索、传输、共享方面的时效性要求对构建在传统的IOE技术架构上气象数据管理系统提出了严峻挑战。在HBase基础上,提出了一... 海量气象观、探测数据是提高公共气象服务精细化、精准化和个性化水平的关键。日增TB级的海量气象数据在存储、检索、传输、共享方面的时效性要求对构建在传统的IOE技术架构上气象数据管理系统提出了严峻挑战。在HBase基础上,提出了一个基于索引的气象结构化数据查询优化架构HBase4M(HBaseforMeteorology)。首先,根据HBase存储特性设计表结构;然后,利用协处理器建立和维护辅助索引,将字段查询转化为对索引表的行键查询,使得HBase4M在具备HBase可扩展性、低延迟的特性上可以支持结构化气象数据的灵活查询。实验结果表明,HBase4M的性能可以基本满足气象服务的业务需要。 展开更多
关键词 气象数据 HBASE 辅助索引 分布式存储
在线阅读 下载PDF
基于分布式平台的构式提取和语料库管理 预览
16
作者 陈新元 《西安文理学院学报:自然科学版》 2017年第5期51-58,共8页
基于语料库的定量分析有助于发现语言现象,总结认知规律.通过自建英语标注语料库,在经典构式理论的基础上实现了利用分布式平台提取语式、验证抽象构式的工作;在Hadoop平台上为面向列的HBase数据库设计表结构,存储非结构化的语料数据;... 基于语料库的定量分析有助于发现语言现象,总结认知规律.通过自建英语标注语料库,在经典构式理论的基础上实现了利用分布式平台提取语式、验证抽象构式的工作;在Hadoop平台上为面向列的HBase数据库设计表结构,存储非结构化的语料数据;为提高构式检索的效率,使用了二级索引;最后测试比较该方案与文本和普通分布式存储的性能表现. 展开更多
关键词 语料库 构式 分布式 HBASE 行键 二级索引
在线阅读 下载PDF
一种基于Solr的HBase海量数据二级索引方案 预览 被引量:6
17
作者 王文贤 陈兴蜀 +1 位作者 王海舟 吴小松 《信息网络安全》 CSCD 2017年第8期39-44,共6页
针对HBase不提供二级索引和华为的hindex方案难以满足海量数据检索速度需求的问题,文章设计了基于Solr的HBase二级索引方案SIHBase(Solr Indexing HBase)。该方案使用HBase的Coprocessor(协处理器)为数据表的创建、修改、删除以及... 针对HBase不提供二级索引和华为的hindex方案难以满足海量数据检索速度需求的问题,文章设计了基于Solr的HBase二级索引方案SIHBase(Solr Indexing HBase)。该方案使用HBase的Coprocessor(协处理器)为数据表的创建、修改、删除以及数据的插入、更新、删除和恢复等操作都实现了相应的回调函数,通过回调函数向Solr发送相关请求,以实现在Solr中自动为HBase建立和维护二级索引,保证数据与索引的一致性。该方案具有良好的通用性,可以同时为多张表的多列数据建立索引。该方案扩展了HBase的客户端功能,增加了直接查询Solr的接口,利用Solr提供的高效、灵活、多样的检索功能实现对HBase海量数据的快速检索。最后,与hindex进行了二级索引的查询性能对比实验,证明了该方案在查询速度上要远快于hindex。 展开更多
关键词 HBASE 二级索引 SOLR 快速检索
在线阅读 下载PDF
相似聚类的二级索引重复数据删除算法
18
作者 王青松 葛慧 《小型微型计算机系统》 CSCD 北大核心 2017年第12期2797-2801,共5页
针对重复数据删除算法指纹对比I/O瓶颈问题,提出一种基于相似聚类的二级索引重复数据删除算法.首先计算所有数据块的Simhash值,基于Simhash值之间的海明距离,提出一种自适应的相似聚类算法,所有聚类中心信息形成一级索引存放在内存中.... 针对重复数据删除算法指纹对比I/O瓶颈问题,提出一种基于相似聚类的二级索引重复数据删除算法.首先计算所有数据块的Simhash值,基于Simhash值之间的海明距离,提出一种自适应的相似聚类算法,所有聚类中心信息形成一级索引存放在内存中.然后计算每个类中数据块的MD5值,将其信息形成二级索引存放在聚类中心.当需要进行重复数据块检测时,计算待检测数据块Simhash值到一级索引中所有聚类中心Simhash值的海明距离,并将海明距离最小的类的二级索引调入内存中进行MD5指纹对比.实验结果表明,算法没有误判率,在较大提高了指纹对比速度的同时,每次检测只产生一次I/O操作,具有更高效的性能. 展开更多
关键词 重复数据删除 二级索引 相似聚类 Simhash 海明距离
线粒体tRNA^Thr基因变异与2型糖尿病发病风险分析 预览
19
作者 温超玮 马胤 +1 位作者 叶薇 吕建新 《中国科技论文》 北大核心 2017年第18期2074-2079,共6页
通过病例(对照研究探讨线粒体tRNA^Thr基因变异与2型糖尿病(type 2diabetes mellitus,T2DM)的关系。实验收集了752例T2DM患者和752例体检健康对照者,采用试剂盒法提取所有受试者外周血基因组DNA,通过聚合酶链式反应(PCR)扩增线粒体... 通过病例(对照研究探讨线粒体tRNA^Thr基因变异与2型糖尿病(type 2diabetes mellitus,T2DM)的关系。实验收集了752例T2DM患者和752例体检健康对照者,采用试剂盒法提取所有受试者外周血基因组DNA,通过聚合酶链式反应(PCR)扩增线粒体tRNA^Thr基因片段并进行DNA测序,运用软件比对分析测序结果,并对变异位点进行评估。通过序列比对分析得到10个线粒体tRNA^Thr基因位点变异,再对这10个变异位点进行tRNA二级结构分析和系统进化分析评估,结果发现线粒体tRNA^Thr G15927A变异破坏了tRNA^Thr反密码子茎上高度保守的碱基对序列(28C-42G)的稳定性,并可能通过改变tRNA^Thr二级结构引起线粒体功能障碍。最后,通过χ2检验发现该变异在T2DM患者组和对照组之间具有统计学差异。线粒体tRNA^Thr G15927A变异可能是T2DM的1个潜在风险因子。 展开更多
关键词 线粒体tRNA^Thr基因 变异 二级结构 保守性数值CI 2型糖尿病
在线阅读 下载PDF
HiBase:一种基于分层式索引的高效HBase查询技术与系统 预览 被引量:28
20
作者 葛微 罗圣美 +6 位作者 周文辉 赵頔 唐云 周娟 曲文武 袁春风 黄宜华 《计算机学报》 EI CSCD 北大核心 2016年第1期140-153,共14页
大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主... 大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主键索引,不支持非主键索引,这导致HBase的数据查询效率较低,难以满足数据实时或准实时查询需求.为此,在HBase基础上提供面向非主键的快速查询能力,是目前Hadoop环境下急需研究和解决的一个重要问题.该文研究提出了一种基于分层式HBase非主键索引的查询模型和方法,该模型和方法首先建立基于HBase的持久性索引.然后,为了利用内存提升查询性能,该文进一步提出了一种索引热点数据缓存技术和一种高效的热度累积缓存替换策略,以降低对HBase索引表的磁盘访问开销.热度累积缓存替换策略克服了最近最少使用(LRU)算法的局限性,考虑数据访问的累积热度和时间局部特性,从而更准确地捕获数据访问的特征.为了使索引热点数据缓存内存层具有良好的可扩展性,HiBase设计了基于一致性哈希的分布式内存缓存,支持高效的基于非主键的单点查询和范围查询.最终,该文设计实现了完整的分层式索引和查询系统HiBase.在千万至十亿条记录规模数据集上的测试结果表明,HiBase冷查询响应时间比标准HBase快65倍(大结果集)到3000多倍(小结果集);而引入基于查询热度累积算法的内存索引缓存方法后,热查询性能可在HiBase冷查询基础上再提升5~15倍,使得总体查询性能比标准HBase快300多倍(大结果集)到1.7万倍(小结果集),比开源的Hindex系统快5~20倍. 展开更多
关键词 HBASE 非主键索引 查询处理 分层式索引 缓存替换策略 大数据
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部 意见反馈