期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
面向服务的云数据挖掘技术研究 预览
1
作者 杨青 孟娟 《辽宁广播电视大学学报》 2016年第2期34-35,共2页
云计算平台下网络数据的海量发展,迫切需要数据挖掘技术满足用户需求。而面向服务的云数据挖掘技术不同于一般网格的分布式数据挖掘框架,需要利用有效机制完成对分布式数据挖掘应用的设计和运行,并从关键技术、关键部件描述中有效解决... 云计算平台下网络数据的海量发展,迫切需要数据挖掘技术满足用户需求。而面向服务的云数据挖掘技术不同于一般网格的分布式数据挖掘框架,需要利用有效机制完成对分布式数据挖掘应用的设计和运行,并从关键技术、关键部件描述中有效解决海量数据挖掘中的海量数据存储、挖掘算法、数据处理的互操作性等问题。 展开更多
关键词 云计算 数据挖掘 面向服务体系结构 分布式数据挖掘
在线阅读 下载PDF
基于MapReduce的H-mine算法 预览 被引量:1
2
作者 冯兴杰 赵杰 《计算机应用研究》 CSCD 北大核心 2016年第3期754-758,共5页
频繁模式挖掘是一种非常有效地从数据中获取知识的方法,但是随着大数据时代的来临,现有算法及其计算环境的运算速度、内外存容量面临严峻挑战。针对以上问题,紧密结合MapReduce模型提供的高效分布式编程和运行框架,在深入分析H-mine频... 频繁模式挖掘是一种非常有效地从数据中获取知识的方法,但是随着大数据时代的来临,现有算法及其计算环境的运算速度、内外存容量面临严峻挑战。针对以上问题,紧密结合MapReduce模型提供的高效分布式编程和运行框架,在深入分析H-mine频繁模式挖掘算法的基础上,通过对H-mine算法频繁模式挖掘过程的并行化改进,提出了一种新颖的基于MapReduce模型的H-mine算法(简称MRH-mine)。MRH-mine算法实现了对H-mine算法在分布式运行环境下的改造,实验表明该算法在面对数据大规模增长的情况下具有良好的性能和扩展性。 展开更多
关键词 分布式数据挖掘 MAPREDUCE H-mine 并行化 HADOOP
在线阅读 下载PDF
基于信息分析的养老社区智能管理系统研究 预览 被引量:1
3
作者 张航 亓孝博 +2 位作者 韦伟 曹天人 刘瑜 《无线互联科技》 2016年第8期55-57,共3页
基于信息分析的养老社区智能管理系统主要由养老社区室内Kinect视频监控、Zig Bee传感器节点和养老社区终端云服务器构成,文章通过分布式数据挖掘技术对室内环境和老年人起居生活信息进行处理和分析,并及时进行反馈,保证老年人的身体健... 基于信息分析的养老社区智能管理系统主要由养老社区室内Kinect视频监控、Zig Bee传感器节点和养老社区终端云服务器构成,文章通过分布式数据挖掘技术对室内环境和老年人起居生活信息进行处理和分析,并及时进行反馈,保证老年人的身体健康。本系统可行性强,在未来具有良好的发展前景。 展开更多
关键词 ZIGBEE技术 Kinect视频监控 分布式数据挖掘
在线阅读 下载PDF
基于大数据分析的暂态电能质量综合评估方法 预览 被引量:17
4
作者 张华赢 朱正国 +4 位作者 姚森敬 高田 曹军威 韩蓄 王淼 《南方电网技术》 北大核心 2015年第6期80-86,共7页
运用基于大数据处理架构的Naive Bayes分类方法提出了暂态电能质量评估方法,将数据来源扩展至电网运行监测数据、电力用户数据和公共信息数据等方面,并将评估结果按严重程度分为暂态正常状态、短时电压暂降状态、短时深度电压暂降状态... 运用基于大数据处理架构的Naive Bayes分类方法提出了暂态电能质量评估方法,将数据来源扩展至电网运行监测数据、电力用户数据和公共信息数据等方面,并将评估结果按严重程度分为暂态正常状态、短时电压暂降状态、短时深度电压暂降状态、短时电压失压状态。基于MapReduce架构,设计分布式Naive Bayes算法实现状态分类。在分类器训练阶段,对海量历史数据进行分布式学习,周期性地生成评估规则库并部署到所有评估节点。在状态评估阶段,各评估节点基于流处理框架快速生成实时评估样本,并根据当前规则库实时地得出评估结果。试验结果表明,所提出的基于大数据分析的暂态电能质量评估方法是可行,在准确率和处理速度上都取得了较好的效果。 展开更多
关键词 数据 MapReduce 分布式数据挖掘 朴素贝叶斯(Naive Bayes)分类
在线阅读 免费下载
大数据环境下频繁项集挖掘的研究 预览 被引量:2
5
作者 李挥剑 《青岛科技大学学报:自然科学版》 CAS 2015年第2期224-231,共8页
多种频繁项集挖掘(FIM)方法组合用来对大数据进行挖掘会暴露很多问题。针对暴露的问题,在MapReduce平台上对两种频繁项集挖掘算法进行了研究。采用两种新的大数据集挖掘方法:Dist-Eclat和BigFIM,前者侧重于速度,利用基于k-FIs的简易... 多种频繁项集挖掘(FIM)方法组合用来对大数据进行挖掘会暴露很多问题。针对暴露的问题,在MapReduce平台上对两种频繁项集挖掘算法进行了研究。采用两种新的大数据集挖掘方法:Dist-Eclat和BigFIM,前者侧重于速度,利用基于k-FIs的简易负荷平衡方案来解决问题。而后者通过先验变体对k-FIs进行挖掘后将找出的频繁项集分配给映射程序,通过优化后在真正大的数据集上运行。最后通过实验证明该方法时间复杂度较低,数据量越大优势将越明显,扩展效果越好。 展开更多
关键词 分布式数据挖掘 频繁项集挖掘 MAPREDUCE HADOOP Eclat算法
在线阅读 下载PDF
Research on the Distributed Data Mining Cloud Framework Oriented Internet of Things 预览
6
作者 Guan Wei Lu Hui-Juan +1 位作者 Chen Jing-Jing Wu Jie 《国际技术管理》 2014年第8期106-108,共3页
关键词 分布式数据挖掘 物联网 互联网 数据挖掘模型 计算体系结构 架构 数据挖掘系统 分布式网络
在线阅读 下载PDF
分布式数据挖掘综述 预览 被引量:6
7
作者 刘滨 《河北科技大学学报》 CAS 2014年第1期80-90,共11页
随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅... 随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅助生产或运营中的管理决策行为,以提高决策水平及决策收益。然而,受到普遍存在的异构性、私有性和平台兼容性等限制,兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等),互联于网络的数据源难于进行集中式挖掘,分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑战。根据文中给出的DDM高层架构,最终结果的质量与局部数据源的类型、可用性、局部结果的质量及整合方法等密切相关。DDM的实施未必都以站点间纯粹独立挖掘的方式进行,此外,对于数据集中,系统分布式站点多的情况,也可采用DDM。当前,DDM研究领域的挑战主要有:异构与同构挖掘、动态环境下的数据多变性、通信开销、知识整合和语义异构等。当前的DDM系统被分为4类:1)基于Multi—Agent的系统,利用Agent的自治性实现局部挖掘以保护数据私有性;利用Agent的主动性减少用户参与以提高挖掘自动化水平;利用Agent的协作性实现多算法协同挖掘等;2)基于网格的系统,利用网格在资源共享、开放服务和协同工作等方面的优势,提高挖掘的可靠性和协同性;3)基于元学习的系统,通过元学习优化挖掘算法的选择与组合,并对已获知识进行多次学习以提高结果质量;4)基于CDM(collectivedatamining)框架的系统,将待学习的函数表示为一组基函数的分布式存在,允许各数据源选择不同的学习算法,并以全局结果正确为前提减少网络通信量。进而,对当前DDM研究存在的共性 展开更多
关键词 分布式数据挖掘 数据挖掘 本体 语义距离
在线阅读 下载PDF
基于分布式数据挖掘方法的研究与应用 预览 被引量:6
8
作者 汪丽 张露 《武汉理工大学学报:信息与管理工程版》 2013年第1期40-43,共4页
针对关联规则Apriori算法多次重复扫描数据库和产生大量候选频繁项集的缺点,对其进行改进,并在MapReduce模型上得以实现。改进的Apriori算法只需要对整个数据库扫描一次,即可得到所有频繁项集的集合。仿真实验结果表明,随着节点数目的增... 针对关联规则Apriori算法多次重复扫描数据库和产生大量候选频繁项集的缺点,对其进行改进,并在MapReduce模型上得以实现。改进的Apriori算法只需要对整个数据库扫描一次,即可得到所有频繁项集的集合。仿真实验结果表明,随着节点数目的增多,改进算法比原算法执行时间要短,并且这种优势随着节点数目的增加而扩大,说明在异构集群环境下,MapReduce模型的Apriori算法能够提高关联规则挖掘的执行效率。将改进的分布式关联规则算法在分布式教育决策支持系统中应用,通过对实际数据的挖掘,证明了该方法对教育决策的有效性。 展开更多
关键词 分布式数据挖掘 MAPREDUCE模型 关联规则 分布式教育决策支持系统
在线阅读 下载PDF
Map—Reduce应用于并行同步联合聚类学习的研究 预览
9
作者 刘春茂 王超 《科技通报》 北大核心 2013年第10期82-84,共3页
许多数据挖掘应用中涉及的预测模型庞大并且数据集复杂。这样的应用程序急需创新的算法。该算法不仅需要有效的预测精度,而且需要有效的运行于分布式计算系统中并在合理的时间内产生结果。本文重点介绍多关系数据的预测模型,首先举例... 许多数据挖掘应用中涉及的预测模型庞大并且数据集复杂。这样的应用程序急需创新的算法。该算法不仅需要有效的预测精度,而且需要有效的运行于分布式计算系统中并在合理的时间内产生结果。本文重点介绍多关系数据的预测模型,首先举例说明设计这些数据的应用模型,然后描述一个基于并行同步聚类(SCOAL)的总体框架,该框架适用于分而治之的方法进行数据分析。最终将论证基于并行同步聚类的框架在应用Map—Reduce的情况下可以有效的实现并行化。 展开更多
关键词 分布式数据挖掘 Map—Redu(燃预测模型
在线阅读 下载PDF
Internet环境下并行群组数据挖掘模型 预览 被引量:2
10
作者 马冰川 赵书良 王伟 《计算机工程与应用》 CSCD 2012年第6期 134-138,共5页
随着Internet技术的发展,分布式数据挖掘越来越受到重视。分布式数据挖掘急需一种能聚合多种网络功能为通信媒介,松耦合、并行的数据挖掘架构。以分析经典并行数据挖掘模型PADMA和BODHI为基础,结合现实需要给出了一种新的并行分布式... 随着Internet技术的发展,分布式数据挖掘越来越受到重视。分布式数据挖掘急需一种能聚合多种网络功能为通信媒介,松耦合、并行的数据挖掘架构。以分析经典并行数据挖掘模型PADMA和BODHI为基础,结合现实需要给出了一种新的并行分布式数据挖掘模型——PADMAN。模型采用分治策略,将数据挖掘任务进行划分并分配给数据挖掘组,群组之间并行挖掘;基于Agent,使各基本数据挖掘单元具有自治性;群组客户端和全局客户端可实现无线接入,使用户端的使用和接入更加灵活。分治策略的应用,使模型具有良好的模块化和可扩展性。 展开更多
关键词 数据挖掘 分治策略 AGENT 分布式数据挖掘
在线阅读 下载PDF
基于频繁概念直乘分布的全局闭频繁项集挖掘算法 预览 被引量:14
11
作者 柴玉梅 张卓 王黎明 《计算机学报》 EI CSCD 北大核心 2012年第5期 990-1001,共12页
基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析了Iceberg概念格并置集成的内在并行特性;以频繁概念直乘及其下覆盖为最小粒度,对Iceberg概念格并置集成... 基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析了Iceberg概念格并置集成的内在并行特性;以频繁概念直乘及其下覆盖为最小粒度,对Iceberg概念格并置集成过程进行分解和分布式计算;在对其正确性理论证明的基础上,提出了一个新颖的异构分布式环境下闭频繁项集全局挖掘算法.此算法利用Iceberg概念格的半格以及可并置集成特性,充分发挥了分布式环境下计算资源的优势.实验证明,在稠密数据集和稀疏数据集上,该挖掘算法都表现出较好的性能. 展开更多
关键词 Iceberg概念格 分布式数据挖掘 并置集成 异构数据 闭频繁项集
在线阅读 下载PDF
FP—Growth算法MapReduce化研究 预览 被引量:14
12
作者 吕雪骥 李龙澍 《计算机技术与发展》 2012年第11期123-126,130共5页
随着云计算概念的盛行,以及数据挖掘技术在分布式环境下的应用问题,该文献针对当前业界中流行的大规模并行计算模型MapReduce,将其引入数据挖掘领域关联规则算法的并行化改进中,提出基于FP-Growth算法并行化改进的MR—FP算法,为并... 随着云计算概念的盛行,以及数据挖掘技术在分布式环境下的应用问题,该文献针对当前业界中流行的大规模并行计算模型MapReduce,将其引入数据挖掘领域关联规则算法的并行化改进中,提出基于FP-Growth算法并行化改进的MR—FP算法,为并行化关联规则挖掘提供节点可扩展、可容错、故障可恢复的运行保证。并通过案例分析得出系统在事务数呈数量级级别增长下仍可保持较高的性能。通过理论分析和案例实验表明,数据挖掘理论和方法在云计算环境下可以充分发挥能力,具有广阔的、有价值的研究空间。 展开更多
关键词 MapReduce FP-GROWTH MR-FP 云计算 分布式数据挖掘
在线阅读 下载PDF
无线传感器网络中分布式数据挖掘算法研究 预览 被引量:6
13
作者 洪月华 《计算机仿真》 CSCD 北大核心 2012年第12期167-170,179共5页
研究无线传感器网络中数据挖掘问题。针对大量高维冗余且不确定的无线传感器网络监测数据传送到中央服务器上使用传统的数据挖掘方法进行挖掘的缺点相当明显,导致耗费了珍贵的网络能量。为解决上述问题,提出在每个传感器节点上进行基... 研究无线传感器网络中数据挖掘问题。针对大量高维冗余且不确定的无线传感器网络监测数据传送到中央服务器上使用传统的数据挖掘方法进行挖掘的缺点相当明显,导致耗费了珍贵的网络能量。为解决上述问题,提出在每个传感器节点上进行基于粗糙集与遗传BP网络相结合的分布式数据挖掘算法,利用GA来训练BP网络的阈值和权值来构成遗传BP网络(GABP),克服BP网络的某些不足;利用粗糙集RS在消除冗余信息、处理不确定性数据等方面的优势,缩减训练数据输入BP网络的维度。仿真结果表明,改进算法能有效地实现对无线传感器网络中的数据进行分类,取得了较理想的效果。 展开更多
关键词 分布式数据挖掘 无线传感器网络 粗糙集 遗传算法 神经网络
在线阅读 下载PDF
基于网格的分布式Apriori和经典Apriori算法的知识挖掘 预览 被引量:1
14
作者 张杰 《软件导刊》 2012年第1期 56-57,共2页
提出了使用网格技术的关联规则数据挖掘及实施,并分析、比较了经典Apriori算法和分布式Apriori算法的实施结果。通过WEKA工具对预评估系统的效率评估,和中心数据库上的Apriori和先验Apriori算法性能分析。在网格环境下可以通过减少数据... 提出了使用网格技术的关联规则数据挖掘及实施,并分析、比较了经典Apriori算法和分布式Apriori算法的实施结果。通过WEKA工具对预评估系统的效率评估,和中心数据库上的Apriori和先验Apriori算法性能分析。在网格环境下可以通过减少数据处理时间、资源优化、负载分担来提高计算网络的效率并减少成本,从而使用户得到计算量更大、成本更低、速度更快的计算结果。还介绍了基于网格环境的分布式Apriori关联规则算法,并解释了如何获取知识。 展开更多
关键词 分布式数据挖掘 关联规则 网格 算法 频繁项集 先验Apriori
在线阅读 免费下载
基于移动agent和数据挖掘标准的分布式数据挖掘系统 预览 被引量:4
15
作者 陈玉哲 赵明华 +1 位作者 李军 赵书良 《郑州大学学报:理学版》 CAS 北大核心 2011年第1期90-94,113共6页
提出了一个基于移动agent和数据挖掘标准的分布式数据挖掘系统模型,该系统运用两个层次的开放式数据挖掘语言来提供良好的延伸性,基于KQML和XML的代理通信机制保证移动代理具备很好的跨平台性.系统可以有效实现对分布的、异构异质数... 提出了一个基于移动agent和数据挖掘标准的分布式数据挖掘系统模型,该系统运用两个层次的开放式数据挖掘语言来提供良好的延伸性,基于KQML和XML的代理通信机制保证移动代理具备很好的跨平台性.系统可以有效实现对分布的、异构异质数据源的集成和访问,同时还给出了系统的响应时间模型. 展开更多
关键词 移动AGENT 分布式数据挖掘 数据挖掘语言 XML
在线阅读 免费下载
基于博弈论的隐私保护分布式数据挖掘 预览 被引量:6
16
作者 葛新景 朱建明 《计算机科学》 CSCD 北大核心 2011年第11期 161-166,共6页
隐私保护的分布式数据挖掘问题是数据挖掘领域的一个研究热点,而基于经济视角,利用博弈论的方法对隐私保护分布式数据挖掘进行研究只是处于初始阶段。基于收益最大化,研究了完全信息静态博弈下分布式数据挖掘中参与者(两方或多方)的... 隐私保护的分布式数据挖掘问题是数据挖掘领域的一个研究热点,而基于经济视角,利用博弈论的方法对隐私保护分布式数据挖掘进行研究只是处于初始阶段。基于收益最大化,研究了完全信息静态博弈下分布式数据挖掘中参与者(两方或多方)的策略决策问题,得出了如下结论:数据挖掘在满足一定的条件下,参与者(两方或多方)的准诚信攻击策略是一个帕累托最优的纳什均衡策略;在准诚信攻击的假设下,参与者(多方)的非共谋策略并不是一个纳什均衡策略。同时给出了该博弈的混合战略纳什均衡,它对隐私保护分布式数据挖掘中参与者的决策具有一定的理论和指导意义。 展开更多
关键词 博弈论 隐私保护 分布式数据挖掘
在线阅读 免费下载
基于网格的分布式数据挖掘仿真研究 被引量:1
17
作者 付弦 丁一 《情报科学》 CSSCI 北大核心 2011年第5期769-773,共5页
结合网格计算和数据挖掘技术,提出基于网格的分布式数据挖掘框架。框架定义在网格之上,由Globus来提供底层的网格服务,使用基本的网格服务来建构特定的数据分析和数据挖掘服务;框架是一组可动态扩展的服务,这些服务通过不同的方法聚合... 结合网格计算和数据挖掘技术,提出基于网格的分布式数据挖掘框架。框架定义在网格之上,由Globus来提供底层的网格服务,使用基本的网格服务来建构特定的数据分析和数据挖掘服务;框架是一组可动态扩展的服务,这些服务通过不同的方法聚合在一起来满足应用的需要,框架中各服务的开发按照开放网格服务体系结构的标准。借鉴SPRINT分类算法思想,将基于网格的分布式数据挖掘框架作为算法理想运行平台,提出了基于网格的分布式SPRINT分类算法,算法使用框架提供的目录服务、数据服务和资源分配和执行计划管理等多种服务来完成分布式数据挖掘任务。 展开更多
关键词 分布式数据挖掘 开放网格 服务体系
基于粗糙集与BP神经网络的分布式数据挖掘算法 预览 被引量:2
18
作者 洪月华 《玉林师范学院学报》 2011年第5期 133-136,共4页
利用数据挖掘来提高网络中能量利用率是无线传感器网络(WSN)的一个重要研究方向.本文构建了基于粗糙集与神经网络相结合的无线传感器网络分布式数据挖掘算法.该算法用粗糙集对节点内的原始数据进行离散化与属性约简后得到的最简决策... 利用数据挖掘来提高网络中能量利用率是无线传感器网络(WSN)的一个重要研究方向.本文构建了基于粗糙集与神经网络相结合的无线传感器网络分布式数据挖掘算法.该算法用粗糙集对节点内的原始数据进行离散化与属性约简后得到的最简决策表训练BP神经网络,再将构造好的BP神经网络集成在每个传感器节点上.仿真结果表明,该算法可以降低数据维数,消除冗余数据、减少网络通信量、延长网络寿命. 展开更多
关键词 无线传感器网络 粗糙集 BP神经网络 分布式数据挖掘
在线阅读 下载PDF
一种网格环境下的FP-树分布式构造算法 预览 被引量:2
19
作者 荀亚玲 吴晓婷 张继福 《计算机工程与应用》 CSCD 北大核心 2011年第31期 128-131,147,共5页
针对分布式环境下FP-tree的构造及合并,给出了一种网格环境下FP-tree的分布式构造算法GridDBMA。该算法中,各站点根据全局项目头表,独立构造局部频繁模式树BFP-tree,然后,利用合并算法将各局部树合并为一棵全局频繁模式树,并在全局频繁... 针对分布式环境下FP-tree的构造及合并,给出了一种网格环境下FP-tree的分布式构造算法GridDBMA。该算法中,各站点根据全局项目头表,独立构造局部频繁模式树BFP-tree,然后,利用合并算法将各局部树合并为一棵全局频繁模式树,并在全局频繁模式树上提取出所求的频繁项目集,通过对传统频繁模式树的存储结构的改进,减少了树的规模及站点间的网络通信量,并使树的遍历更加方便有效,提高了合并效率,从而提高了整个频繁项目集的挖掘效率。最后,采用天体光谱数据作为形式背景,实验验证了该算法的正确性和有效性。 展开更多
关键词 网格 分布式数据挖掘 频繁模式 关联规则 FP-树
在线阅读 下载PDF
基于网格的数据挖掘算法 预览 被引量:2
20
作者 齐玉成 郑丽英 高三营 《电脑知识与技术:学术交流》 2010年第2期 871-874,共4页
为了克服传统数据挖掘算法与分布式数据挖掘算法的不足.提出了一种基于网格平台的数据挖掘算法,并改进了原有的Apriori算法,使其应用于网格平台。基于网格的数据挖掘算法具有合并计算力,安全,高效,节约硬件成本等优势已越来越受... 为了克服传统数据挖掘算法与分布式数据挖掘算法的不足.提出了一种基于网格平台的数据挖掘算法,并改进了原有的Apriori算法,使其应用于网格平台。基于网格的数据挖掘算法具有合并计算力,安全,高效,节约硬件成本等优势已越来越受到学术界的重视。 展开更多
关键词 数据挖掘 分布式数据挖掘 网格 关联规则
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部 意见反馈