期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
浅析大数据关联规则挖掘算法及应用
1
作者 迟殿委 《电子元器件与信息技术》 2019年第4期4-7,共4页
本文首先介绍了大数据背景和数据中可能潜在的有价值的规则以及规则对数据的要求。然后介绍了关联规则挖掘算法及一般步骤,并结合weka开源工具实现大数据集合的数据挖掘。最后用Java代码结合weka开源项目实现项目开发中对关联规则挖掘... 本文首先介绍了大数据背景和数据中可能潜在的有价值的规则以及规则对数据的要求。然后介绍了关联规则挖掘算法及一般步骤,并结合weka开源工具实现大数据集合的数据挖掘。最后用Java代码结合weka开源项目实现项目开发中对关联规则挖掘算法的集成,完成该算法在实际项目中的应用。 展开更多
关键词 大数据 数据挖掘 WEKA 关联规则
基于贝叶斯网络的阈下焦虑抑郁中医证候学研究
2
作者 孙文军 冯玉桥 唐启盛 《中华中医药杂志》 CSCD 北大核心 2018年第7期3112-3115,共4页
目的:总结阈下焦虑抑郁的中医证候学规律。方法:病例来源于北京中医药大学三所附属医院门诊、北京中医药大学国医堂中医门诊部及太阳宫和小关社区卫生服务中心诊断为MADD患者共620例。采用横断面的研究方法,评价患者的一般情况、中医... 目的:总结阈下焦虑抑郁的中医证候学规律。方法:病例来源于北京中医药大学三所附属医院门诊、北京中医药大学国医堂中医门诊部及太阳宫和小关社区卫生服务中心诊断为MADD患者共620例。采用横断面的研究方法,评价患者的一般情况、中医症状、精神病学量表。结果:运用贝叶斯网络的方法建立了MADD患者症状之间的网络模型,提取证候要素,应证组合,寻找了MADD常见的证候类型。结论:肝郁脾虚、心脾两虚、心肾不交是MADD最常见的证候类型。 展开更多
关键词 焦虑抑郁 数据挖掘 贝叶斯网络 证候
融合因子分解机和用户行为预测的音乐推荐 预览
3
作者 潘洋 陈盛双 李石君 《计算机工程与应用》 CSCD 北大核心 2017年第17期101-107,共7页
针对传统音乐评分推荐模式用户评分缺失和主观差异性较大等问题,通过提取用户行为数据构建行为特征模型,用以分析用户行为与兴趣的关联性,并采用因子分解机(FactorizationMachine,FM)预测用户行为类型,作为音乐推荐的依据。将FM... 针对传统音乐评分推荐模式用户评分缺失和主观差异性较大等问题,通过提取用户行为数据构建行为特征模型,用以分析用户行为与兴趣的关联性,并采用因子分解机(FactorizationMachine,FM)预测用户行为类型,作为音乐推荐的依据。将FM应用到该方法中,充分利用音乐和用户属性特征,并且通过模拟用户行为特征数据中的隐因子来填充推荐的稀疏矩阵,降低数据稀疏对预测的影响。与传统音乐推荐方法相比,从用户历史行为中挖掘用户兴趣倾向以解决评分模型带来的问题更具可行性,实验结果表明该方法用于音乐推荐也具有良好的效果。 展开更多
关键词 音乐推荐 因子分解机 行为预测 数据挖掘
在线阅读 下载PDF
基于选择标准的Apriori算法改进 预览
4
作者 马良斋 姜滨 摆慧娟 《河西学院学报》 2016年第2期82-84,96共4页
关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用... 关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用对数据库进行类标签压缩来减少迭代次数.通过实验显示该方法可以有效提高Apriori算法的效率. 展开更多
关键词 数据挖掘 关联规则 数据库压缩 APRIORI算法 ARM
在线阅读 下载PDF
一种基于云计算的高效数据挖掘框架研究 预览 被引量:2
5
作者 刘猛 《微型电脑应用》 2015年第6期15-19,共5页
云计算可按软件即服务(Saa S)的形式提供数据挖掘的结果。数据挖掘的性能和质量是云计算环境下数据挖掘应用的重要使用标准。文中提出一种基于云计算的数据挖掘应用及其数据集的分布和调度框架,该框架实现了基于云计算的K均值聚类方法... 云计算可按软件即服务(Saa S)的形式提供数据挖掘的结果。数据挖掘的性能和质量是云计算环境下数据挖掘应用的重要使用标准。文中提出一种基于云计算的数据挖掘应用及其数据集的分布和调度框架,该框架实现了基于云计算的K均值聚类方法,并将其作为云软件即服务(Saa S)来提供给用户,其主要目标是降低应用的总体运行时间,将挖掘质量的损失最小化。仿真结果表明,相比于已有方案,其方案在速度获得显著提升的同时,挖掘质量损失最小。另外,当聚类数量和数据集的规模上升时,挖掘质量也具有良好的扩展性,可促进本文方案在云服务提供商中的应用。 展开更多
关键词 云计算 数据挖掘 K均值聚类 总体运行时间
在线阅读 下载PDF
一种基于划分的周期性话题挖掘方法研究 预览
6
作者 邓定胜 《微型电脑应用》 2014年第8期21-26,共6页
周期性话题挖掘是目前数据挖掘领域的研究热点之一,针对当前绝大部分研究只限于时间序列数据库、无法直接应用于文本数据的不足,提出了一种基于划分的周期性话题挖掘方法(PTMP),首先,将话题划分为周期性话题、背景话题和突发性话题,然... 周期性话题挖掘是目前数据挖掘领域的研究热点之一,针对当前绝大部分研究只限于时间序列数据库、无法直接应用于文本数据的不足,提出了一种基于划分的周期性话题挖掘方法(PTMP),首先,将话题划分为周期性话题、背景话题和突发性话题,然后,将每个周期性话题的时标分布建模为混合高斯分布,为了缓解背景噪声问题,通过均匀分布生成背景话题的时标,用高斯分布来生成突发话题的时标,然后通过将该混合模型根据时标文本数据进行调整,从而发现周期性话题及其时间分布.最后,收集了包括研讨会、DBLP和Flickr在内的多个代表性数据集,验证方法的有效性. 展开更多
关键词 周期性话题 数据挖掘 混合高斯分布 噪声 时标
在线阅读 下载PDF
邻域粗糙贝叶斯网络及其在医学数据挖掘中的应用 预览 被引量:2
7
作者 孙继佳 邵建华 苏式兵 《数理医药学杂志》 2013年第5期539-543,共5页
目的:提出基于领域粗糙集的贝叶斯网络医学数据挖掘模型,探讨肝炎肝硬化的临床分类。方法:根据所收集的355例肝硬化患者临床资料,采用领域粗糙集算法提取与肝炎肝硬化临床分类有关的生物检测指标。然后,运用树增强型贝叶斯分类器... 目的:提出基于领域粗糙集的贝叶斯网络医学数据挖掘模型,探讨肝炎肝硬化的临床分类。方法:根据所收集的355例肝硬化患者临床资料,采用领域粗糙集算法提取与肝炎肝硬化临床分类有关的生物检测指标。然后,运用树增强型贝叶斯分类器构建分类模型进行肝炎肝硬化的临床分类。结果:采用领域粗糙集贝叶斯网络分类模型进行肝炎肝硬化代偿性分类的正确率为90.91%,活动性分类正确率为94.09%,而使用BP神经网络的代偿性分类正确率为76.82%,活动性分类为85.45%。结论:领域粗糙集贝叶斯网络分类方法可以有效地进行肝炎肝硬化临床分类,并能够为临床医学诊断研究提供参考。 展开更多
关键词 数据挖掘 领域粗糙集 树增强贝叶斯网络 肝炎肝硬化 BP神经网络
在线阅读 下载PDF
近十年中医医案研究进展 被引量:4
8
作者 刘贤亮 黎创 毛炜 《中华中医药杂志》 CAS CSCD 北大核心 2012年第8期2132-2134,共3页
通过对近10年来中医医案研究文献的复习,选取综合性分析文献,分别从研究对象的选择方法和研究方法两方面综述其研究特点及成就,并从研究方法的角度介绍了数据挖掘技术在中医医案研究中的应用,为进一步整理继承中医尤其是名老中医经验提... 通过对近10年来中医医案研究文献的复习,选取综合性分析文献,分别从研究对象的选择方法和研究方法两方面综述其研究特点及成就,并从研究方法的角度介绍了数据挖掘技术在中医医案研究中的应用,为进一步整理继承中医尤其是名老中医经验提供研究方法和思路。 展开更多
关键词 中医医案 数据挖掘 名中医 文献
一种基于相似性度量的离散化方法 预览 被引量:3
9
作者 丁剑 白凤伟 《西北师范大学学报:自然科学版》 CAS 北大核心 2012年第5期43-47,共5页
针对基于信息熵的离散化方法的不足,提出了一种应用相似性度量理论将数值型属性进行离散化的方法.数值型属性离散化后,每一个区间所获得的信息量用一个叫做代数-几何平均数距离公式的相似性度量公式来度量;区间的数目由训练数据集合的... 针对基于信息熵的离散化方法的不足,提出了一种应用相似性度量理论将数值型属性进行离散化的方法.数值型属性离散化后,每一个区间所获得的信息量用一个叫做代数-几何平均数距离公式的相似性度量公式来度量;区间的数目由训练数据集合的大小动态决定.将此方法和基于信息熵的离散化方法在一些数据集合上进行实验,并用朴素贝叶斯分类器对离散化后的数据集合进行分类,结果表明该方法有更好的分类正确率. 展开更多
关键词 数据挖掘 离散化 相似性度量 信息熵
在线阅读 免费下载
一种基于过抽样技术的非平衡数据集分类方法 预览 被引量:5
10
作者 王春玉 苏宏业 +1 位作者 渠瑜 褚健 《计算机工程与应用》 CSCD 北大核心 2011年第1期 139-143,共5页
非平衡数据集的分类问题是机器学习领域的一个研究热点。针对非平衡数据集分类困难的问题,特别是由于非平衡分布引起的少数类识别能力低下的问题,提出了一种改进算法,AdaBoost-SVM-OBMS。该算法结合Boosting算法和基于错分样本产生新样... 非平衡数据集的分类问题是机器学习领域的一个研究热点。针对非平衡数据集分类困难的问题,特别是由于非平衡分布引起的少数类识别能力低下的问题,提出了一种改进算法,AdaBoost-SVM-OBMS。该算法结合Boosting算法和基于错分样本产生新样本的过抽样技术。在新算法中,以支持向量机为元分类器,每次Boosting迭代中标记出错分的样本点,然后在错分样本点与其近邻间随机产生一定数量与错分样本同一类别的新样本点。新产生样本点加入原训练集中重新训练学习,以提高分类困难样本的识别能力。在AUC,F-value和G-mean 3个不同价格的评价指标下8个benchmark数据集上对AdaBoost-SVM-OBMS算法与AdaBoost-SVM算法和APLSC算法进行了对比实验,实验结果表明了AdaBoost-SVM-OBMS算法在非平衡数据集分类中的有效性。 展开更多
关键词 数据挖掘 非平衡数据集 BOOSTING 错分样本 支持向量机
在线阅读 下载PDF
基于关联分析的高校校园网告警系统 预览
11
作者 吴文杰 《计算机安全》 2011年第12期 36-39,共4页
随着高校校区的扩大,网络规模越来越大,结构也趋于复杂、异构,这就需要对网络进行有效的管理以维持其可靠性和可用性。告警相关性分析作为网络故障管理中的重要内容,有助于处理冗余告警、定位故障及预防故障的发生。提出使用关联规则分... 随着高校校区的扩大,网络规模越来越大,结构也趋于复杂、异构,这就需要对网络进行有效的管理以维持其可靠性和可用性。告警相关性分析作为网络故障管理中的重要内容,有助于处理冗余告警、定位故障及预防故障的发生。提出使用关联规则分析的告警系统,这些规则可以作为先验知识来指导网络智能化故障定位、诊断和预测。 展开更多
关键词 告警关联 关联规则 数据挖掘
在线阅读 下载PDF
多维数量关联规则聚类挖掘研究
12
作者 刘振名 赵可新 刘振亮 《煤炭技术》 CAS 北大核心 2011年第6期184-185,共2页
根据旅游数据的特殊性,提出了多维数量关联规则聚类算法(MDQARC),并从挖掘库的生成、数值属性的离散化以及关联规则挖掘和规则聚类等方面设计了有效的算法,最后通过实验将MDQARC算法与C4.5算法进行了比较,证明了该算法可以提高运行效率。
关键词 数据挖掘 数量关联规则 算法
I-Miner环境下三种离群点挖掘算法的设计与实现 预览
13
作者 侯天子 朱焱 《软件》 2011年第11期 25-28,31,共5页
在数据挖掘过程中,有很多挖掘算法试图使离群点的影响最小化,甚至是排除它们,然而这样可能丢失一些重要的信息。如今,在欺诈检测、网络入侵检测、故障诊断等问题中,离群点挖掘得到了越来越多的应用,离群点的发掘成为一个热门研究... 在数据挖掘过程中,有很多挖掘算法试图使离群点的影响最小化,甚至是排除它们,然而这样可能丢失一些重要的信息。如今,在欺诈检测、网络入侵检测、故障诊断等问题中,离群点挖掘得到了越来越多的应用,离群点的发掘成为一个热门研究问题。I-Miner是一个企业级的数据挖掘工具,在本文中利用I-Miner软件对数据进行预处理,并用通过S语言拓展软件功能,编写了3种离群点算法并使用多个数据测试,对结果进行分析和对比研究。 展开更多
关键词 数据挖掘 离群点挖掘 聚类分析
在线阅读 下载PDF
基于Agent和数据挖掘技术的DMS电子交易平台设计和实现
14
作者 赵可新 刘振名 肖金铜 《网络安全技术与应用》 2011年第2期41-42,55共3页
基于数据挖掘技术和Agent技术,建立了DMS交易平台DMS-Trade。并给出了其中的算法管理Agent的实现算法。该平台能根据客户的信息,在数据挖掘结果的支持下,实现针对不同客户的个性化服务。
关键词 数据挖掘 算法 模型
统计学专业本科生开设“数据挖掘”课程的探讨 预览 被引量:8
15
作者 刘云霞 《吉林工程技术师范学院学报》 2010年第6期,共3页
"数据挖掘"是一门分析海量数据库的交叉学科,统计学专业开设这门课程十分必要。鉴于数据挖掘内容的复杂多样,本文提出应根据统计学专业本科生的特点制订合理的教学大纲、教学内容和教学方法,以提高学生的学习效率和学习热情。
关键词 数据挖掘 统计学 教学法
在线阅读 下载PDF
基于Web日志挖掘的自适应网站构建方法研究 预览
16
作者 母俐丽 《计算机与现代化》 2010年第3期 144-147,150,共5页
自适应网站能够提高网站对用户的服务质量。本文首先给出自适应网站的总体框架,对框架中主要模块做详细的分析,包括数据预处理、数据挖掘、页面推荐和站点调整。在数据挖掘模块给出一种有效的识别用户访问模式的算法,该算法利用数据库... 自适应网站能够提高网站对用户的服务质量。本文首先给出自适应网站的总体框架,对框架中主要模块做详细的分析,包括数据预处理、数据挖掘、页面推荐和站点调整。在数据挖掘模块给出一种有效的识别用户访问模式的算法,该算法利用数据库查询简化频繁最大前向访问路径集的查找,并在此基础上形成频繁访问路径图,为页面推荐和站点调整做好准备。最后给出自适应网站的设计原则。 展开更多
关键词 自适应网站 频繁访问路径图 页面推荐 站点调整 数据挖掘 WEB日志
在线阅读 下载PDF
基于数据挖掘的图书馆部署决策研究 预览
17
作者 刘承真 《农业图书情报学刊》 2010年第8期 38-41,共4页
数据库管理系统在图书馆的广泛应用,因此在图书馆中积累了大量的读者对资源的历史访问数据。随着高等教育事业的发展出现了大量多校区办学的现象,因此图书资源在大学分校区中合理部署成为一个重要的研究课题。在此以图书馆流通信息和图... 数据库管理系统在图书馆的广泛应用,因此在图书馆中积累了大量的读者对资源的历史访问数据。随着高等教育事业的发展出现了大量多校区办学的现象,因此图书资源在大学分校区中合理部署成为一个重要的研究课题。在此以图书馆流通信息和图书信息为研究对象,使用数据挖掘技术中的分类和聚类方法得出图书部署的决策规则。最后给出该系统实施后的效果分析,实践证明具有较好的应用价值。 展开更多
关键词 决策树算法 数据挖掘 聚类 图书部署
在线阅读 下载PDF
分类模式挖掘在属性预测中的应用 预览
18
作者 李祥民 张佳骥 艾伟 《无线电工程》 2010年第9期 44-47,共4页
数据挖据是一种处理海量数据的技术.分类挖掘是数据挖掘的重要方法.决策树算法能有效在训练数据集上建立数据属性和类别的映射.利用决策树算法建立目标数据库分类器,对数据对象的缺失属性预测.针对分类预测模型对单个目标多个预测类别... 数据挖据是一种处理海量数据的技术.分类挖掘是数据挖掘的重要方法.决策树算法能有效在训练数据集上建立数据属性和类别的映射.利用决策树算法建立目标数据库分类器,对数据对象的缺失属性预测.针对分类预测模型对单个目标多个预测类别的现象,提出一种单个目标预测结果的综合分析算法,处理结果得到单个目标的预测类别及其可信度.分类结果可用于空缺或错误字段补全或校正. 展开更多
关键词 分类模式 数据挖掘 属性 决策树
在线阅读 下载PDF
基于周期采样的数据流频繁项集挖掘算法研究 预览
19
作者 侯伟 杨炳儒 +1 位作者 吴晨生 周谆 《高技术通讯》 CAS CSCD 北大核心 2009年第8期 817-824,共8页
针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法。提出了一种基于周期采样的数据流... 针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法。提出了一种基于周期采样的数据流频繁项集挖掘算法FI-PS,该算法通过跟踪项集支持度变化确定项集支持度的稳定性,并以此作为调整窗口大小以及采样周期的依据,从而以一个较大的概率保证项集支持度误差有上界。理论分析及实验证明该算法有效,在保证挖掘结果准确度相对较好的条件下,可获得较优抽行性能。 展开更多
关键词 数据挖掘 数据流 频繁项(FI)集 周期采样(PS)
在线阅读 下载PDF
一种高效的离线数据流频繁模式挖掘算法 预览 被引量:2
20
作者 侯伟 吴晨生 +1 位作者 杨炳儒 方炜炜 《计算机科学》 CSCD 北大核心 2009年第7期 247-251,291,共6页
数据流频繁模式挖掘是当前数据挖掘领域中的研究热点之一,数据流连续性、无序性、无界性及实时性的特点为挖掘算法在时间及空间性能方面提出了更高的要求。数据流中模式频度的震荡现象,迫使现有算法对概要数据结构频繁维护,致使其时... 数据流频繁模式挖掘是当前数据挖掘领域中的研究热点之一,数据流连续性、无序性、无界性及实时性的特点为挖掘算法在时间及空间性能方面提出了更高的要求。数据流中模式频度的震荡现象,迫使现有算法对概要数据结构频繁维护,致使其时间、空间效率均受到较大影响。构造了具备较高空间性能的概要数据结构SP-tree,同时定义了震荡性因子X以量化震荡信息,提出了一种高效的离线数据流频繁模式挖掘算法SPDS,有效降低了数据震荡对算法性能的影响;在处理新到数据集时,算法采取分而治之的分离映射策略,进一步提升了时间效率;同时在查询结果方面提高了部分模式的计数精度。 展开更多
关键词 数据挖掘 数据流 频繁模式 震荡性因子
在线阅读 免费下载
上一页 1 2 3 下一页 到第
使用帮助 返回顶部 意见反馈