期刊文献+
共找到279篇文章
< 1 2 14 >
每页显示 20 50 100
改进型决策树在加热炉热效率评估中的应用研究 预览
1
作者 倪建云 解树枝 李子豪 《化工自动化及仪表》 CAS 2019年第6期474-478,共5页
在石化企业加热炉设备的长期运转和热效率评估过程中,针对属性数量众多且多为连续型属性这一特点,利用传统规则库的调炉决策很难对加热炉进行有效的能效评估。因此,提出了一种基于C4.5算法的改进型分类算法,弥补C4.5算法没有考虑问题无... 在石化企业加热炉设备的长期运转和热效率评估过程中,针对属性数量众多且多为连续型属性这一特点,利用传统规则库的调炉决策很难对加热炉进行有效的能效评估。因此,提出了一种基于C4.5算法的改进型分类算法,弥补C4.5算法没有考虑问题无关属性和冗余属性对分类结果的影响。在经典的C4.5算法基础上引入模拟退火算法对分类属性进行优化组合,使得分类算法在分类时间和准确率上都有改进和提升。同时,在已有的炉况在线监测系统上加以改进,将决策树算法运用到该系统中,用于石化加热炉热效率的评估,为管理人员提供炉况调整解决方案。 展开更多
关键词 加热炉 热效率 决策树 C4.5算法 模拟退火算法 评估系统
在线阅读 下载PDF
基于云计算的数据挖掘系统设计 预览
2
作者 蓝机满 《电子科技》 2019年第8期70-74,共5页
为了高效、快速地解决呈指数增长的数据处理问题,提高数据储存、运算能力,文中提出了基于云计算的数据挖掘系统的设计。该系统首先分析了主流云计算平台Spark的组件构成和运行机制,深入研究其计算架构的编程原理。同时利用Spark进行了C... 为了高效、快速地解决呈指数增长的数据处理问题,提高数据储存、运算能力,文中提出了基于云计算的数据挖掘系统的设计。该系统首先分析了主流云计算平台Spark的组件构成和运行机制,深入研究其计算架构的编程原理。同时利用Spark进行了C4.5算法和K-medoids聚类算法的并行化设计,有效提高算法的运行速度、收敛速度和结果的稳定性。测试表明,在进行海量数据的分析处理时,文中提出的云计算平台在分类误差内,可有效提高整体系统的运算速度,分类效率也大幅提高。 展开更多
关键词 云计算 数据挖掘 SPARK C4.5算法 K-medoids聚类算法
在线阅读 免费下载
数据挖掘分类模型原理与实例分析 预览
3
作者 王荆禾苑 《电子测试》 2019年第7期37-39,共3页
大数据时代下,如何利用数据变成一个热门的话题。随着信息技术的发展,各种数学计算机模型不断产生,数据挖掘模型是当今热门的模型之一。数据挖掘模型通过建立算法,通过计算机计算分析,搜索数据中的隐含信息和规律,从而帮助决策。本文通... 大数据时代下,如何利用数据变成一个热门的话题。随着信息技术的发展,各种数学计算机模型不断产生,数据挖掘模型是当今热门的模型之一。数据挖掘模型通过建立算法,通过计算机计算分析,搜索数据中的隐含信息和规律,从而帮助决策。本文通过探索数据挖掘中的分类模型ID3和C4.5,学习比较算法的原理,并进一步通过天气数据的实例计算分析,加深对数据挖掘模型对于实际数据处理的作用的理解。 展开更多
关键词 数据挖掘 分类 天气预测 ID3算法 C4.5算法
在线阅读 下载PDF
改进的C4.5算法的研究与应用 预览 被引量:2
4
作者 赵建民 黄珊 +1 位作者 王梅 刘澎 《计算机与数字工程》 2019年第2期261-265,共5页
针对C4.5算法构建特征决策树方法的研究,发现目前方法时常出现准确率低的情况,导致模型使用过程缺乏准确性。为此,在数据挖掘的过程中深入研究C4.5算法,提出一种改进的算法,即C4.5-W算法,该算法的主要思想是通过在C4.5算法中引入参数W,... 针对C4.5算法构建特征决策树方法的研究,发现目前方法时常出现准确率低的情况,导致模型使用过程缺乏准确性。为此,在数据挖掘的过程中深入研究C4.5算法,提出一种改进的算法,即C4.5-W算法,该算法的主要思想是通过在C4.5算法中引入参数W,调整属性度量标准信息增益率的取值范围,进而构建决策树模型找出涉案人特征规律进行预测。通过实验表明,该算法在使用过程中能够有效提高预测涉案人的精准率。因此,C4.5-W算法可提高决策树模型的准确率。 展开更多
关键词 C4.5算法 决策树 涉案人特征 数据挖掘
在线阅读 下载PDF
决策树分类算法中C4.5算法的研究与改进 预览
5
作者 韩存鸽 叶球孙 《计算机系统应用》 2019年第6期198-202,共5页
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.... C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率. 展开更多
关键词 决策树 C4.5算法 朴素贝叶斯分类 UCI
在线阅读 下载PDF
C4.5算法的研究及改进 预览
6
作者 姜如霞 黄水源 +1 位作者 段文影 余楚波 《南昌大学学报:理科版》 CAS 北大核心 2019年第1期90-96,共7页
C4.5算法作为目前常用的数据挖掘方法,仍存在一些缺陷。针对算法中出现的信息增益率计算复杂的问题,通过数学知识对增益率计算过程进行简化,提高计算效率;针对算法中可能偏袒属性值较多的属性的不足,在非类属性进行最佳属性的选择时引... C4.5算法作为目前常用的数据挖掘方法,仍存在一些缺陷。针对算法中出现的信息增益率计算复杂的问题,通过数学知识对增益率计算过程进行简化,提高计算效率;针对算法中可能偏袒属性值较多的属性的不足,在非类属性进行最佳属性的选择时引入权重这个概念;针对连续属性离散化过程耗时的缺陷,利用边界定理寻找最大信息增益率的候选分裂点,减少计算时间。将改进后的算法应用到葡萄牙某银行挖掘认购存款的潜在用户上,实验结果表明,C4.5改进算法计算量减少,分类准确率也有提高,决策树的生成时间也大大缩减,构建的决策树贴合实际。 展开更多
关键词 C4.5算法 数学 权重系数 连续属性 边界定理
在线阅读 下载PDF
C4.5算法在广州小斑螟发生与气候因素分析中的应用--以广西山口国家红树林生态自然保护区为例 预览
7
作者 梁燕红 梁志清 +2 位作者 黄琦 苏炳欢 陈其应 《中国森林病虫》 2019年第1期34-37,共4页
将数据挖掘技术引入红树林虫害成因分析中,利用广西山口国家红树林生态自然保护区2004—2015年广州小斑螟发生面积数据,分别选取1月和4月平均气温、降水量4个气候因子,采用C4.5算法在WEKA平台建立决策树模型,预测2016、2017年广州小斑... 将数据挖掘技术引入红树林虫害成因分析中,利用广西山口国家红树林生态自然保护区2004—2015年广州小斑螟发生面积数据,分别选取1月和4月平均气温、降水量4个气候因子,采用C4.5算法在WEKA平台建立决策树模型,预测2016、2017年广州小斑螟发生面积,并检验实际发生情况。结果表明,对广州小斑螟发生影响力由大到小依次为1月降水量,1月平均气温,4月平均气温,4月降水量;该模型分类正确率较高,预测2016、2017年广州小斑螟发生情况与实际情况总体一致。 展开更多
关键词 数据挖掘 C4.5算法 广州小斑螟 气候因素
在线阅读 下载PDF
大数据背景下工程投资估算指标编制方法研究 预览
8
作者 陈志鼎 李鑫 《工程研究:跨学科视野中的工程》 2019年第3期254-264,共11页
在现行估算指标逐渐不能满足市场变化需求的情况下,分析了传统估算指标编制方法目前存在的主要问题,提出一种基于大数据技术的估算指标编制方法。通过分析大数据技术在估算指标编制中的应用过程,提出了一种基于数据挖掘C4.5算法的估算... 在现行估算指标逐渐不能满足市场变化需求的情况下,分析了传统估算指标编制方法目前存在的主要问题,提出一种基于大数据技术的估算指标编制方法。通过分析大数据技术在估算指标编制中的应用过程,提出了一种基于数据挖掘C4.5算法的估算指标编制方法,综合考虑时间因素对指标的影响,利用敏感性分析对估算指标做一定调整,最后通过算例验证了该方法的实用性,对理论与实践应用均有一定的指导作用。 展开更多
关键词 大数据 数据挖掘 C4.5算法 估算指标编制
在线阅读 下载PDF
基于C4.5算法的移动手机客户应用 预览
9
作者 刘欢 苏勇 《计算机与数字工程》 2019年第8期2090-2093,共4页
伴随着科技的越来越发达移动互联网也随即飞速的发展起来,手机用户的规模迅速壮大,中国移动获得了机遇同时也正面临着挑战。稳定客户是移动企业提高竞争力的关键。基于C4.5算法对移动手机用户的业务使用情况和客户流量消费进行数据分析... 伴随着科技的越来越发达移动互联网也随即飞速的发展起来,手机用户的规模迅速壮大,中国移动获得了机遇同时也正面临着挑战。稳定客户是移动企业提高竞争力的关键。基于C4.5算法对移动手机用户的业务使用情况和客户流量消费进行数据分析,找到影响手机用户使用情况的因素以及这些从这些因素反映出来的相关问题。利用基于C4.5算法易于理解,准确率较高的特点,分析出手机客户使用某方面的概率。论文在传统的C4.5算法缺陷及其论证上,借鉴其他改进算法,通过实验证明,该改进算法可以更为准确的来对用户的业务使用情况和客户流量消费,进而挖掘出更多的用户。 展开更多
关键词 C4.5算法 移动客户流量消费 移动手机客户 移动客户预测
在线阅读 下载PDF
基于决策树算法的空气质量预测系统 预览
10
作者 徐旭冉 涂娟娟 《电子设计工程》 2019年第9期39-42,共4页
针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污... 针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污染指数固定数值区间的划分来评估空气质量。而基于决策树算法的空气质量评估模型通过采用自顶向下的递归方式对数据进行处理,把一个无序、无规则的实例集合归纳成一组树形结构表示的分类规则,得到了将所有污染参数作为评估空气质量因素的评估模型,可以有效的避免传统的空气质量预报模型的不灵活、边界值不准确的特点。同时可以根据季节和地区等外部因素构建不同的空气质量预测模型以应对外部因素的变化,从而可以构建完整,精确,现代化的空气质量智能预测系统。 展开更多
关键词 机器学习 决策树 空气质量预测 C4.5算法 信息增益 PYTHON
在线阅读 下载PDF
决策树C4.5算法的改进与分析 预览
11
作者 安葳鹏 尚家泽 《计算机工程与应用》 CSCD 北大核心 2019年第12期169-173,共5页
C4.5算法在选择分裂属性时只考虑了每个条件属性和决策属性之间的关系,而没有考虑到条件属性间的相关性,直接影响构建树的准确率。提出一种基于Kendall和谐系数的C4.5决策树优化算法,用于解决条件属性之间相关性的问题,提高算法属性选... C4.5算法在选择分裂属性时只考虑了每个条件属性和决策属性之间的关系,而没有考虑到条件属性间的相关性,直接影响构建树的准确率。提出一种基于Kendall和谐系数的C4.5决策树优化算法,用于解决条件属性之间相关性的问题,提高算法属性选择的准确性。在引入系数的基础上运用等价无穷小原理对计算公式进行简化,提高了算法的效率。对改进后的C4.5算法和传统的算法进行仿真实验,结果表明,改进的C4.5算法在准确度和效率上都有较大提高。 展开更多
关键词 C4.5算法 Kendall和谐系数 决策树
在线阅读 下载PDF
C4.5算法在高职学生对口就业因素分析中的应用 预览
12
作者 王善勤 吴昌雨 陈业斌 《东莞理工学院学报》 2019年第3期39-45,共7页
针对高职院校专业对口就业率不高的典型问题,进行了毕业生跟踪回访及问卷调查,并以大学期间有无明确的职业规划、是否参加过专业兴趣小组、专注做事及自身性别作为观测点来分析其影响学生专业对口就业情况;构建高职学生对口就业因素分... 针对高职院校专业对口就业率不高的典型问题,进行了毕业生跟踪回访及问卷调查,并以大学期间有无明确的职业规划、是否参加过专业兴趣小组、专注做事及自身性别作为观测点来分析其影响学生专业对口就业情况;构建高职学生对口就业因素分析数据仓库并对数据进行清洗与转换,应用决策树C4.5算法对预处理后的数据进行分析,建立高职学生专业对口就业因素分析的决策树模型,从中抽取出影响高职学生对口就业因素的潜在规则并对其做了验证分析;挖掘出的规则为加强高职学生日常行为引导、专业对口就业提供了有益参考。 展开更多
关键词 数据挖掘 决策树 C4.5算法 对口就业
在线阅读 下载PDF
基于C4.5算法的大学阳光体育系统设计与实现 预览
13
作者 孙莉 《自动化技术与应用》 2019年第7期28-32,共5页
随着中国大学生规模的不断扩大,大学生的数量迅速增加,因此与学生相关的人体测量数据也显著增加,包括学生出勤信息和身体健康测试数据,因此做好数据管理工作是当前高校体育教育发展的必然要求。随着计算机技术的快速发展,数据挖掘技术... 随着中国大学生规模的不断扩大,大学生的数量迅速增加,因此与学生相关的人体测量数据也显著增加,包括学生出勤信息和身体健康测试数据,因此做好数据管理工作是当前高校体育教育发展的必然要求。随着计算机技术的快速发展,数据挖掘技术已被应用于许多领域。本文从阳光体育开始,利用数据挖掘的C4.5算法构建基于学生真实体质健康测试数据的决策树,生成规则和知识。通过对决策树的分析,可以了解影响学生身体健康的重要因素与指标之间的关系,以指导高校适时调整体育教育的管理手段,从而全面提高学生的身体素质。 展开更多
关键词 数据挖掘 阳光体育系统 决策树 C4.5算法
在线阅读 下载PDF
基于决策树算法的棉花产量预测研究 预览
14
作者 南小琴 张泽 +2 位作者 印彩霞 谭红 吕新 《农村科技》 2019年第1期29-35,共7页
为深入挖掘土壤养分与棉花产量之间的潜在关系,提供一定的科学理论依据指导农业生产,本文基于Weka挖掘平台、C4.5决策树算法生成预测模型来预测棉花产量。分析得到:①土壤中有机质、碱解氮、速效钾、有效锌与有效硼对棉花产量有重要影响... 为深入挖掘土壤养分与棉花产量之间的潜在关系,提供一定的科学理论依据指导农业生产,本文基于Weka挖掘平台、C4.5决策树算法生成预测模型来预测棉花产量。分析得到:①土壤中有机质、碱解氮、速效钾、有效锌与有效硼对棉花产量有重要影响;②有效锌含量过高或有效硼含量过高的土壤不利于棉花增产,相反,有效钾、有效硼含量较低的土壤中棉花产量达到中产及中产以上;③不考虑其他养分含量对棉花的影响,当土壤中有机质与碱解氮含量过低时,不利于棉花产量的提高。本文中利用C4.5决策树算法能够简单直观地分析土壤养分因素与棉花产量的关系进行棉花生产的预测,这对棉花生产能够产生一定的指导意义。 展开更多
关键词 土壤养分 棉花产量 决策树 C4.5算法 WEKA
在线阅读 下载PDF
决策树C4.5算法改进与应用 预览 被引量:1
15
作者 陈杰 邬春学 《软件导刊》 2018年第10期88-92,共5页
针对决策树算法c4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各... 针对决策树算法c4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阂值;其次,使用简化的CCP(CostComplexityPruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TMC4.5算法有效。 展开更多
关键词 C4.5 TM -C4.5算法 CCP 贝叶斯分类器 剪枝策略 评价标准
在线阅读 免费下载
决策树几种分类算法的分析比较 预览
16
作者 徐梦茹 王学明 《电脑知识与技术:学术交流》 2018年第7Z期193-195,共3页
对数据的处理一直是现代科技一直在力争攻克的难关.现代社会的数据量每天都在急速增长,那么面临的难关也就会越来越多,例如,如何从海量数据中获取有用的数据,进而将有用的数据转化为'知识'.本文将首先对数据挖掘中决策树分类算... 对数据的处理一直是现代科技一直在力争攻克的难关.现代社会的数据量每天都在急速增长,那么面临的难关也就会越来越多,例如,如何从海量数据中获取有用的数据,进而将有用的数据转化为'知识'.本文将首先对数据挖掘中决策树分类算法中的ID3算法、C4.5算法、CART算法进行详细分析,然后总结出各个算法的优缺点,并提出每种算法应该应用于何种情况之下. 展开更多
关键词 决策树分类算法 ID3算法 C4.5算法 CART算法
在线阅读 下载PDF
面向不完备数据的改进C4.5算法研究 预览 被引量:1
17
作者 沈亮亮 蒙祖强 +1 位作者 张兵 郭英明 《软件导刊》 2018年第6期95-99,共5页
大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处... 大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处理,通过比较数据清洗方法与子集匹配方法的结果,显示即便是在相同清洗规则下,子集匹配方法在算法分类准确率上也更有优势。实验结果证明,在利用C4.5算法进行特征选择时,在该数据子集上对不完备数据进行处理,可以得到较高的分类准确率,同时得到比数据清洗高的时间复杂度。 展开更多
关键词 不完备数据 C4.5算法 分类算法
在线阅读 免费下载
一种基于粒子群算法优化的加权随机森林模型 预览 被引量:6
18
作者 王杰 程学新 彭金柱 《郑州大学学报:理学版》 北大核心 2018年第1期72-76,共5页
随机森林是一种高效的分类算法,其模型中的投票选取机制会导致一些训练精度较低的决策树也拥有相同的投票能力,从而降低准确度,而且模型中的决策树棵数及其他参数通常难以选取.为解决此问题,在投票时将每棵决策树乘以一个与其训练精度... 随机森林是一种高效的分类算法,其模型中的投票选取机制会导致一些训练精度较低的决策树也拥有相同的投票能力,从而降低准确度,而且模型中的决策树棵数及其他参数通常难以选取.为解决此问题,在投票时将每棵决策树乘以一个与其训练精度成正比的权重,并采用粒子群算法优化随机森林模型,通过迭代优化选取模型中包含的参数.通过UCI数据库进行验证,结果显示提出的加权随机森林模型分类正确率高于一般的随机森林算法及传统的分类算法. 展开更多
关键词 随机森林 决策树 C4.5算法 粒子群
在线阅读 免费下载
基于决策树C4.5算法的制造过程质量管理 预览
19
作者 周涛 吉卫喜 宋承轩 《组合机床与自动化加工技术》 北大核心 2018年第12期134-136,141共4页
针对大多数制造业生产过程中对产品质量只注重问题处理,忽略挖掘问题潜在原因,造成质量分析滞后、质量信息利用不充分的问题,引入事先预警的理念,利用决策树C4.5算法,对大量生产加工数据进行挖掘,建立制造质量分析模型,运用该模型挖掘... 针对大多数制造业生产过程中对产品质量只注重问题处理,忽略挖掘问题潜在原因,造成质量分析滞后、质量信息利用不充分的问题,引入事先预警的理念,利用决策树C4.5算法,对大量生产加工数据进行挖掘,建立制造质量分析模型,运用该模型挖掘质量数据中潜在的质量影响因素,找到影响生产的关键因素。文章以滚齿加工过程累积的质量数据来训练检测模型,试验表明,所建模型对数据分类准确率高,满足企业需求,为企业持续改进质量提供决策支持,降低了生产的不合格率。 展开更多
关键词 决策树 C4.5算法 质量管理
在线阅读 下载PDF
基于移动数据的用户出行方式识别研究 预览
20
作者 张鹤鹏 黄达 +2 位作者 杜辰 李晓璐 朱广宇 《交通运输研究》 2018年第6期47-54,共8页
为研究智能手机所采集到的位置数据在识别用户出行方式领域的应用,首先,比选出速度、速度的百分位数、轨迹点数量占比、出行距离、停止率这5个适用于移动终端定位数据区分出行方式的特征变量,并对各特征变量的判别阈值进行了定义。然后... 为研究智能手机所采集到的位置数据在识别用户出行方式领域的应用,首先,比选出速度、速度的百分位数、轨迹点数量占比、出行距离、停止率这5个适用于移动终端定位数据区分出行方式的特征变量,并对各特征变量的判别阈值进行了定义。然后,针对基站分布导致的数据偏差和位置信息漂移等问题,采用扇形定位结合地图匹配技术对数据进行了修正,进而在对时间阈值和距离阈值分割的基础上提出了移动终端用户出行链的获取方法。接着,建立C4.5决策树模型,以此判别移动终端用户的出行方式。最后,基于在某地区采集的7000部移动终端的位置数据(包含:终端编号、定位时刻、经度、纬度)来对用户的出行方式进行研究。结果表明,模型在区分机动车和非机动车时准确率较高,达到了90%以上;在进一步区分中,如区分步行与自行车以及公交车和小汽车的出行上准确率相对较低,但也达到了80%以上的精度。 展开更多
关键词 移动终端 位置数据 出行方式 城市规划 决策树 C4.5算法
在线阅读 免费下载
上一页 1 2 14 下一页 到第
使用帮助 返回顶部 意见反馈