期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
一种带权的混合数据聚类个数确定算法 预览 被引量:2
1
作者 李顺勇 张苗苗 《计算机应用与软件》 北大核心 2019年第1期284-290,共7页
混合数据的聚类过程中通常面临一个不可回避的问题:聚类个数的确定。基于Liang k-prototype算法引入属性权重,重新定义混合数据缺失某类的类间熵和(SBAE_M)、有效性指标(CUM)及相异性度量。提出一种带权的混合数据聚类个数确定算法。该... 混合数据的聚类过程中通常面临一个不可回避的问题:聚类个数的确定。基于Liang k-prototype算法引入属性权重,重新定义混合数据缺失某类的类间熵和(SBAE_M)、有效性指标(CUM)及相异性度量。提出一种带权的混合数据聚类个数确定算法。该算法的基本思想是:用newk-prototype算法将混合数据进行聚类,计算其聚类结果的CUM及SBAE_M,将最坏的类剔除,并将该类中的对象用新的相异性度量进行重新分配,CUM最大时包含的类别数即为聚类个数。在5个UCI数据集上验证了该算法的有效性。 展开更多
关键词 个数 混合数据 属性权重 有效性指标
在线阅读 下载PDF
噪音特征对聚类内部有效性的影响 预览 被引量:2
2
作者 杨虎 付宇 范丹 《计算机科学》 CSCD 北大核心 2018年第7期22-30,52共10页
聚类内部有效性指标是在未知样本真实分类情况下用于评价聚类结果优劣、寻找最佳聚类个数的指标,是聚类分析研究中的重要内容。虽然已有大量的研究分析了聚类内部有效性指标的性能,且有研究结论表明某些内部有效性指标的性能良好,能够... 聚类内部有效性指标是在未知样本真实分类情况下用于评价聚类结果优劣、寻找最佳聚类个数的指标,是聚类分析研究中的重要内容。虽然已有大量的研究分析了聚类内部有效性指标的性能,且有研究结论表明某些内部有效性指标的性能良好,能够辅助聚类算法找到最佳聚类个数,但这些研究未考虑真实数据中的噪音特征对内部有效性指标的影响,研究结论可能会误导内部有效性指标的选取和应用。为此,选取了10种常用的内部有效性指标来研究噪音特征对内部有效性特征选择和聚类结果的影响。结果表明,数据中的噪音特征会影响内部有效性指标的性能,除KL指标、CH指标和CCC指标对噪音特征的反应相对不敏感外,其他内部有效性指标均对噪音特征敏感,且聚类结果的准确性会随着噪音的增强而降低。 展开更多
关键词 内部有效性 噪音特征 个数 准确度
在线阅读 免费下载
基于马氏距离的模糊聚类优化算法——KM-FCM 预览 被引量:1
3
作者 祖志文 李秦 《河北科技大学学报》 CAS 2018年第2期159-165,共7页
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-mean... 为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。 展开更多
关键词 算法理论 模糊 马氏距离 初始优化 个数
在线阅读 下载PDF
基于划分的聚类个数与初始中心的确定方法 预览 被引量:2
4
作者 征原 谢云 《计算机技术与发展》 2017年第7期76-78,82共4页
k均值聚类算法在对数据进行聚类时需要以确定的聚类个数和初始聚类中心为前提,但聚类个数是难以准确给定的,通常随机选取k个样本作为初始聚类中心,由于不同的初始聚类中心可能导致不同的聚类结果,采用随机选取初始聚类中心的方法存... k均值聚类算法在对数据进行聚类时需要以确定的聚类个数和初始聚类中心为前提,但聚类个数是难以准确给定的,通常随机选取k个样本作为初始聚类中心,由于不同的初始聚类中心可能导致不同的聚类结果,采用随机选取初始聚类中心的方法存在着较大的盲目性,造成聚类结果极不稳定。为此,提出了一种基于划分的聚类个数与初始中心点的确定方法。该方法通过对数据空间进行划分,统计每个网格空间中数据点数目作为网格的数据密度,同时计算局部密度极大值的网格个数;按照不同的分度值对数据集进行划分,当局部密度极大值的网格个数趋于相对稳定时,将局部密度极大值的网格个数作为聚类个数,并同时获得聚类初始中心。基于机器学习数据库数据集以及随机生成的人工模拟数据集进行了仿真实验,实验结果表明,所提出的算法有效可行,具有较高的准确性。 展开更多
关键词 K均值 个数 初始中心 划分
在线阅读 下载PDF
拐点估计的改进谱聚类算法 被引量:1
5
作者 张嘉琪 张红云 《小型微型计算机系统》 CSCD 北大核心 2017年第5期1049-1053,共5页
针对现有谱聚类算法不稳定,处理复杂分布数据较困难,需要手动输入聚类个数的问题,利用基于快速搜索和密度峰的聚类算法CFSFDP(Clustering by Fast Search and Find of Density Peaks),提出一种改进的谱聚类算法.本算法首先借鉴... 针对现有谱聚类算法不稳定,处理复杂分布数据较困难,需要手动输入聚类个数的问题,利用基于快速搜索和密度峰的聚类算法CFSFDP(Clustering by Fast Search and Find of Density Peaks),提出一种改进的谱聚类算法.本算法首先借鉴基于流形距离核的谱聚类算法计算数据的低维嵌入,将分布复杂或者类内不存在密度极值。占、的数据转换成类球状的低维嵌入代表点.接着,提出用CFSFDP算法代替基于流形距离核的谱聚类算法中Kmeans算法对低维嵌入进行处理.最后,基于CFSFDP算法的局部密度和距离属性的概念,提出拐点估计方法来自动确定聚类个数,获取聚类结果.实验表明,针对复杂分布的测试数据集,本算法能准确地确定聚类个数,获得很好的聚类效果,同时本算法需要输入的参数较少,且在一定范围内表现出较强的鲁棒性. 展开更多
关键词 个数 CFSFDP 拐点估计
K-means聚类算法中聚类个数的方法研究 预览 被引量:6
6
作者 刘飞 唐雅娟 刘瑶 《电子设计工程》 2017年第15期9-13,共5页
在数据挖掘算法中,K均值聚类算法是一种比较常见的无监督学习方法,簇间数据对象越相异,簇内数据对象越相似,说明该聚类效果越好.然而,簇个数的选取通常是由有经验的用户预先进行设定的参数.本文提出了一种能够自动确定聚类个数,采用SSE... 在数据挖掘算法中,K均值聚类算法是一种比较常见的无监督学习方法,簇间数据对象越相异,簇内数据对象越相似,说明该聚类效果越好.然而,簇个数的选取通常是由有经验的用户预先进行设定的参数.本文提出了一种能够自动确定聚类个数,采用SSE和簇的个数进行度量,提出了一种聚类个数自适应的聚类方法(简称:SKKM).通过UCI数据和仿真数据对象的实验,对SKKM算法进行了验证,实验结果表明改进的算法可以快速的找到数据对象中聚类个数,提高了算法的性能. 展开更多
关键词 K-MEANS算法 个数 初始中心 数据挖掘 K-means算法改进
在线阅读 下载PDF
基于量子谐振子模型的聚类中心选取算法 预览 被引量:5
7
作者 燕京京 王鹏 +1 位作者 范家兵 黄焱 《电子学报》 EI CAS CSCD 北大核心 2016年第2期405-412,共8页
提出了一种基于量子谐振子模型的聚类中心选取算法.该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数及较好的聚类中心点所在的网... 提出了一种基于量子谐振子模型的聚类中心选取算法.该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数及较好的聚类中心点所在的网格;数据读入网格结构之后,算法的处理时间与数据集规模无关.实验结果表明:CCSA-QHOM算法较适合于处理每个子类局部区域的网格密度分布呈单峰特性的数据集的聚类中心选择问题. 展开更多
关键词 中心 量子谐振子 个数 网格 单峰特性
在线阅读 下载PDF
基于局部密度估计的聚类个数确定研究 预览
8
作者 龙章勇 《河南科技》 2016年第9期26-28,共3页
随着人工智能和数据挖掘技术的兴起,聚类分析已被广泛应用于通信、文本数据统计、生物信息学和图像处理中。对于非监督聚类分析,聚类的分类数目是决定聚类质量的关键因素。通常聚类个数事先无法确定,随即选择的初始聚类中心容易使聚类... 随着人工智能和数据挖掘技术的兴起,聚类分析已被广泛应用于通信、文本数据统计、生物信息学和图像处理中。对于非监督聚类分析,聚类的分类数目是决定聚类质量的关键因素。通常聚类个数事先无法确定,随即选择的初始聚类中心容易使聚类结果不稳定。针对此,基于聚类中心具有高局部密度且距高局部密度聚类中心距离较远的特点,提出一种基于局部密度估计的聚类个数的估计方法。经过仿真实验,验证了该算法具有良好的有效性和鲁棒性。 展开更多
关键词 个数 密度峰值估计 有效性 分析
在线阅读 下载PDF
一种基于先验信息的混合数据聚类个数确定算法 预览 被引量:1
9
作者 庞天杰 赵兴旺 《计算机科学》 CSCD 北大核心 2016年第2期101-104,共4页
聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验... 聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验信息的混合数据聚类个数确定算法。实验证明,该算法是有效的。 展开更多
关键词 分析 个数 混合数据 先验信息 最大最小距离
在线阅读 免费下载
基于改进k-medoids算法的XML文档聚类 预览 被引量:2
10
作者 冯少荣 潘炜炜 林子雨 《计算机工程》 CAS CSCD 北大核心 2015年第9期56-62,共7页
XML文档由于其自身的可扩展性、半结构化和自描述性等特点,已成为数据表示和交换的数据格式标准。一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间,提高数据查询的效率,挖掘出潜在的信息价值。为此,提出一种改进的k—medo... XML文档由于其自身的可扩展性、半结构化和自描述性等特点,已成为数据表示和交换的数据格式标准。一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间,提高数据查询的效率,挖掘出潜在的信息价值。为此,提出一种改进的k—medoids算法对XML文档进行聚类。运用模糊聚类方法确定聚类个数,利用遗传算法的全局最优的搜索能力求解最佳聚类中心点或质心,从而提高大规模XML文档集的聚类质量。实验结果表明,与基于传统k—medoids算法的聚类方法相比,改进的聚类方法具有较高的聚类准确性和收敛度。 展开更多
关键词 XML文档 遗传算法 模糊 k-medoids 个数 中心
在线阅读 下载PDF
并行的中心点优化选取遥感影像聚类算法 预览 被引量:1
11
作者 潘欣 孙宏彬 《吉林大学学报:信息科学版》 2015年第4期441-448,共8页
为了解决遥感影像聚类个数及中心点选取的问题,提出了一种并行的中心矢量优化选取的遥感影像聚类算法(PCVOS:Parallelized Center Vector Optimized Selection Algorithm for Remote Sensing Image Cluster).该算法引入模糊评价目标... 为了解决遥感影像聚类个数及中心点选取的问题,提出了一种并行的中心矢量优化选取的遥感影像聚类算法(PCVOS:Parallelized Center Vector Optimized Selection Algorithm for Remote Sensing Image Cluster).该算法引入模糊评价目标函数并给出了一种染色体评价机制,提高聚类染色体在类目、空间划分的多样性;同时引入MPI(Massage Passing Interface)多进程并行技术,加快了算法运行速度.实验结果表明,相对于传统的K-Means、ISODATA(Iterative Self Organizing Data Analysis Techniques Algorithm)和ACDE(Automatic Clustering Differential Evolution)算法,PCVOS不但可以获得更好的聚类效果,而且可以充分利用并行资源加快算法运行速度. 展开更多
关键词 遥感影像 个数 并行计算 优化选择
在线阅读 下载PDF
一种层次初始的聚类个数自适应的聚类方法研究 预览 被引量:5
12
作者 魏建东 陆建峰 彭甫镕 《电子设计工程》 2015年第6期5-8,共4页
K均值聚类算法是一种常见且有效的基于划分的聚类算法。为解决该聚类算法对初始中心敏感的问题,常用的方法是层次化初始聚类中心。然而,层次初始的聚类算法仍然需要将聚类个数作为输入参数,在高维数据和海量数据中不易应用。基于能够自... K均值聚类算法是一种常见且有效的基于划分的聚类算法。为解决该聚类算法对初始中心敏感的问题,常用的方法是层次化初始聚类中心。然而,层次初始的聚类算法仍然需要将聚类个数作为输入参数,在高维数据和海量数据中不易应用。基于能够自动确定聚类数目的目的,采用DBI度量,提出一种层次初始的聚类个数自适应的聚类方法(简称DHIKM)。通过UCI数据集和仿真数据上的实验,证明DHIKM可以在采样数据中快速找到合适的聚类个数,实验结果表明该算法在聚类质量与收敛速度上的有效性。 展开更多
关键词 K均值算法 层次初始化 戴维森堡丁指数 初始中心 个数
在线阅读 下载PDF
一种图像分割聚类数自适应计算方法
13
作者 包翔 宋余庆 +2 位作者 刘哲 刘毅 郑明杰 《小型微型计算机系统》 CSCD 北大核心 2015年第8期1878-1881,共4页
聚类理论是进行图像分割时的一种常用工具,然而多数聚类算法不能自动确定合适的聚类个数.提出一种基于高斯核密度函数的图像分割聚类数自适应计算方法.首先运用尺度空间滤波理论得到相应图像灰度值核密度函数的指纹图,然后运用高斯滤波... 聚类理论是进行图像分割时的一种常用工具,然而多数聚类算法不能自动确定合适的聚类个数.提出一种基于高斯核密度函数的图像分割聚类数自适应计算方法.首先运用尺度空间滤波理论得到相应图像灰度值核密度函数的指纹图,然后运用高斯滤波理论得到滤波之后的核密度函数,再根据其与原核密度函数的相似程度得到聚类个数,最后将其作为核模糊聚类算法的初始参数进行分割.我们利用聚类标准I指标对分割结果进行评价,结果表明,该方法能准确地确定图像的初始聚类个数,并能达到更好的分割效果. 展开更多
关键词 图像分割 个数 尺度空间滤波 指纹图 高斯滤波理论
改进的层次K均值聚类算法 预览 被引量:46
14
作者 胡伟 《计算机工程与应用》 CSCD 2013年第2期157-159,共3页
针对传统K均值聚类方法采用聚类前随机选择聚类个数K而导致的聚类结果不理想的问题,结合空间中的层次结构,提出一种改进的层次K均值聚类算法。该方法通过初步聚类,判断是否达到理想结果,从而决定是否继续进行更细层次的聚类,如此... 针对传统K均值聚类方法采用聚类前随机选择聚类个数K而导致的聚类结果不理想的问题,结合空间中的层次结构,提出一种改进的层次K均值聚类算法。该方法通过初步聚类,判断是否达到理想结果,从而决定是否继续进行更细层次的聚类,如此迭代执行,从而生成一棵层次型K均值聚类树,在该树形结构上可以自动地选择聚类的个数。标准数据集上的实验结果表明,与传统的世均值聚类方法相比,提出的改进的层次聚类方法的确能够取得较优秀的聚类效果。 展开更多
关键词 K均值 个数 层次结构 层次K均值算法
在线阅读 下载PDF
谱聚类算法中的奇异解问题 预览
15
作者 丛勤 《自动化与信息工程》 2013年第2期6-9,32共5页
对谱聚类的奇异解进行了研究。在谱聚类中,由对象相似度的定义,两种属性完全不同或截然相反的对象的类,其类内对象的相似度、类间对象的相似度和与其它类对象的相似度,会出现接近或相同的情况,从而有可能被聚为一类。研究发现,大多数情... 对谱聚类的奇异解进行了研究。在谱聚类中,由对象相似度的定义,两种属性完全不同或截然相反的对象的类,其类内对象的相似度、类间对象的相似度和与其它类对象的相似度,会出现接近或相同的情况,从而有可能被聚为一类。研究发现,大多数情况下,出现谱聚类的奇异解的主要原因是聚类个数设置不合理和高斯核参数σ估计不准确。本文给出了利用特征值差值分析与特征值累积贡献率来确定聚类个数和估计高斯核参数σ的方法。实验表明,所给聚类个数选择和高斯核参数σ估计的方法有效,可以消除谱聚类结果中存在的奇异解。 展开更多
关键词 奇异解 特征向量 个数
在线阅读 下载PDF
一种新的K—means最佳聚类数确定方法 预览 被引量:7
16
作者 韩凌波 《现代计算机:上下旬》 2013年第20期12-15,共4页
在传统的K-means算法中,聚类数K是随机给定的,K值选取不合理会造成K—meall$算法陷入局部最优。针对这个缺点,提出一种新的K—means聚类数确定方法,根据聚类算法中类内相似度最大差异度最小和类问差异度最大相似度最小的基本原则.... 在传统的K-means算法中,聚类数K是随机给定的,K值选取不合理会造成K—meall$算法陷入局部最优。针对这个缺点,提出一种新的K—means聚类数确定方法,根据聚类算法中类内相似度最大差异度最小和类问差异度最大相似度最小的基本原则.提出距离评价函数作为最佳聚类数的检验函数,建立相应的数学模型,并通过实例结果进一步验证新算法的有效性。 展开更多
关键词 K-MEANS算法 个数 距离评价函数
在线阅读 免费下载
K-均值算法中聚类个数优化问题研究 预览 被引量:12
17
作者 韩凌波 《四川理工学院学报:自然科学版》 CAS 2012年第2期 77-80,共4页
在传统的K-均值聚类算法中,聚类数K必须事先给定,然而,实际中K值很难被精确的确定,K值是否合理直接影响着K-均值算法的好坏。针对这个缺点,提出一种优化聚类数算法,根据聚类算法中类内相似度最大差异度最小和类间差异度最大相似度最小... 在传统的K-均值聚类算法中,聚类数K必须事先给定,然而,实际中K值很难被精确的确定,K值是否合理直接影响着K-均值算法的好坏。针对这个缺点,提出一种优化聚类数算法,根据聚类算法中类内相似度最大差异度最小和类间差异度最大相似度最小的基本原则,构建了距离评价函数F(S,K)作为最佳聚类数的检验函数,建立了相应的数学模型,并通过仿真实验进一步验证了新算法的有效性。 展开更多
关键词 K-均值算法 个数 距离价值函数
在线阅读 免费下载
一种基于Divide—and—Merge聚类算法的改进算法 预览
18
作者 黄智武 张东站 段江娇 《现代计算机:下半月版》 2010年第5期 4-8,共5页
BNAK-Divide—and—Merge聚类算法是基于David等人提出的Divide—and-Merge算法的一种改进算法。Divide-and-Merge算法是一种将自顶向下的分裂方法和自底向上的聚合方法相结合的聚类算法。虽然这个聚类算法已经通过众多实验表明其聚类... BNAK-Divide—and—Merge聚类算法是基于David等人提出的Divide—and-Merge算法的一种改进算法。Divide-and-Merge算法是一种将自顶向下的分裂方法和自底向上的聚合方法相结合的聚类算法。虽然这个聚类算法已经通过众多实验表明其聚类的效率和质量。但是它在数据集很大的情况下分裂会很耗时间和空间资源.并且它需要阔值来确定聚类个数的方法也不是很理想。针对以上两个主要不足,对原算法进行改进。 展开更多
关键词 算法 分裂方法 合方法 时间和空间资源 个数
在线阅读 免费下载
符号数据最佳聚类个数的确定方法 预览
19
作者 赵兴旺 梁吉业 曹付元 《广西师范大学学报:自然科学版》 CAS 北大核心 2009年第3期 130-133,共4页
在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。结合划分和层次聚类的思想,提出... 在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法。在UCI数据集上的实验结果表明该方法是有效的。 展开更多
关键词 K-Modes算法 个数 初始中心 划分 层次
在线阅读 下载PDF
基于最小树切割的自适应聚类方法 预览 被引量:2
20
作者 李玉鑑 《北京工业大学学报》 CAS CSCD 北大核心 2007年第3期 331-336,共6页
为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边。对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是... 为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边。对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是唯一的。对它的递归调用还可在若干不同粒度层次上形成数据集的聚类结构.计算实验表明,MSTCA不仅能为具有各种不同聚类形状的数据集自适应地选择较好的聚类个数,而且只需简单的参数选择就能准确地分析出数据中存在的合理聚类和例外样本. 展开更多
关键词 最小树 阈值切割 算法 个数 层次
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部 意见反馈