期刊文献+
共找到30,140篇文章
< 1 2 250 >
每页显示 20 50 100
k近邻约束的稀疏子空间聚类 预览
1
作者 刘玉馨 何光辉 《计算机工程与应用》 CSCD 北大核心 2019年第3期39-45,共7页
稀疏子空间聚类是近年提出的高维数据聚类框架,针对实际数据并不完全满足线性子空间模型的假设,提出k近邻约束的稀疏子空间聚类算法。该算法结合数据的子空间结构,k近邻及距离信息,在稀疏子空间模型上,添加k近邻约束项。添加的约束项符... 稀疏子空间聚类是近年提出的高维数据聚类框架,针对实际数据并不完全满足线性子空间模型的假设,提出k近邻约束的稀疏子空间聚类算法。该算法结合数据的子空间结构,k近邻及距离信息,在稀疏子空间模型上,添加k近邻约束项。添加的约束项符合距离越小,相似系数越大的直观认识且不改变系数矩阵的稀疏性。在人脸数据集Extended YaleB、ORL、AR,物体图像数据集COIL20及手写数据集USPS上的聚类实验表明提出的算法具有良好的性能。 展开更多
关键词 子空间 稀疏表示 K近邻 人脸
在线阅读 下载PDF
基于密度最大值聚类的奶酪风味鉴别模型 预览
2
作者 干佳俪 谭励 +2 位作者 宁晓辉 王蓓 孙践知 《中国乳品工业》 CAS 北大核心 2019年第2期10-14,共5页
针对传统的食品风味鉴别方法具有的局限性、食品种类比较单一,并不能覆盖所有食品类别,主成分分析方法在奶酪样本上表现效果较差,无法准确快速区分不同风味奶酪,本研究基于密度最大值聚类算法提出了一种鉴别奶酪风味的模型,该模型首先... 针对传统的食品风味鉴别方法具有的局限性、食品种类比较单一,并不能覆盖所有食品类别,主成分分析方法在奶酪样本上表现效果较差,无法准确快速区分不同风味奶酪,本研究基于密度最大值聚类算法提出了一种鉴别奶酪风味的模型,该模型首先用改进的密度最大值聚类算法对风味物质进行聚类,自动获取聚类中心形成具有风味表征的特征,然后利用支持向量机算法进行分类鉴别。结果表明,通过改进的密度最大值聚类算法得到风味物质特征后,分类器模型更加稳健,均适用于切达奶酪和马苏里拉奶酪的类别鉴定,准确率均在95%以上,高于原始特征、DBSCAN聚类特征、K-means聚类特征的分类结果。 展开更多
关键词 密度最大值 SVM算法 机器学习
在线阅读 下载PDF
不同聚类算法在Wi-Fi定位中的研究 预览
3
作者 陈蕾 《智能计算机与应用》 2019年第2期78-81,88共5页
本文比较分析了K-means聚类、蚁群聚类和DBSCAN聚类三种聚类算法在室内定位系统中的应用,通过比较3种算法分别与基于Wi-Fi信号接收强度的支持向量机回归算法室内定位模型相结合定位的仿真实验,发现K-means和DBSCAN聚类算法均优于蚁群聚... 本文比较分析了K-means聚类、蚁群聚类和DBSCAN聚类三种聚类算法在室内定位系统中的应用,通过比较3种算法分别与基于Wi-Fi信号接收强度的支持向量机回归算法室内定位模型相结合定位的仿真实验,发现K-means和DBSCAN聚类算法均优于蚁群聚类算法,且两者定位结果相差不大。考虑到DBSCAN聚类算法可以去除噪音点,将DBSCAN聚类与K-means聚类算法混合分析后,再与定位模型结合,获得更好的定位效果。 展开更多
关键词 K -means DBSCAN 室内定位
在线阅读 免费下载
基于Spark平台的K-means算法的设计与优化 预览
4
作者 王义武 杨余旺 +2 位作者 于天鹏 沈兴鑫 李猛坤 《计算机技术与发展》 2019年第3期72-76,共5页
聚类中心需要手动设置是K-means算法最大的问题,而通常情况是并不能确定现实中数据的分类情况。为了解决这一问题,提出了一种新的OCC K-means算法。不同于传统算法以随机选择的方式产生聚类中心,该算法进行必要的预处理,利用UPGMA和最... 聚类中心需要手动设置是K-means算法最大的问题,而通常情况是并不能确定现实中数据的分类情况。为了解决这一问题,提出了一种新的OCC K-means算法。不同于传统算法以随机选择的方式产生聚类中心,该算法进行必要的预处理,利用UPGMA和最大最小距离算法对数据点进行筛选,得到可以反映数据分布特征的点,并作为初始的聚类中心,以提高聚类的精度。从两次的实验结果可以对比出,在不同的数据集上,改进算法在衡量聚类效果的准确率、召回率、F-测量值上的表现要优于传统K-means算法。这是因为OCC算法选择的中心点来自于不同的且数据密集的区域,并在筛选的过程中排除了噪声数据、边缘数据对实验的干扰;同时为了契合大数据发展潮流,使用Scala语言在Spark平台进行了并行化实现,提高了算法处理海量数据的能力,并通过实验指标验证了算法具有良好的并行化能力。 展开更多
关键词 中心 K-MEANS 最大最小距离算法 非加权组平均法
在线阅读 下载PDF
融合K-means和CFSFDP的聚类算法 预览
5
作者 李新运 王嘉梅 +1 位作者 张晨阳 王儒 《福建电脑》 2019年第3期1-5,共5页
在K-means算法中,初始k值和初始聚类中心对聚类结果都有影响。针对K-means算法存在的问题,提出一种K-means算法与聚类的快速搜索和发现密度峰算法结合的聚类算法(K-CFSFDP)。该算法思想:先采用CFSFDP算法得到每个数据点的ρ_i和δ_i并... 在K-means算法中,初始k值和初始聚类中心对聚类结果都有影响。针对K-means算法存在的问题,提出一种K-means算法与聚类的快速搜索和发现密度峰算法结合的聚类算法(K-CFSFDP)。该算法思想:先采用CFSFDP算法得到每个数据点的ρ_i和δ_i并将其作为数据新的特征向量,再次使用CFSFDP算法,对新的ρ_i进行升序排列,以斜率的变化自动选择聚类中心点;再运用K-means算法进行迭代聚类。该算法在UCI数据集上能够又好又快又稳定的聚类。 展开更多
关键词 斜率变化 初始中心 K均值算法 快速峰值搜索算法
在线阅读 下载PDF
数据质量聚类算法
6
作者 李延 王大魁 +1 位作者 耿晶 王树良 《武汉大学学报:信息科学版》 EI CSCD 北大核心 2019年第1期153-158,共6页
在聚类算法中,聚类中心决定聚类的最终结果,而传统的分割聚类算法不能准确定位聚类中心。根据数据场提出了数据质量聚类中心的新概念,给出数据质量聚类算法,能够一次定位聚类中心,无需迭代,也无需预置聚类个数。7组对比实验表明,提出的... 在聚类算法中,聚类中心决定聚类的最终结果,而传统的分割聚类算法不能准确定位聚类中心。根据数据场提出了数据质量聚类中心的新概念,给出数据质量聚类算法,能够一次定位聚类中心,无需迭代,也无需预置聚类个数。7组对比实验表明,提出的方法能够准确定位聚类中心,获得良好的聚类结果和稳定性,优于传统的分割聚类算法和峰值密度聚类算法。 展开更多
关键词 数据场 数据质量 中心
基于空谱联合聚类的改进核协同高光谱异常检测 预览
7
作者 马世欣 刘春桐 +2 位作者 李洪才 何祯鑫 王浩 《光子学报》 EI CAS CSCD 北大核心 2019年第1期155-165,共11页
针对空谱信息中普遍存在的异常干扰现象,提出了基于空谱联合聚类的自适应核协同表示高光谱异常目标探测算法.算法充分发挥了基于密度的聚类算子(Density-Based Spatial Clustering of Applications with Noise, DBSCAN)对于异常点的筛... 针对空谱信息中普遍存在的异常干扰现象,提出了基于空谱联合聚类的自适应核协同表示高光谱异常目标探测算法.算法充分发挥了基于密度的聚类算子(Density-Based Spatial Clustering of Applications with Noise, DBSCAN)对于异常点的筛选特性,在DBSCAN聚类去除异常波谱的基础上,采用分波段子集随机投影变换对数据降维处理,以减少谱噪声和谱冗余,并采用DBSCAN聚类消除了局部背景像元中的杂乱点对协同探测算法结果的干扰.研究了背景离散度对核参选择的影响,比较了不同的核估计方法,并提出基于平均差的自适应核协同算法.采用该方法对AVIRIS和ROSIS的三组数据进行仿真实验并与现有算法进行了对比,结果表明该算法表现出较好的探测性能. 展开更多
关键词 高光谱 异常探测 基于密度的算子 自适应核 联合表示理论
在线阅读 免费下载
自动确定聚类中心的移动时间势能聚类算法 预览
8
作者 陆慎涛 葛洪伟 周竞 《南京大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期143-153,共11页
移动时间层次聚类(Travel-Time based Hierarchical Clustering,TTHC)是一种新的势能聚类算法,尽管具有较好的聚类效果,但是该算法需要人工设定聚类数目,而且在分配样本的时候仅根据相似度,忽略了距离和势能的影响.针对以上问题,提出一... 移动时间层次聚类(Travel-Time based Hierarchical Clustering,TTHC)是一种新的势能聚类算法,尽管具有较好的聚类效果,但是该算法需要人工设定聚类数目,而且在分配样本的时候仅根据相似度,忽略了距离和势能的影响.针对以上问题,提出一种自动确定聚类中心的移动时间势能聚类算法.首先计算每个数据点的势能和相似度,然后根据相似度确定数据点的父节点,得到数据点与父节点的距离;然后,根据数据点与父节点的相似度、距离和数据点的势能得到综合考量值,根据综合考量值自动确定聚类中心;最后,将剩余数据点分配到比其势能小且与其相似度最大的数据点所属类簇,得到聚类结果.将新算法与TTHC算法进行比较,在人工数据集和真实数据集上的实验结果表明,新算法不仅能够自动确定聚类数目,而且采用了更优的分配机制,可以产生更好的聚类结果. 展开更多
关键词 TTHC 移动时间 自动确定数目
在线阅读 免费下载
基于大数据下K-means聚类算法的在线学习行为路径应用研究 预览
9
作者 刘思宏 余飞 《兰州文理学院学报:自然科学版》 2019年第1期70-74,共5页
大数据在混合式教学分析中的应用愈来愈多.本文论述聚类方法K-means算法的基本思想,利用K-means聚类算法对学生在线学习行为路径采集数据进行聚类分析,得到学生在线学习的行为路径,挖掘大数据下的学生学习行为习惯,从而为教师进行混合... 大数据在混合式教学分析中的应用愈来愈多.本文论述聚类方法K-means算法的基本思想,利用K-means聚类算法对学生在线学习行为路径采集数据进行聚类分析,得到学生在线学习的行为路径,挖掘大数据下的学生学习行为习惯,从而为教师进行混合式教学带来参考信息. 展开更多
关键词 大数据 K-MEANS算法 学习行为路径
在线阅读 下载PDF
基于LDA的信息资源挖掘与可视化研究 预览
10
作者 丁玲 叶佳鑫 曾婷 《数字图书馆论坛》 CSSCI 2019年第2期29-36,共8页
LDA(Latent Dirichet Allocation)是一种从文档资源中抽取主题的概率模型,将其用于文档的主题提取通常具有不错的效果。档案信息资源是一种具有较高利用价值的文档资源,但其目前存在碎片化、建设不足等问题。基于此,本文将LDA与聚类、... LDA(Latent Dirichet Allocation)是一种从文档资源中抽取主题的概率模型,将其用于文档的主题提取通常具有不错的效果。档案信息资源是一种具有较高利用价值的文档资源,但其目前存在碎片化、建设不足等问题。基于此,本文将LDA与聚类、层次空间构建技术相结合应用于档案信息资源建设,并进行实证研究。从实验结果来看,将LDA应用于档案信息资源建设可以挖掘资源间的隐含联系,明确资源间的等级层次,并有助于信息资源的可视化展示。 展开更多
关键词 信息资源建设 主题提取 层次空间
在线阅读 下载PDF
基于知识元的中文文本层级分割
11
作者 王忠义 沈雪莹 黄京 《图书情报工作》 CSSCI 北大核心 2019年第7期105-115,共11页
[目的/意义]为帮助用户检索到完整的、粒度大小适当的知识单元,满足用户多粒度的知识需求。[方法/过程]提出一种基于知识元的文本层级分割方法。该方法首先对知识元的类型及其描述规则进行分析;然后依据知识元描述规则识别实体资源中的... [目的/意义]为帮助用户检索到完整的、粒度大小适当的知识单元,满足用户多粒度的知识需求。[方法/过程]提出一种基于知识元的文本层级分割方法。该方法首先对知识元的类型及其描述规则进行分析;然后依据知识元描述规则识别实体资源中的各类型知识元,并将所有的知识元和知识元之间的衔接句视为一个类;最后基于fisher分割算法对该类进行逐级二分,直到识别出所有的主题为止,确定分割边界,实现文本层级分割。[结果/结论]基于知识元的中文文本层级分割方法,一方面使得文本分割单元从句子扩展为知识元,提高分割时的效率,另一方面将知识服务的控制单元从文献深入到以知识元、知识元集合为单位的知识块,按需为用户提供相关知识服务,使数据检索、信息检索向知识检索迈进,提高知识获取效率,实现信息服务向知识服务的转型。 展开更多
关键词 知识元识别 层级分割
基于百度贴吧的学习者群体挖掘研究 预览
12
作者 金涛 丁国栋 焦清局 《中国教育信息化》 2019年第7期57-62,共6页
随着线上学习者数量的增多,网络学习社区成为众多学习者寻求帮助、共享资源的重要学习平台。虽然向社区中的学习者推荐学习伙伴一定程度上能够解决学习者学习需求,但存在一定的缺陷。文章尝试性地提出了学习群体推荐新思路,并给出了一... 随着线上学习者数量的增多,网络学习社区成为众多学习者寻求帮助、共享资源的重要学习平台。虽然向社区中的学习者推荐学习伙伴一定程度上能够解决学习者学习需求,但存在一定的缺陷。文章尝试性地提出了学习群体推荐新思路,并给出了一种可供参考的简便方法。以百度贴吧为例,利用网络爬虫和社会网络分析软件gephi对贴吧中的会员进行了兴趣聚类,发现了该贴吧中存在的兴趣群体,并得到了各群体的兴趣特点,证明此方法的可行性。 展开更多
关键词 百度贴吧 学习群体 学习社区 gephi
在线阅读 下载PDF
基于对偶图正则化的多层概念分解算法 预览
13
作者 张显 叶军 《计算机应用研究》 CSCD 北大核心 2019年第2期636-640,共5页
为了进一步挖掘数据间的隐藏信息,在多层概念分解算法的框架下,考虑每一层分解下的数据流形和特征流形,提出了一种基于对偶图正则化的多层概念分解算法。该算法通过对数据的逐层分解,以分层的方式学习,并在每一层分解数据中构建数据空... 为了进一步挖掘数据间的隐藏信息,在多层概念分解算法的框架下,考虑每一层分解下的数据流形和特征流形,提出了一种基于对偶图正则化的多层概念分解算法。该算法通过对数据的逐层分解,以分层的方式学习,并在每一层分解数据中构建数据空间和特征属性空间的拉普拉斯图,用于反映数据流形和特征流形的多元几何结构信息,从而能够更好地从复杂数据中提取出更有效的特征。采用交替迭代的方法求解算法的目标函数并证明了算法的收敛性。通过在三个真实数据库(TDT2、PIE、COIL20)上的实验表明,该方法在数据的聚类表示效果方面优于其他方法。 展开更多
关键词 概念分解 多层分解 对偶回归 流形学习
在线阅读 下载PDF
融合时间序列与多尺度特征的虚假评论识别方法 预览
14
作者 狄瑞彤 王红 房有丽 《计算机工程》 CAS CSCD 北大核心 2019年第3期278-285,292共9页
结合时间序列与多尺度特征,提出一种改进的虚假评论识别方法。考虑时间因素对评分及其分布的影响,构建基于多维时间序列的虚假评论识别模型提取异常评论特征,并对异常评论特征进行层次划分,根据多尺度特征思想获取基准尺度特征及细分尺... 结合时间序列与多尺度特征,提出一种改进的虚假评论识别方法。考虑时间因素对评分及其分布的影响,构建基于多维时间序列的虚假评论识别模型提取异常评论特征,并对异常评论特征进行层次划分,根据多尺度特征思想获取基准尺度特征及细分尺度特征。采用基于密度峰值的聚类算法识别虚假评论,并提高虚假评论识别模型的抗噪能力。实验结果表明,与基于基准尺度特征和多尺度特征的密度峰值聚类虚假评论识别方法相比,该方法的AUC值达到92%,虚假评论识别正确率更高。 展开更多
关键词 虚假评论 时间序列 多尺度 主成分分析
在线阅读 下载PDF
一种聚类隐马尔可夫模型的时空轨迹预测算法
15
作者 孙红 陈锁 《小型微型计算机系统》 CSCD 北大核心 2019年第3期472-476,共5页
随着'互联网+'的高速发展,大数据的不断产生,人们对时空轨迹的数据分析也越来越多.本文针对海量的用户轨迹数据进行研究,提出一种基于分区域的隐马尔可夫模型用以解决时空轨迹序列的预测问题.该模型首先通过聚类将一片区域内的... 随着'互联网+'的高速发展,大数据的不断产生,人们对时空轨迹的数据分析也越来越多.本文针对海量的用户轨迹数据进行研究,提出一种基于分区域的隐马尔可夫模型用以解决时空轨迹序列的预测问题.该模型首先通过聚类将一片区域内的时空序列分成多个小区域,每个小区域内再通过聚类确定多个隐状态和发射序列,然后针对每个小区域进行隐马尔可夫模型的训练得出最终模型.预测时通过已知的时空序列,找到对应的区域模型,通过维特比算法计算出最佳隐状态序列,再结合转移矩阵做出下一个轨迹点的预测.实验表明,该模型具有较高的学习速度,且预测精度较高. 展开更多
关键词 时空轨迹序列 隐马尔可夫模型 子区域
iBTC:一种基于独立森林的移动对象轨迹聚类算法 预览
16
作者 张怀峰 皮德常 董玉兰 《计算机科学》 CSCD 北大核心 2019年第1期251-259,共9页
移动对象轨迹聚类在城市规划、公共空间设计、移动对象行为预测等领域具有重要的理论指导意义和实际应用价值。针对传统聚类算法(如k-means,DBSCAN)在移动对象轨迹方面聚类效果不佳的问题,提出一种新的轨迹聚类算法iBTC。该算法首先对... 移动对象轨迹聚类在城市规划、公共空间设计、移动对象行为预测等领域具有重要的理论指导意义和实际应用价值。针对传统聚类算法(如k-means,DBSCAN)在移动对象轨迹方面聚类效果不佳的问题,提出一种新的轨迹聚类算法iBTC。该算法首先对轨迹进行分段,根据最小描述长度原理,将轨迹分段问题转换为求无向图的最短路径问题,使用Dijkstra算法求得轨迹的最佳分段;然后将轨迹聚类问题转换为一种特殊的异常检测问题,并基于独立森林的思想,使用细分-合并过程对轨迹数据进行聚类;最后在模拟数据集和监控视频记录的行人轨迹公开数据集上进行实验,结果表明该算法能够取得较好的聚类效果。 展开更多
关键词 移动对象 独立森林 轨迹分段
在线阅读 免费下载
基于聚类改进的Fisher与KNN判别分类算法对比研究 预览
17
作者 朱景福 李芳 鹿保鑫 《安徽农业科学》 CAS 2019年第1期250-252,257共4页
大米中矿物元素种类多(38种),为了快速、准确地筛选出判别大米产地的有效指标,在分析大米矿物元素含量相关性的基础上,进行了大米产地判别分类算法对比实验。首先通过R型聚类方法将大米矿物元素样本进行分块,然后从每一类中选取数据再进... 大米中矿物元素种类多(38种),为了快速、准确地筛选出判别大米产地的有效指标,在分析大米矿物元素含量相关性的基础上,进行了大米产地判别分类算法对比实验。首先通过R型聚类方法将大米矿物元素样本进行分块,然后从每一类中选取数据再进行Fisher与KNN判别分类对比,这样可以改进传统算法中剪辑样本带来的判别误差,又大大降低了无效的计算量。实验表明,基于聚类选出一种元素最优组合方案,采用23种矿物元素进行Fisher判别的分类率达86.76%,此方法准确高效地降低了计算机的运算量,提高了判别分类速度。 展开更多
关键词 FISHER判别 KNN判别 算法对比
在线阅读 下载PDF
推荐算法概述 预览
18
作者 张世东 《科技传播》 2019年第4期197-198,共2页
当前推荐系统已经有着广泛的应用,文章简要概述了推荐系统常用的协同过滤的推荐算法、基于内容的推荐算法及聚类推荐算法,举例说明了3种常用算法评估指标,结合实际体验介绍了推荐算法在现实中的应用情况,最后对推荐算法的未来应用进行... 当前推荐系统已经有着广泛的应用,文章简要概述了推荐系统常用的协同过滤的推荐算法、基于内容的推荐算法及聚类推荐算法,举例说明了3种常用算法评估指标,结合实际体验介绍了推荐算法在现实中的应用情况,最后对推荐算法的未来应用进行了展望。 展开更多
关键词 推荐算法 协同过滤 评估指标
在线阅读 下载PDF
基于聚类和XGboost算法的心脏病预测 预览
19
作者 刘宇 乔木 《计算机系统应用》 2019年第1期228-232,共5页
过去十几年来,心脏病发病率在全球一直呈上升趋势且居高不下.所以,如果可以通过计算机手段提取人体相关的体检指标,且通过机器学习的方式来分析不同特征及其权值对于心脏病的影响,对于预测和预防心脏病将起到很关键的作用.因此本文提出... 过去十几年来,心脏病发病率在全球一直呈上升趋势且居高不下.所以,如果可以通过计算机手段提取人体相关的体检指标,且通过机器学习的方式来分析不同特征及其权值对于心脏病的影响,对于预测和预防心脏病将起到很关键的作用.因此本文提出一个基于聚类和XGboost算法的预测方法.通过对数据的预处理,区分特征,再通过聚类算法如K-means对数据集聚类分块.最后用XGboost算法进行预测分析.实验结果表明,所提出的基于聚类和XGboost算法的预测方法的可行性和有效性,为就医推荐等应用提供了精准有效的帮助. 展开更多
关键词 心脏病预测 机器学习 K-MEANS XGboost
在线阅读 下载PDF
基于光照不变特征的无模式跟踪算法 预览
20
作者 姜可孟 曾聪文 江泽涛 《计算机工程与设计》 北大核心 2019年第1期161-166,共6页
针对传统的特征点在目标追踪算法中鲁棒性不强和基于先验知识的目标追踪算法模型漂移的问题,提出一种基于光照不变特征的无模式跟踪算法。采用无模式追踪的思想,利用敏感直方图提取二值化的光照不变特征,用双向光流跟踪和全局匹配算法... 针对传统的特征点在目标追踪算法中鲁棒性不强和基于先验知识的目标追踪算法模型漂移的问题,提出一种基于光照不变特征的无模式跟踪算法。采用无模式追踪的思想,利用敏感直方图提取二值化的光照不变特征,用双向光流跟踪和全局匹配算法进行筛选得到稳定特征点,根据特征点的投票结果进行聚类确定目标中心,实现目标追踪。通过实验验证了该方法在光照变换、部分遮挡、运动模糊等情况下都表现出较好的追踪效果和鲁棒性。 展开更多
关键词 目标跟踪 光照不变特征 局部敏感直方图 无模式跟踪
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部 意见反馈