期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于关联挖掘的图情类主要期刊参考文献分析
1
作者 李海林 叶益 杨丽彬 《情报科学》 CSSCI 北大核心 2019年第6期87-95,共9页
【目的/意义】鉴于参考文献在期刊论文发表过程中的重要性,提出基于关联规则的期刊论文参考文献分析研究,探究图书情报学领域学科结构现状及参考文献选择路径中的潜在知识信息。【方法/过程】以图情学领域八种主要期刊为研究对象,获取其... 【目的/意义】鉴于参考文献在期刊论文发表过程中的重要性,提出基于关联规则的期刊论文参考文献分析研究,探究图书情报学领域学科结构现状及参考文献选择路径中的潜在知识信息。【方法/过程】以图情学领域八种主要期刊为研究对象,获取其2012-2016年刊发的全部论文作为样本,结构化处理数据后运用关联规则挖掘方法,从参考文献作者相关性分析、主题分析和来源期刊相关性分析三个方面展开研究,探究其参考文献引用过程中隐藏的关联规则并加以横向对比分析。【结果/结论】通过研究发现:参考文献作者同被引现象很大程度上受到合著关系的影响,但同被引相关性与合作强度不成正比,合作关系普遍存在小团体现象,且不具对称性;参考文献标题中提取的特征关键词与目标期刊论文关键词之间存在一定的相关关系,同时通过对图情类期刊的热点关键词分析可得,国内图书馆学和情报学虽然融合趋势明显,但研究领域并没有很好地结合,研究对象和主题也不尽相同;来源期刊之间存在较强的相关关系,会随着时间阶段产生一定的变化。 展开更多
关键词 图情期刊 关联规则 参考文献 APRIORI算法 来源期刊
与能源消耗等指标发生偏离的GDP是否可信 预览 被引量:1
2
作者 许永洪 洪昕 陈建伟 《统计研究》 CSSCI 北大核心 2017年第5期17-27,共11页
本文选取了1995-2014年全国30个省市数据,综合使用了向量自回归模型、参数面板模型、非参数面板模型和面板门限模型对GDP增速与电力消费增速、第二产业增速、第三产业增速、财政收入增速、货物流转增速、能源消费增速和固定资产投资增... 本文选取了1995-2014年全国30个省市数据,综合使用了向量自回归模型、参数面板模型、非参数面板模型和面板门限模型对GDP增速与电力消费增速、第二产业增速、第三产业增速、财政收入增速、货物流转增速、能源消费增速和固定资产投资增速等物理性指标间的关系进行了建模。实证研究发现,GDP增速、电力消费增速、第三产业增速、能源消费增速之间存在作用机制,但是这种影响模式并非一成不变,在不同时间段内,其模式发生改变,同时,这一影响模式也随着人均GDP的变化而发生阶段性改变。在经济新常态下,不能因为经济转型中的GDP数据与物理指数之间发生偏离,而简单否定GDP的准确性。 展开更多
关键词 物理指数 宏观经济评价 数据质量评估
在线阅读 下载PDF
基于数值符号和形态特征的时间序列相似性度量方法 被引量:3
3
作者 李海林 梁叶 《控制与决策》 EI CSCD 北大核心 2017年第3期451-458,共8页
针对传统符号聚合近似方法在特征表示时容易忽略时间序列局部形态特征的局限性,以及动态时间弯曲在度量上的优势,提出一种基于数值符号和形态特征的时间序列相似性度量方法.将时间序列进行符号和形态的特征表示后,提出动态时间弯曲与符... 针对传统符号聚合近似方法在特征表示时容易忽略时间序列局部形态特征的局限性,以及动态时间弯曲在度量上的优势,提出一种基于数值符号和形态特征的时间序列相似性度量方法.将时间序列进行符号和形态的特征表示后,提出动态时间弯曲与符号距离结合的时间序列距离度量方法,使所提方法能够较好地反映时间序列数据数值分布和形态特征.实验结果表明,所提出的方法在时间序列数据挖掘中能够得到较好的分类效果,具有一定的优越性. 展开更多
关键词 符号聚合近似 动态时间弯曲 数值符号 形态特征 相似性度量
标签传播时间序列聚类的股指期货套期保值策略研究 预览
4
作者 李海林 梁叶 《智能系统学报》 CSCD 北大核心 2019年第2期288-295,共8页
利用时间序列聚类方法进行股指期货的套期保值,关键要选择合适的聚类方法。本文从新的视角来研究并提高时间序列聚类方法在金融数据分析领域的应用性能,提出一种基于标签传播时间序列聚类的股指期货套期保值模型。该模型以动态时间弯曲... 利用时间序列聚类方法进行股指期货的套期保值,关键要选择合适的聚类方法。本文从新的视角来研究并提高时间序列聚类方法在金融数据分析领域的应用性能,提出一种基于标签传播时间序列聚类的股指期货套期保值模型。该模型以动态时间弯曲为相似性度量方法来构建现货股票网络空间结构,将每只股票看作一个节点,利用标签传播方法将节点划分到不同的簇中,最终实现股票数据聚类。另外,构建最小追踪误差优化模型来确定每支股票在现货组合中的最优权重,从而得到最优组合。实验分别比较新方法和传统聚类方法确定现货组合的追踪误差,结果表明新方法能够提高现货组合的追踪精度,为丰富金融市场投资和管理方式提供新的研究思路。 展开更多
关键词 标签传播 时间序列 聚类 动态时间弯曲 套期保值
在线阅读HTML 下载PDF
一种结合时空上下文的在线卷积网络跟踪算法 预览
5
作者 柳培忠 汪鸿翔 +1 位作者 骆炎民 杜永兆 《计算机研究与发展》 CSCD 北大核心 2018年第12期2785-2793,共9页
基于卷积神经网络提取抽象特征缺乏时空信息的问题,结合时空上下文模型作为卷积神经网络的各阶滤波器,提出一种在线卷积神经网络的视觉跟踪算法.首先对初始目标进行归一化处理并提取目标置信图,跟踪过程中结合时空信息更新得到时空上下... 基于卷积神经网络提取抽象特征缺乏时空信息的问题,结合时空上下文模型作为卷积神经网络的各阶滤波器,提出一种在线卷积神经网络的视觉跟踪算法.首先对初始目标进行归一化处理并提取目标置信图,跟踪过程中结合时空信息更新得到时空上下文模型,第1层使用更新后的模型对输入进行卷积,并对卷积结果进行滑动窗口取片,第2层再使用时空模型分别对取片结果进行卷积,提取目标简单抽象特征,然后叠加简单层的卷积结果得到目标的深层次表达,最后结合粒子滤波跟踪框架实现目标跟踪.实验表明:结合时空上下文模型的在线卷积网络结构提取的深度抽象特征,保留相关时空信息,提高复杂背景下的跟踪效率. 展开更多
关键词 视觉跟踪 时空上下文 卷积神经网络 粒子滤波 在线更新
在线阅读 下载PDF
LDA模型的优化及其主题数量选择研究——以科技文献为例 被引量:4
6
作者 王婷婷 韩满 王宇 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第1期29-40,共12页
【目的】为提升传统LDA模型的主题识别性能,并给主题最优数目选择提供技术方案,提出基于自适应聚类的K-wrLDA模型。【方法】利用LDA和Word2Vec模型得出包含主题词概率信息及词义相关性的T-WV矩阵,并将传统LDA模型的主题数目选择问题转... 【目的】为提升传统LDA模型的主题识别性能,并给主题最优数目选择提供技术方案,提出基于自适应聚类的K-wrLDA模型。【方法】利用LDA和Word2Vec模型得出包含主题词概率信息及词义相关性的T-WV矩阵,并将传统LDA模型的主题数目选择问题转化为聚类效果评价问题,以内部指标伪F统计量作为目标函数,计算主题聚类数目的最优解,并对新旧两种模型的主题识别效果进行比较。【结果】经自适应聚类得出最优主题数量为33,且新模型的困惑度得分始终低于传统模型,主题识别效果对比显示新模型具有更好的凝聚性。【局限】在实证语料选取上获取单一主题下的科技文献,数据量不大。【结论】新模型具有更理想的主题识别能力,并能够自主计算最优主题数目。该模型作为对传统LDA模型的改进,可以应用于各领域的大规模语料中。 展开更多
关键词 主题模型 词嵌入 自适应聚类 困惑度
基于近邻传播的限定簇数聚类方法研究 预览
7
作者 李海林 魏苗 《电子科技大学学报》 CSCD 北大核心 2018年第5期733-739,共7页
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合... 针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。 展开更多
关键词 近邻传播 聚类算法 类簇数目 数据挖掘 K均值聚类
在线阅读 免费下载
基于关键词重要性和近邻传播聚类的主题分析研究 预览 被引量:1
8
作者 李海林 万校基 林春培 《情报学报》 CSSCI CSCD 北大核心 2018年第5期533-542,共10页
鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺... 鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺序提供论文关键词,计算关键词在每个文献中的重要程度,构建主要关键词之间的相似性矩阵,结合能够反馈最优簇成员代表性结果的近邻传播聚类实现核心主题的提取与分析。本研究对图书情报类某刊物2012-2016年期间的文献关键词进行数据挖掘,使用新方法实现了基于重要性度量的主要关键词聚类,分析和研究了主要关键词和核心主题的演化趋势。提出的方法不仅能够考虑关键词重要性和自动识别核心主题,还可以为文献主题分析提供新的数据挖掘方法,也能有效提高期刊和学科等相关领域的主题识别效果。 展开更多
关键词 主题分析 关键词重要性 近邻传播聚类 核心主题
在线阅读 下载PDF
自适应属性加权近邻传播聚类算法 预览 被引量:1
9
作者 李海林 魏苗 《电子科技大学学报》 CSCD 北大核心 2018年第2期247-255,共9页
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法.该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来... 针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法.该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度.随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量.数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量. 展开更多
关键词 自适应聚类 近邻传播 聚类评价 属性加权 相似性度量
在线阅读 免费下载
基于分类词典的文本相似性度量方法 预览 被引量:1
10
作者 李海林 邹金串 《智能系统学报》 CSCD 北大核心 2017年第4期556-562,共7页
针对现有基于语义知识规则分析的文本相似性度量方法存在时间复杂度高的局限性,提出基于分类词典的文本相似性度量方法。利用汉语词法分析系统ICTCLAS对文本分词,运用TFxIDF方法提取文本关键词,遍历分类词典获取关键词编码,通过计... 针对现有基于语义知识规则分析的文本相似性度量方法存在时间复杂度高的局限性,提出基于分类词典的文本相似性度量方法。利用汉语词法分析系统ICTCLAS对文本分词,运用TFxIDF方法提取文本关键词,遍历分类词典获取关键词编码,通过计算文本关键词编码的近似性来衡量原始文本之间的相似度。选取基于语义知识规则和基于统计两个类别的相似性度量方法作为对比方法,通过传统聚类与KNN分类分别对相似性度量方法进行效果验证。数值实验结果表明,新方法在聚类与分类实验中均能取得较好的实验结果,相较于其他基于语义分析的相似性度量方法还具有良好的时间效率。 展开更多
关键词 文本挖掘 语义分析 分类词典 关键词提取 词语编码 相似性度量 聚类 分类
在线阅读 下载PDF
基于簇中心群的时间序列数据分类方法 预览 被引量:4
11
作者 李海林 万校基 《电子科技大学学报》 EI CSCD 北大核心 2017年第3期625-630,共6页
分类算法是时间序列数据挖掘中极为重要的任务和技术,该文提出一种基于簇中心群的时间序列数据分类方法。该方法根据时间序列训练数据集中的类别标签进行簇划分,利用近邻传播算法分别对每个簇进行中心代表点选择,构造出各代表点的代表... 分类算法是时间序列数据挖掘中极为重要的任务和技术,该文提出一种基于簇中心群的时间序列数据分类方法。该方法根据时间序列训练数据集中的类别标签进行簇划分,利用近邻传播算法分别对每个簇进行中心代表点选择,构造出各代表点的代表对象集;然后借助基于动态时间弯曲的均值中心方法对各代表对象集实现中心群计算,结合改进后的K近邻算法实现时间序列数据的分类。数值实验结果表明,与传统方法相比,新方法具有更好的分类效果和计算性能。 展开更多
关键词 近邻传播 分类算法 数据挖掘 动态时间弯曲 时间序列
在线阅读 免费下载
大数据环境下的管理信息系统发展研究 被引量:19
12
作者 杨丽彬 李海林 张飞波 《大数据》 2016年第1期86-98,共13页
大数据时代的到来给管理信息系统带来了一定的冲击和挑战,因此有必要研究大数据对现代管理信息系统的作用及影响,使得管理信息系统的性能和社会服务作用得到进一步提升。首先从数据的内涵与特征来理解大数据的概念,接着从数据处理过程... 大数据时代的到来给管理信息系统带来了一定的冲击和挑战,因此有必要研究大数据对现代管理信息系统的作用及影响,使得管理信息系统的性能和社会服务作用得到进一步提升。首先从数据的内涵与特征来理解大数据的概念,接着从数据处理过程的角度来讲述大数据对管理信息系统业务流程的变化和影响,同时,从管理信息系统的构成来解析大数据对于管理信息系统的推动与发展作用。最后,针对基于大数据环境下的信息安全和信息人才短缺等问题进行了探讨,并提出了相关的解决方案。 展开更多
关键词 大数据 管理信息系统 数据挖掘 信息处理
中国省际能源效率与环境污染 预览 被引量:1
13
作者 王婷婷 《管理现代化》 CSSCI 北大核心 2015年第6期55-57,共3页
提出生态博弈交叉Malmquist TFP指数模型,对中国省际环境约束下的能源效率进行分析。研究表明,我国能源效率表现欠佳,受效率变动和技术变动双重影响,测度结果呈现东、中、西三大地区逐级递减,但两极分化趋势不显著。
关键词 能源效率 环境污染 eco-GCMalmquist TFP指数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈