期刊文献+
共找到727篇文章
< 1 2 37 >
每页显示 20 50 100
基于LDA的英汉维文本聚类系统的设计与实现 预览
1
作者 田亮 吐尔根·依布拉音 +1 位作者 艾山·吾买尔 卡哈尔江·阿比的热西提 《现代电子技术》 北大核心 2019年第3期122-126,共5页
以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文... 以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文本的分析,计算出适当的聚类数k,再调用LDA算法将文本聚为k类并给出每类文本的关键词。测试结果表明,该系统能将英汉维三种语言的文本相似度高的聚为一类,可显著提高聚类效果。 展开更多
关键词 文本 LDA模型 多语言 文本特征提取 相似度 权重
在线阅读 下载PDF
基于改进的K-means算法在文本挖掘中的应用 预览 被引量:1
2
作者 杨丹 朱世玲 卞正宇 《计算机技术与发展》 2019年第4期68-71,共4页
K-means算法具有简单易于理解的特征,广泛运用于聚类过程中,但是其初始聚类中心是随机确定的,这样极容易导致聚类结果的稳定性很差。针对传统K-means算法对于初始聚类中心选择的敏感性及最大最小距离法容易选取离散点的不足,提出了一种... K-means算法具有简单易于理解的特征,广泛运用于聚类过程中,但是其初始聚类中心是随机确定的,这样极容易导致聚类结果的稳定性很差。针对传统K-means算法对于初始聚类中心选择的敏感性及最大最小距离法容易选取离散点的不足,提出了一种新的聚类中心选择评判函数,依次考察每个点的函数值,选取当前函数值最大的点作为新的聚类中心,直到满足事先确定的聚类中心数。新聚类中心评判函数既可以保证新中心点周围是紧凑的,又可以保证远离其他中心点。最后将该算法运应用于文本聚类之中,根据准确率、召回率及F度量值来衡量算法的聚类质量。实验结果表明,该算法相对于传统算法和最大最小距离算法,准确率更高,聚类质量更好,较适合于文本聚类。 展开更多
关键词 K-MEANS算法 中心 文本 文本距离 稀疏度
在线阅读 下载PDF
一种面向网络长文本的话题检测方法
3
作者 郑恒毅 廖城霖 李天柱 《工程科学学报》 CSCD 北大核心 2019年第9期1208-1214,共7页
提出了一种面向网络长文本的话题检测方法.针对文本表示的高维稀疏性和忽略潜在语义的问题,提出了Word2vec&LDA (latent dirichlet allocation)的文本表示方法.将LDA提取的文本特征词隐含主题和Word2vec映射的特征词向量进行加权融... 提出了一种面向网络长文本的话题检测方法.针对文本表示的高维稀疏性和忽略潜在语义的问题,提出了Word2vec&LDA (latent dirichlet allocation)的文本表示方法.将LDA提取的文本特征词隐含主题和Word2vec映射的特征词向量进行加权融合既能够进行降维的作用又可以较为完整的表示出文本信息.针对传统话题发现方法对长文本输入顺序敏感问题,提出了基于文本聚类的Single-Pass&HAC (hierarchical agglomerative clustering)的话题发现方法,在引入时间窗口和凝聚式层次聚类的基础上对于文本的输入顺序具有了更强的鲁棒性,同时提高了聚类的精度和效率.为了评估所提出方法的有效性,本文从某大学社交平台收集了来自真实世界的多源数据集,并基于此进行了大量的实验.实验结果证明,本文提出的方法相对于现有的方法,如VSM (state vector space model)、Single-Pass等拥有更好的效果,话题检测的精度提高了10%~20%. 展开更多
关键词 网络长文本 话题检测 文本表示 话题发现 文本
基于全覆盖粒计算的K-medoids文本聚类算法 预览
4
作者 邹雪君 谢珺 +1 位作者 任密蜂 续欣莹 《现代电子技术》 北大核心 2019年第7期162-166,共5页
传统K-medoids聚类算法随机选取初始聚类中心,存在迭代次数增加、聚类结果波动较大的问题,因此提出基于全覆盖粒计算的K-medoids文本聚类算法。该算法定义了全覆盖平均粒度重要性的概念。首先对文本进行Single-Pass粗聚类,利用全覆盖粒... 传统K-medoids聚类算法随机选取初始聚类中心,存在迭代次数增加、聚类结果波动较大的问题,因此提出基于全覆盖粒计算的K-medoids文本聚类算法。该算法定义了全覆盖平均粒度重要性的概念。首先对文本进行Single-Pass粗聚类,利用全覆盖粒度重要性和平均粒度重要性从粗聚类结果中产生初始聚类中心候选集,再基于密度和最大最小距离法则从候选集中选出初始聚类中心。通过实验验证,该算法的聚类迭代次数明显减小,聚类质量明显提高。 展开更多
关键词 文本 K-medoids 全覆盖粒计算 Single-Pass 中心 最大最小距离 密度
在线阅读 下载PDF
网络舆情衍进指数构建与实证分析
5
作者 黄微 朱镇远 +1 位作者 许烨婧 孙悦 《图书情报工作》 CSSCI 北大核心 2019年第20期26-33,共8页
[目的/意义]提出和构建网络舆情衍进指数,以描述网络舆情演化过程中常衍生出新的子话题的现象,对于舆情预警、预测具有重要的理论及实践意义。[方法/过程]以文本聚类结果和文本聚类有效性为依据,提出网络舆情衍进的判别标准和舆情衍进... [目的/意义]提出和构建网络舆情衍进指数,以描述网络舆情演化过程中常衍生出新的子话题的现象,对于舆情预警、预测具有重要的理论及实践意义。[方法/过程]以文本聚类结果和文本聚类有效性为依据,提出网络舆情衍进的判别标准和舆情衍进指数的构建过程,并以"教科书老赖"这一事件作为样本数据进行实证分析。[结果/结论]所构建的舆情衍进速率指数可以用于描述舆情衍进。在突发期阶段话题舆情衍进指数最高,此后逐渐下降,这一阶段的舆情衍进最为剧烈,子话题的出现呈现爆发性增长;舆情衍进指数在舆情蔓延期内出现阶梯式下降,此后保持为负值,舆情的子话题开始逐渐减少,舆情内容本身由发散转为收敛;进入消散期后,子话题数量趋于稳定。作为舆情衍进速率的测度和舆情衍进的判别方式,舆情衍进指数为舆情监管和舆情预警提供了全新的角度。 展开更多
关键词 舆情衍进 衍进指数 文本 有效性
基于密度峰值的改进K-Means文本聚类算法及其并行化
6
作者 袁逸铭 刘宏志 李海生 《武汉大学学报:理学版》 CAS CSCD 北大核心 2019年第5期457-464,共8页
针对K均值(K-means)聚类算法进行文本聚类时随机选取初始聚类中心点的问题,提出一种基于密度峰值进行初始聚类中心点选取的适用于文本聚类的K-means算法(DPMCSKM),为了更好地适应大规模聚类计算的要求,设计并实现了基于MapReduce的DPMC... 针对K均值(K-means)聚类算法进行文本聚类时随机选取初始聚类中心点的问题,提出一种基于密度峰值进行初始聚类中心点选取的适用于文本聚类的K-means算法(DPMCSKM),为了更好地适应大规模聚类计算的要求,设计并实现了基于MapReduce的DPMCSKM并行化算法。实验结果表明,DPMCSKM算法可以有效地进行文本聚类,与K-means、基于密度峰值的快速搜索聚类算法选取初始簇中心点的K-means以及多簇球形K-means算法相比在聚类质量上均有一定的提升,在收敛速度上也有较好的表现;DPMCSKM并行化算法在可扩展性上,具有较好的加速比。 展开更多
关键词 文本 密度峰值 MapReduce K均值算法
基于柯南·道尔作品的文本聚类应用与探究
7
作者 朱枫怡 岳天泽 +2 位作者 王可 刘笑 田茂再 《数理统计与管理》 CSSCI 北大核心 2019年第5期882-898,共17页
风靡世界的侦探小说《福尔摩斯探案集》的写作几乎贯穿作者柯南·道尔爵士的一生,但其写作风格并非一成不变。本文从《福尔摩斯探案集》本身出发,以57篇侦探故事为研究对象,构建词频、词长、单词数、标点出现频率等语言要素指标,利... 风靡世界的侦探小说《福尔摩斯探案集》的写作几乎贯穿作者柯南·道尔爵士的一生,但其写作风格并非一成不变。本文从《福尔摩斯探案集》本身出发,以57篇侦探故事为研究对象,构建词频、词长、单词数、标点出现频率等语言要素指标,利用文本聚类技术对柯南·道尔写作风格进行研究,从统计语言学的角度揭示了不同时期柯南·道尔写作风格的变化。研究结果表明,根据写作风格的不同,柯南·道尔的创作生涯大致可分为两个阶段,且风格的转变与其私人生活的变故、宗教信仰的转变等密切相关。社会大环境的变迁以及作家个人坎坷的人生路程,都是其写作风格发生变化的重要原因。在分析文学作品时,应该紧密联系作者当时所处的社会环境和个人经历,才能对作者有更深刻的理解。通过柯南·道尔作品的文本聚类后,我们对柯南·道尔的生平进行梳理,不难发现1893、1901、1907以及1926年这几个特殊时点可能是与道尔的人生轨迹由第一阶段转变到第二阶段有紧密联系的。 展开更多
关键词 文本 K-MEANS算法 层次算法 柯南·道尔
一种基于t-分布随机近邻嵌入的文本聚类方法 预览
8
作者 徐秀芳 徐森 +3 位作者 花小朋 徐静 皋军 安晶 《南京大学学报:自然科学版》 CAS CSCD 北大核心 2019年第2期264-271,共8页
文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间... 文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间相似度较低的文本对应的映射点距离较远,而相似度较高的文本对应的映射点距离较近;然后根据低维空间映射点坐标,再采用传统的聚类分析算法进行聚类,得到最终的聚类结果.在多个基准文本数据集上进行了实验测试,验证了该方法的有效性. 展开更多
关键词 分析 文本 维数约简 随机近邻嵌入 算法
在线阅读 免费下载
基于关键词的学术文本聚类集成研究 预览
9
作者 张颖怡 章成志 陈果 《情报学报》 CSSCI CSCD 北大核心 2019年第8期860-871,共12页
文本聚类是一种无监督且高效的文本类别划分方法。从文本中抽取的关键词代表了文本主旨内容,基于关键词的文本聚类是当下主流方式之一。在学术文本聚类研究中,主要使用单一的聚类方法。目前,一部分提升聚类性能的方法被提出,聚类集成是... 文本聚类是一种无监督且高效的文本类别划分方法。从文本中抽取的关键词代表了文本主旨内容,基于关键词的文本聚类是当下主流方式之一。在学术文本聚类研究中,主要使用单一的聚类方法。目前,一部分提升聚类性能的方法被提出,聚类集成是其中之一。因此,根据聚类集成思想,本文开展了基于关键词的学术文本聚类研究。为分析聚类集成在学术文本聚类中的有效性,本文比较了非集成聚类算法与聚类集成算法的性能。同时,为分析关键词对聚类集成性能的影响,本文分析了不同关键词抽取方法和不同关键词个数下学术文本的聚类结果。实验结果表明,聚类集成算法能够提升学术文本聚类的性能。其中,当使用TextRank作为关键词抽取方法时,学术文本聚类结果较佳;随着关键词个数的增加,学术文本类别划分性能随之提升。 展开更多
关键词 抽取 文本 主题划分 集成
在线阅读HTML 下载PDF
基于知识图谱词义消歧的文本聚类方法 预览
10
作者 张延星 王广祥 +1 位作者 朱志芸 张蝶依 《华北理工大学学报:自然科学版》 CAS 2019年第4期89-94,共6页
在文本聚类的词义消歧环节,引入外部词典的消歧结果受到词典规模和领域的限制。增加向量相似度比较和语义模型等改进技术手段,无法使其突破对外部词典的依赖。针对识别多义词在上下文中语义唯一性的问题,提出基于知识图谱词义消歧的文... 在文本聚类的词义消歧环节,引入外部词典的消歧结果受到词典规模和领域的限制。增加向量相似度比较和语义模型等改进技术手段,无法使其突破对外部词典的依赖。针对识别多义词在上下文中语义唯一性的问题,提出基于知识图谱词义消歧的文本聚类算法。该算法采用TF-IDF模型获取文本特征词集合,利用知识图谱表达的词义序列关系确定多义词在特定的语义环境中的唯一语义,在词义概念层面完成文本的向量化表示,进行文本聚类。在BBC数据集上的实验结果表明,该方法在文本聚类的平均准确率上达到95%。 展开更多
关键词 文本 词义消歧 文本向量化 知识图谱 自然语言处理
在线阅读 下载PDF
融合耦合距离区分度和强类别特征的短文本相似度计算方法 预览
11
作者 马慧芳 刘文 +1 位作者 李志欣 蔺想红 《电子学报》 EI CAS CSCD 北大核心 2019年第6期1331-1336,共6页
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法... 短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧,然后基于文本间包含相同类别的强类别特征数量来衡量文本间的相似度.最后,本文结合耦合距离区分度和强类别特征来衡量短文本的相似度.经实验证明本文提出的方法能够提高短文本相似度计算的准确率. 展开更多
关键词 文本挖掘 自然语言处理 文本 社会网络 耦合关系 特征提取 语义消歧 相似度计算
在线阅读 下载PDF
多源文本下结合实体的事件发现方法ESP
12
作者 秦宇君 史存会 +2 位作者 刘悦 俞晓明 程学旗 《山西大学学报:自然科学版》 CAS 北大核心 2019年第1期41-50,共10页
网络舆论对人们生活的影响程度与日俱增,通过结合多源数据进行事件发现可以更好地捕捉舆情事件,提高舆情系统的效果。针对在多源文本场景下如何将来自新闻、微博、微信等多通道的数据融合,文章根据事件的定义,提出了事件核心实体的概念... 网络舆论对人们生活的影响程度与日俱增,通过结合多源数据进行事件发现可以更好地捕捉舆情事件,提高舆情系统的效果。针对在多源文本场景下如何将来自新闻、微博、微信等多通道的数据融合,文章根据事件的定义,提出了事件核心实体的概念,设计了事件核心实体识别方法,并且将事件核心实体应用到事件发现过程,提出了结合实体的事件发现方法 ESP(Entity Single-Pass)。该方法通过引入实体信息,丰富了多源文本中每篇文档的表达,从而提高了多源文本事件发现的效果。实验表明,在微博、新闻等数据上,我们的方法与K-means和SinglePass方法相比,在NMI与RI两项指标上分别提高了0.2和0.3,证明了ESP算法的有效性。 展开更多
关键词 事件发现 事件核心实体 多源文本 文本
网络舆论文本识别与跟踪系统构建
13
作者 任立国 张熇 刘堃 《中国电力企业管理》 2019年第21期52-53,共2页
当今时代,有越来越多的受众通过网络发布自己的观点、获取信息等,这直接导致品牌维护指标成为政府及企业的重要参考。如何在网民数量急剧增加、海量信息纷繁交错的情况下挖掘重要的舆情指标,成为政府及企业需关注的重点问题。
关键词 文本识别 业务控制层 文本 网络舆论
国内外多维贫困研究进展 预览
14
作者 陈闻鹤 常志朋 《长江师范学院学报》 2019年第5期31-44,共14页
多维贫困是指涵盖收入、健康、教育、居住和饮水等多方面匮乏的综合性贫困。目前,关于多维贫困研究进展的综述较少,且多为定性分析,难以全面准确地概述现阶段的研究成果。有鉴于此,采用核心学者评测法和文本聚类法对国内外多维贫困相关... 多维贫困是指涵盖收入、健康、教育、居住和饮水等多方面匮乏的综合性贫困。目前,关于多维贫困研究进展的综述较少,且多为定性分析,难以全面准确地概述现阶段的研究成果。有鉴于此,采用核心学者评测法和文本聚类法对国内外多维贫困相关文献进行量化研究,从核心学者、主要研究机构及地理分布、高被引论文和主题词共现网络等方面分析和比较国内外多维贫困的研究现状与热点。研究表明:近年来,国内外多维贫困相关研究成果处于上升阶段,但该领域学者和科研机构较为集中,数量较少;从高被引论文来看,国内外研究热点多集中在多维贫困测度及指标体系建立方面,但侧重点有所不同;从多维贫困问题研究热点的演化过程来看,国内外发展脉络与趋势相似,即测度对象精细化,视角多元化,由静态测度向动态测度转变,但在类似方向上的研究国内大约滞后国外4~5年;从多维贫困高频关键词分类来看,国内外多维贫困研究热点在技术手段、研究主题方面相似,在理论基础、研究视角、研究对象和行为措施等方面具有异质性。 展开更多
关键词 多维贫困 核心学者评测 文本 共现网络
在线阅读 免费下载
基于群体智能的跨语言网络舆情文本聚类模型 预览
15
作者 韩楠 乔少杰 +2 位作者 黄萍 彭京 周凯 《重庆理工大学学报:自然科学》 CAS 北大核心 2019年第9期99-108,共10页
跨语言的互联网文本信息在中国多个民族构成中非常普遍,但当前文本聚类模型主要针对单一语言,跨语言文本挖掘的研究较少。群体智能算法具有自组织、启发式、自适应和鲁棒性的特点,提出一种基于群体智能的跨语言网络舆情文本聚类模型SI-C... 跨语言的互联网文本信息在中国多个民族构成中非常普遍,但当前文本聚类模型主要针对单一语言,跨语言文本挖掘的研究较少。群体智能算法具有自组织、启发式、自适应和鲁棒性的特点,提出一种基于群体智能的跨语言网络舆情文本聚类模型SI-Cluster(swarm-intelligence-based text clustering model),应用3种优化策略。梯度下降法弱化智能体拾取文本的能力,避免陷入局部最优解,添加信息素引导智能体移动并有效避免信息素挥发过快的问题,智能体从当前位置选择下一位置考虑信息素感应浓度和方向权重因子。在中文、英文和藏文文本数据集上进行实验,从聚类准确性上看应用优化策略的SI*-Cluster算法的F-measure值达到0. 862,相比于k-means算法提高44. 1%;从收敛性上看SI*-Cluster算法在聚类效果明显的前提下迭代500次收敛,相比SI-Cluster算法900次收敛,具有更快的收敛速度。模拟展示了SICluster和SI*-Cluster算法进行文本聚类的迭代过程,证明所提优化策略的有效性。 展开更多
关键词 群体智能 跨语言 文本 网络舆情
在线阅读 免费下载
基于词向量和多特征语义距离的文本聚类算法 预览
16
作者 张弛 张贯虹 《重庆科技学院学报:自然科学版》 CAS 2019年第3期69-72,77共5页
针对传统文本聚类算法中存在语义相似度计算向量维度高、忽视特征词词频、位置、词距和语义缺失等问题,提出了一种基于词向量和多特征语义距离的文本聚类算法(M-W2-KS)。首先使用Word2Vec训练语料库中的所有特征词,以向量形式进行表征;... 针对传统文本聚类算法中存在语义相似度计算向量维度高、忽视特征词词频、位置、词距和语义缺失等问题,提出了一种基于词向量和多特征语义距离的文本聚类算法(M-W2-KS)。首先使用Word2Vec训练语料库中的所有特征词,以向量形式进行表征;然后综合考虑特征词的词频、位置、词距信息以及特征词间的欧式距离,计算文本间的语义相似度,并将其应用到K-means算法中,实现文本的聚类。实验结果表明,运用M-W2-KS算法,可以有效提升聚类效果,使聚类结果更加准确。 展开更多
关键词 文本 词向量 特征向量 Word2Vec K-MEANS
在线阅读 下载PDF
机器学习课程案例设计与分析--以舆情智能分析案例设计为例 预览
17
作者 饶泓 姬名书 朱剑 《实验技术与管理》 CAS 北大核心 2019年第6期152-157,180共7页
为了让学生用所学算法知识解决实际问题,设计了一个基于机器学习算法的舆情分析案例。以电影《战狼2》的影评分析为例,通过词云图分析数据的一般规律,然后利用时间序列和文本聚类方法对舆情进行分析。分析结果显示,观众的情感倾向及关... 为了让学生用所学算法知识解决实际问题,设计了一个基于机器学习算法的舆情分析案例。以电影《战狼2》的影评分析为例,通过词云图分析数据的一般规律,然后利用时间序列和文本聚类方法对舆情进行分析。分析结果显示,观众的情感倾向及关注度短期内不会有较大的变化,且与具体的情景息息相关。 展开更多
关键词 机器学习 案例建设 舆情分析 文本
在线阅读 下载PDF
基于GloVe词向量的“技术--应用”发现研究 预览
18
作者 吉久明 施陈炜 +1 位作者 李楠 康健 《现代情报》 CSSCI 2019年第4期13-22,共10页
[目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的"技术--应用"发现模型,提出改进词向量的算法;然... [目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的"技术--应用"发现模型,提出改进词向量的算法;然后,以机器学习技术为例,获取该领域学术论文文摘数据,预处理后建立训练文本集合,再使用改进GloVe模型训练获得词向量;最后,对词向量聚类获得"技术"和"应用"类词汇集,通过共现获得两者之间的关联并分析。[结果/结论]实验结果表明,本文改进GloVe模型后训练的词向量性能获得提升,聚类效果好,最终实现"技术--应用"的关联分析。 展开更多
关键词 词向量 GloVe模型 文本 共现分析
在线阅读 下载PDF
基于WOS数据库的国防生物安全领域研究热点 预览
19
作者 杨志滨 张妍 +1 位作者 王萧 李芳薇 《中华医学图书情报杂志》 CAS 2019年第3期24-31,共8页
目的:分析1999-2018年国防生物安全领域科技论文的产出情况,揭示该领域的发展特点及研究热点。方法:借助WebofScience检索平台、DDA分析工具以及SPSS19.0统计分析工具,研究国防生物安全领域科技论文产出数量及增长趋势、学科主题、核心... 目的:分析1999-2018年国防生物安全领域科技论文的产出情况,揭示该领域的发展特点及研究热点。方法:借助WebofScience检索平台、DDA分析工具以及SPSS19.0统计分析工具,研究国防生物安全领域科技论文产出数量及增长趋势、学科主题、核心关键词、研究方向的战略坐标图及国内外军事科研单位的研究重点和热点。结果:近20年国防生物安全领域的科技论文呈现比较平稳的发展态势,其中美国在科技论文的数量和质量上遥遥领先,美国CDC、美国国防部、美国陆军以及美国高校是发文的主力,生物恐怖相关传染病、生物恐怖的预防与监测是研究难点和热点,对于疫病的治疗、疫情的控制和消除的相关研究相对较少。结论:对新发传染病预防、监测的研究是国防生物安全领域的重点,但随着合成生物学及生物交叉技术的迅速发展,国防生物安全受到了巨大的挑战。如何快速控制、消除疫病,防止生物安全事件的扩大,是该领域的研究难点和重点。 展开更多
关键词 生物安全 文献计量 文本 情报学 热点研究 战略坐标图
在线阅读 下载PDF
基于文本聚类的煤矿安全隐患类型挖掘研究
20
作者 谭章禄 王兆刚 +2 位作者 胡翰 姜萱 彭胜男 《中国安全科学学报》 CAS CSCD 北大核心 2019年第3期145-148,共4页
为提升煤矿安全管理者对隐患数据的理解和处理能力,提高隐患排查治理工作水平,将文本聚类方法运用于煤矿企业历史安全隐患记录数据的挖掘分析,并采用卡方统计量提取与类别关联度高的特征词描述聚类结果,研究历史隐患数据中记录的主要隐... 为提升煤矿安全管理者对隐患数据的理解和处理能力,提高隐患排查治理工作水平,将文本聚类方法运用于煤矿企业历史安全隐患记录数据的挖掘分析,并采用卡方统计量提取与类别关联度高的特征词描述聚类结果,研究历史隐患数据中记录的主要隐患的类型及特点。结果表明:文本聚类与卡方统计相结合,能够有效识别煤矿安全隐患数据中记录的主要隐患类型及特点;隐患排查治理工作应以数量多的隐患类型作为排查侧重点,根据隐患类型的特点制定相应的治理措施,以改善隐患排查治理工作的针对性和有效性。 展开更多
关键词 煤矿 安全隐患 文本 关联度 隐患
上一页 1 2 37 下一页 到第
使用帮助 返回顶部 意见反馈