期刊文献+
共找到535篇文章
< 1 2 27 >
每页显示 20 50 100
基于改进信息增益特征选择法的SVM中文情感分类算法 预览
1
作者 王根生 黄学坚 +1 位作者 吴小芳 胡向亮 《成都理工大学学报:自然科学版》 CAS CSCD 北大核心 2019年第1期105-110,共6页
为文本情感分类提出一种改进的机器学习算法。在分析当前主要文本特征选择方法后,把词频和词语情感表现程度融入到信息增益特征选择方法中,从全局和局部2个方面进行特征权重衡量,使用特征空间向量模型对文本进行统一表示,然后利用SVM算... 为文本情感分类提出一种改进的机器学习算法。在分析当前主要文本特征选择方法后,把词频和词语情感表现程度融入到信息增益特征选择方法中,从全局和局部2个方面进行特征权重衡量,使用特征空间向量模型对文本进行统一表示,然后利用SVM算法进行训练学习。通过实验发现该算法的查准率和查全率比传统的机器学习算法有所提高,并且得到的分类器具有较好的泛化能力。 展开更多
关键词 情感分类 机器学习 SVM 信息增益
在线阅读 下载PDF
基于模糊粗糙集属性约简与GMM-LDA最优聚类簇特征学习的自适应网络入侵检测
2
作者 刘金平 张五霞 +2 位作者 唐朝晖 何捷舟 徐鹏飞 《控制与决策》 EI CSCD 北大核心 2019年第2期243-251,共9页
网络入侵方式已日趋多样化,其隐蔽性强且变异性快,开发灵活度高、适应性强的实时网络安全监测系统面临严峻挑战.对此,提出一种基于模糊粗糙集属性约简(FRS-AR)和GMM-LDA最优聚类簇特征学习(GMM-LDA-OCFL)的自适应网络入侵检测(ANID)方法... 网络入侵方式已日趋多样化,其隐蔽性强且变异性快,开发灵活度高、适应性强的实时网络安全监测系统面临严峻挑战.对此,提出一种基于模糊粗糙集属性约简(FRS-AR)和GMM-LDA最优聚类簇特征学习(GMM-LDA-OCFL)的自适应网络入侵检测(ANID)方法.首先,引入一种基于模糊粗糙集(FRS)信息增益率的属性约简(AR)方法以实现网络连接数据最优属性集选择;然后,提出一种基于GMM-LDA的最优聚类簇特征学习方法,以获得正常模式特征库和入侵模式库的最优特征表示,同时引入模式库自适应更新机制,使入侵检测模型能够适应网络环境动态变化. KDD99数据集和基于Nidsbench的网络虚拟仿真实验平台的入侵检测结果表明,所提出的ANID方法能有效适应网络环境动态变化,可实时检测出真实网络连接数据中的各种入侵行为,其性能优于当前常用的入侵检测方法,应用前景广阔. 展开更多
关键词 入侵检测 高斯混合模型聚类 模式匹配 模糊粗糙集 信息增益 模式更新
一种基于改进信息增益特征选择的最大熵模型文本分类方法
3
作者 何明 《西南师范大学学报:自然科学版》 CAS 北大核心 2019年第3期113-118,共6页
针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分... 针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分类精度,并将该改进IG特征选择算法用于最大熵模型(ME)对文本进行分类.实验结果表明:该文所提方法在进行文本分类时F1值高于传统IG算法.该文方法的ME分类精度高于K最近邻KNN(K-Nearest Neighbor)算法,说明本文方法是可行的、有效的. 展开更多
关键词 信息增益 均衡比 词频参数 最大熵模型
在线阅读 免费下载
面向中文短文本情感分析的改进特征选择算法 预览
4
作者 王荣波 沈卓奇 +1 位作者 黄孝喜 谌志群 《杭州电子科技大学学报:自然科学版》 2019年第1期45-50,共6页
在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取短文本特征,为此,提出了一种改进特征选择算法ITFIDF-IG。根据短文本语料特点提高更具分类效果的特征词权... 在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取短文本特征,为此,提出了一种改进特征选择算法ITFIDF-IG。根据短文本语料特点提高更具分类效果的特征词权重,降低了无关词的干扰,并考虑特征词在分布上体现的分类效果,有效提取出更具分类贡献度的特征词,更适应中文短文本的情感分析,取得较好的分类性能。 展开更多
关键词 特征选择 情感分析 词频逆文本频率指数 信息增益 中文短文本
在线阅读 下载PDF
加权朴素贝叶斯算法在消防检测中的应用 预览
5
作者 童威 黄启萍 《西安工程大学学报》 CAS 2019年第1期111-115,共5页
针对当前建筑物消防检测受干扰影响较大,导致火灾预测精度较低的问题,给出一种用于消防检测的改进朴素贝叶斯算法。基于消防检测数据分析,通过信息增益计算加权值,将特征属性附加权重系数对朴素贝叶斯算法进行改进,并在此基础上通过Wek... 针对当前建筑物消防检测受干扰影响较大,导致火灾预测精度较低的问题,给出一种用于消防检测的改进朴素贝叶斯算法。基于消防检测数据分析,通过信息增益计算加权值,将特征属性附加权重系数对朴素贝叶斯算法进行改进,并在此基础上通过Weka平台,设计并实现了改进朴素贝叶斯算法框架,将其用于消防检测。实验验证,比较朴素贝叶斯算法和其他分类预测方法,改进的朴素贝叶斯算法能有效解决每个特征属性对类别变量影响的关联度量化问题,降低了分类干扰,提高了消防隐患检测准确率。 展开更多
关键词 消防检测 属性加权 朴素贝叶斯算法 信息增益 权重
在线阅读 下载PDF
基于概率分布的相机内参优化方法 预览
6
作者 刘文庆 冯锋 《现代电子技术》 北大核心 2019年第5期48-52,共5页
相机参数的准确性决定后续视觉任务的实现结果,为了提高相机校准的准确性,提出一种基于概率分布异常值去除和信息增益的内参确定方法。首先用一个摄像机对某个确定规格的棋盘图获取一组图片集,从图片集中随机选取一定数量的图片,使用张... 相机参数的准确性决定后续视觉任务的实现结果,为了提高相机校准的准确性,提出一种基于概率分布异常值去除和信息增益的内参确定方法。首先用一个摄像机对某个确定规格的棋盘图获取一组图片集,从图片集中随机选取一定数量的图片,使用张氏标定法做N组标定实验;然后将标定结果集按照其服从的概率分布进行异常值去除,将剩余的数据集中各个内参因素值分为3类,并且选择当前根节点下信息增益最大的参数类为最优节点,即以信息增益最大为主线选择最优路线;最后通过对最优路线中标定精度较高的结果集使用中值来估计相机参数。实验结果证明该方法与原始方法比较,提高了准确性。 展开更多
关键词 相机校准 概率分布 3D重建 相机内参 信息增益 最优路线
在线阅读 下载PDF
基于决策树算法的空气质量预测系统 预览
7
作者 徐旭冉 涂娟娟 《电子设计工程》 2019年第9期39-42,共4页
针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污... 针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污染指数固定数值区间的划分来评估空气质量。而基于决策树算法的空气质量评估模型通过采用自顶向下的递归方式对数据进行处理,把一个无序、无规则的实例集合归纳成一组树形结构表示的分类规则,得到了将所有污染参数作为评估空气质量因素的评估模型,可以有效的避免传统的空气质量预报模型的不灵活、边界值不准确的特点。同时可以根据季节和地区等外部因素构建不同的空气质量预测模型以应对外部因素的变化,从而可以构建完整,精确,现代化的空气质量智能预测系统。 展开更多
关键词 机器学习 决策树 空气质量预测 C4.5算法 信息增益 PYTHON
在线阅读 下载PDF
混合CHI与IG的特征选择方法研究 预览
8
作者 唐康 汪海涛 +1 位作者 姜瑛 陈星 《信息技术》 2019年第2期53-57,共5页
随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择... 随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择方法选择后的特征子集可能差别较大,进而导致不稳定的分类结果。文中提出了一种混合CHI与IG的特征选择方法,引入了融合特征的指标SOM(Score of Mixed),将特征根据SOM值排序,通过预定的阈值进行特征筛选,得出相对稳定且具代表性的特征子集。实验结果表明,使用该方法进行特征选择,文本分类的效果相比使用其他特征选择方法有一定的提升。 展开更多
关键词 特征选择 卡方统计 信息增益 混合方法
在线阅读 下载PDF
几何平均参与评价划分属性的决策树 预览
9
作者 王卓 聂斌 罗计根 《计算机工程与设计》 北大核心 2018年第7期1877-1882,共6页
针对信息增益偏向于多值属性,信息增益率倾向于少值属性的特点,研究几何平均参与评价划分属性的决策树。从候选划分属性中,筛选高于信息增益算术平均水平的属性;分别计算这些属性的信息增益与信息增益率的几何平均值,从中选择几何平均... 针对信息增益偏向于多值属性,信息增益率倾向于少值属性的特点,研究几何平均参与评价划分属性的决策树。从候选划分属性中,筛选高于信息增益算术平均水平的属性;分别计算这些属性的信息增益与信息增益率的几何平均值,从中选择几何平均值最大的属性,建立分支决策;用递归方法建立决策树。对4份不同规模数据进行实验验证,验证结果表明,该决策树准确性较好,运行时间较低,可行有效。 展开更多
关键词 信息增益 信息增益率 筛选 几何平均 决策树 中医药信息
在线阅读 下载PDF
基于朴素贝叶斯的文化旅游文本分类技术研究
10
作者 王祥翔 方荟 陈崇成 《福州大学学报:自然科学版》 北大核心 2018年第5期644-649,共6页
将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型.首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进... 将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型.首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进行权重的赋值,构建分类器模型,实现旅游文本的自动分类.实验选取了1447个景点描述文本,按照闽南文化、客家文化、红色文化和生态文化进行分类,取得较好的分类效果. 展开更多
关键词 文化旅游 文本分类 朴素贝叶斯 信息增益
缺失值情况下基于决策树算法的长白山植被识别的研究 预览
11
作者 张华 许骏 付浩海 《长春工程学院学报:自然科学版》 2018年第4期80-84,共5页
机器学习中的决策树算法在处理没有属性缺失的数据集各样本时比较容易,但数据集较大时,往往某些属性会出现缺失值,这时就不能再使用通用方法来分析。利用决策树算法,以长白山植被识别为实例,通过对缺失值数据进行特殊处理,引入权重后重... 机器学习中的决策树算法在处理没有属性缺失的数据集各样本时比较容易,但数据集较大时,往往某些属性会出现缺失值,这时就不能再使用通用方法来分析。利用决策树算法,以长白山植被识别为实例,通过对缺失值数据进行特殊处理,引入权重后重新计算每个属性的信息增益,再构建最优决策树,从而实现缺失值情况下对长白山植被的识别,能对新样本进行有效预测。 展开更多
关键词 机器学习 决策树 样本 属性 缺失值 信息增益
在线阅读 下载PDF
结合点评信息辅助的POI自动分类方法研究
12
作者 万幼 王茹涵 《测绘地理信息》 2018年第5期120-123,共4页
提出了一种基于机器学习算法,利用点评信息辅助实现POI(point of interest)自动分类的新方法。实验证明,点评信息辅助的POI自动分类方法与单纯利用POI名称分类的方法相比,在准确性上有显著提高。
关键词 向量空间模型 信息增益 POI分类 朴素贝叶斯模型
基于段落信息增益的政策文本主题识别研究 预览
13
作者 赵一方 裴雷 康乐乐 《数字图书馆论坛》 CSSCI 2018年第11期2-10,共9页
综合性政策文本通常具有多种政策主张的表述,而现有的基于特征词向量的政策主题识别方法一直无法有效分配特定特征词对相似政策主题的“贡献度”。本文提出一种基于段落信息增益的半监督化政策文本主题识别方法,在不损耗基本词向量信息... 综合性政策文本通常具有多种政策主张的表述,而现有的基于特征词向量的政策主题识别方法一直无法有效分配特定特征词对相似政策主题的“贡献度”。本文提出一种基于段落信息增益的半监督化政策文本主题识别方法,在不损耗基本词向量信息的同时,显著降低了矩阵计算的复杂度,平衡了不同主题间的贡献差异。基于该方法,本文进一步通过对2018年31个省级行政机构的政府工作报告的政策主题强度差异和政策倾向进行测算,测算结果与人工标注结果具有一定的秩相关性。 展开更多
关键词 政策文本 主题识别 政策倾向 信息增益
在线阅读 下载PDF
空中目标传感器管理方法综述
14
作者 闫涛 韩崇昭 张光华 《航空学报》 CSCD 北大核心 2018年第10期21-31,共11页
为了避免对有限的多传感器资源的无序竞争和使用,多传感系统通常在一定约束条件下工作。传感器管理即是对传感器系统的自由度进行控制,以满足实际的约束条件并实现既定的任务目标,被大规模地应用于诸如区域目标监视、空中交通管制等各... 为了避免对有限的多传感器资源的无序竞争和使用,多传感系统通常在一定约束条件下工作。传感器管理即是对传感器系统的自由度进行控制,以满足实际的约束条件并实现既定的任务目标,被大规模地应用于诸如区域目标监视、空中交通管制等各种军用与民用领域。首先,给出了传感器管理系统的概念定义与基本目标;然后,对过去及现在各种空中目标传感器管理方面的理论、方法以及应用进行了全面的综述与深入的分析,并对传感器管理领域现存的问题提出了解决思路和方法;最后,对该领域下一步的发展方向做出了展望。 展开更多
关键词 传感器管理 决策过程 多目标跟踪 信息增益 优化
利用粒计算的符号型数据分组算法 被引量:1
15
作者 杨烽 《计算机科学》 CSCD 北大核心 2018年第B11期445-452,共8页
在数据挖掘领域,基于符号型数据分组的数据预处理是一个极富挑战性的问题,它给人们提供了一种更加简化的数据表现形式。在已往的研究中,相关学者提出了许多解决方案,例如,运用粗糙集的方法来解决这一问题。文中提出了一种基于粒计算的... 在数据挖掘领域,基于符号型数据分组的数据预处理是一个极富挑战性的问题,它给人们提供了一种更加简化的数据表现形式。在已往的研究中,相关学者提出了许多解决方案,例如,运用粗糙集的方法来解决这一问题。文中提出了一种基于粒计算的符号型数据分组算法,主要分为粒度生成和粒度选择两个阶段。在粒度生成阶段,对于每一条属性,以对应属性值的聚类为叶子节点,自底向上以二进制树的形式构建粒层,形成属性树森林。在粒度选择阶段,以信息增益为基础,对每棵树进行全局考虑,选取最优的粒层,选层结果就是符号型数据的分组结果。实验结果表明,本算法呈现出比已有算法更加平衡的层次结构和更加优秀的压缩效率,具有较好的应用价值。 展开更多
关键词 粒计算 信息增益 符号型 数据分组
在线阅读 免费下载
政治哲学视域下“智慧城市”建设的公共性维度
16
作者 张海燕 《当代中国价值观研究》 2018年第6期102-109,共8页
信息技术拥趸者一般将'智慧城市'建设着意依靠于大数据、人工智能等信息技术,但哲学人文学者从'智慧'与'智能'区分的角度对'智慧城市'的信息技术依赖路径提出了批判性反思,这引起了人们强烈的共鸣。&#... 信息技术拥趸者一般将'智慧城市'建设着意依靠于大数据、人工智能等信息技术,但哲学人文学者从'智慧'与'智能'区分的角度对'智慧城市'的信息技术依赖路径提出了批判性反思,这引起了人们强烈的共鸣。'智慧城市'建设既要尊重信息专家系统在技术决策中的作用,又必须防范技术精英与资本和权力结盟而造成的对公众知情权和实际利益的侵害。事实上,'智慧城市'建设是与人的公共生产生活密切相关的总体性实践。因此,我国的'智慧城市'建设,必须进行经济、政治、文化、社会等各种因素的综合性考量,尤其需要重视其公共性价值维度,强调公众参与、需求以及监督,在共商共建共享中推动'智慧城市'建设从单纯重信息技术到全面重视公众'获得感'的转移,以更好地满足公众对'美好生活'的期待,真正实现'城市让生活更美好'的价值目标。 展开更多
关键词 “智慧城市” 信息技术 公共性 公众“获得感” 美好生活
一种时效感知的动态加权Web服务QoS监控方法 预览
17
作者 何志鹏 张鹏程 +2 位作者 江艳 吉顺慧 李雯睿 《软件学报》 CSCD 北大核心 2018年第12期3716-3732,共17页
服务质量(quality of service,简称QoS)是衡量Web服务好坏的重要标准,也是用户选择Web服务的重要依据.能够实时而准确有效地对Web服务进行监控,是Web服务质量保障的重要基础.为此,提出了一种时效感知的动态Web服务QoS监控方法.该方法在... 服务质量(quality of service,简称QoS)是衡量Web服务好坏的重要标准,也是用户选择Web服务的重要依据.能够实时而准确有效地对Web服务进行监控,是Web服务质量保障的重要基础.为此,提出了一种时效感知的动态Web服务QoS监控方法.该方法在传统加权监控方法中融入了滑动窗口机制和信息增益原理,简称IgS-wBSRM(information gain and sliding window based weighted naive Bayes QoS runtime monitoring).该方法以一定的初始训练样本进行环境因素权值初始化,利用信息熵(information entropy,简称IE)及信息增益(information gain,简称IG)对样本所处混沌状态的确定作用,依次读取样本数据流,计算样本数据单元出现前后各影响因子组合的信息增益,结合TF-IDF(term frequency-inverse document frequency)算法对早期的初始化权值进行动态更新,修正传统算法对监控分类的类间分布偏差问题和参数未更新问题.另外,考虑训练样本数据的时效性,结合滑动窗口机制来对影响因子组合权值进行同步更新,以消解长期累积的历史累赘数据对近期服务QoS的影响.在模拟数据集和开源数据集上的结果表明:利用滑动窗口机制可以有效摒弃历史数据的过期信息,结合滑动窗口机制实现的基于信息增益的动态权值算法能够更加准确地监控Web服务QoS,总体监控效果明显优先于现有方法. 展开更多
关键词 服务质量 时效感知 信息增益 滑动窗口 动态监控
在线阅读 下载PDF
基于信息熵和几何轮廓相似度的多变量决策树 预览
18
作者 张宇 包研科 邵良杉 《计算机应用研究》 CSCD 北大核心 2018年第4期1018-1022,共5页
现有的多变量决策树在分类准确性与树结构复杂性两方面优于单变量决策树,但其训练时间却高于单变量决策树,使得现有的多变量决策树不适用于快速响应的分类任务。针对现有多变量决策树训练时间高的问题,提出了基于信息熵和几何轮廓相... 现有的多变量决策树在分类准确性与树结构复杂性两方面优于单变量决策树,但其训练时间却高于单变量决策树,使得现有的多变量决策树不适用于快速响应的分类任务。针对现有多变量决策树训练时间高的问题,提出了基于信息熵和几何轮廓相似度的多变量决策树(IEMDT)。该算法利用几何轮廓相似度函数的一对一映射特性,将n维空间样本点投影到一维空间的数轴上,进而形成有序的投影点集合;然后通过类别边界和信息增益计算最优分割点集,将有序投影点集合划分为多个子集;接着分别对每个子集继续投影分割,最终生成决策树。在八个数据集上的实验结果表明,IEMDT具有较低的训练时间,并且具有较高的分类准确性。 展开更多
关键词 多变量决策树 分类 单变量决策树 几何轮廓相似度 信息增益
在线阅读 下载PDF
运用信息增益和不一致度进行填补的属性约简算法
19
作者 李虹利 蒙祖强 《计算机科学》 CSCD 北大核心 2018年第10期217-224,共8页
针对不完备、不一致性数据的属性约简是数据挖掘研究的一个重要内容。将信息增益,不一致度相结合,提出一种面向不完备不一致性数据的属性约简算法。首先,介绍了信息增益,定义了不一致度的概念与算法公式,并给出了基于二者对数据进... 针对不完备、不一致性数据的属性约简是数据挖掘研究的一个重要内容。将信息增益,不一致度相结合,提出一种面向不完备不一致性数据的属性约简算法。首先,介绍了信息增益,定义了不一致度的概念与算法公式,并给出了基于二者对数据进行填补的方法;然后,基于该填补方法,以最大不一致度条件下的信息增益为权值,以不一致度为属性约简的启发信息,给出属性约简算法;最后,通过实验证明了所提算法的有效性。 展开更多
关键词 信息增益 填补 属性约简 不一致性 不完备
在线阅读 免费下载
基于混合特征选择算法的民航可疑订单特征提取 预览
20
作者 丁建立 付丽洋 +1 位作者 曹卫东 王家亮 《计算机工程与设计》 北大核心 2018年第9期2887-2893,共7页
为快速识别民航旅客订票系统中的可疑订单并及时清理占座,填补航空公司的收益漏洞,提出一种基于Filter-Wrapper的可疑订单特征选择算法。通过对特征的信息增益排序快速找到最优候选特征子集,利用序列前向浮动搜索算法(sequential forwar... 为快速识别民航旅客订票系统中的可疑订单并及时清理占座,填补航空公司的收益漏洞,提出一种基于Filter-Wrapper的可疑订单特征选择算法。通过对特征的信息增益排序快速找到最优候选特征子集,利用序列前向浮动搜索算法(sequential forward floating search,SFFS)约简并提取影响可疑订单的相关维度。采用C4.5决策树算法分类建模,实验验证了可疑订单特征选择算法具有较低的计算复杂度并达到了较高的可疑订单识别率,为构建可疑订单识别模型提供了思路。 展开更多
关键词 民航收益漏洞 可疑订单 特征选择 信息增益 序列前向浮动搜索 决策树
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部 意见反馈