期刊文献+
共找到1,636篇文章
< 1 2 82 >
每页显示 20 50 100
文章速递基于聚类的文本分类算法框架研究 认领
1
作者 黄细凤 《计算机与数字工程》 2021年第1期21-25,93,共6页
KNN算法因其易于理解、理论成熟等优点而被广泛应用于文本分类。由于KNN需遍历样本空间计算距离,当训练集样本规模较大或维数较高时,计算开销是巨大的。针对此问题,首先将遗传算法适应度函数设计部分与K-medoids算法思想相融合形成K-GA-... KNN算法因其易于理解、理论成熟等优点而被广泛应用于文本分类。由于KNN需遍历样本空间计算距离,当训练集样本规模较大或维数较高时,计算开销是巨大的。针对此问题,首先将遗传算法适应度函数设计部分与K-medoids算法思想相融合形成K-GA-medoids,其次将其与KNN相结合形成用于文本分类的算法框架,在分类过程中,采取先聚类,再分类的步骤,以实现对训练集样本的缩减,从而降低计算开销。实验表明,K-GA-medoids相较于传统K-medoids而言在聚类效果上有较为明显的提升,且将其与KNN相结合形成的文本分类算法框架与传统KNN算法相比在保证分类精确率的前提下,有效提升了文本分类的效率。 展开更多
关键词 KNN K-medoids 文本分类 聚类分析 遗传算法
在线阅读 下载PDF
文章速递Research on Key Technologies of Hand Function Rehabilitation Training Evaluation System Based on Leap Motion 认领
2
作者 Zhiguo Xiao Yifei Zhao +2 位作者 Nianfeng Li Shang Zhou Hu Xu 《电脑和通信(英文)》 2021年第1期19-35,共17页
This paper proposes an immersive training system for patients with hand dysfunction who can perform rehabilitation training independently. The system uses Leap Motion binocular vision sensors to collect human hand inf... This paper proposes an immersive training system for patients with hand dysfunction who can perform rehabilitation training independently. The system uses Leap Motion binocular vision sensors to collect human hand information, and uses the improved PCA<sub><img src="Edit_d6662636-9073-4fbd-855f-9a36e871d5a4.png" width="10" height="15" alt="" /></sub> (Principal Component Analysis) to perform data fusion on the real-time data collected by the sensor to obtain more hands with fewer principal components, and improve the stability and accuracy of the data. Immediately, the use of improved SVM<sub><img src="Edit_10c78725-e09e-4dcf-ae05-e21205df4acc.png" width="10" height="15" alt="" /></sub> (Support Vector Machine) and KNN<sub><img src="Edit_0ee97f55-2773-4b48-93b3-93f61aa25577.png" width="10" height="15" alt="" /></sub> (K-Nearest Neighbor Algorithm) for gesture recognition and classification is proposed to enable patients to perform rehabilitation training more effectively. Finally, the effective evaluation results of the rehabilitation effect of patients by the idea of AHP<sub><img src="Edit_70dd1964-28be-4137-afa5-9a184704f08e.png" width="10" height="15" alt="" /></sub> (Analytic Hierarchy Process) are taken as necessary reference factors for doctors to follow up treatment. Various experimental results show that the system has achieved the expected results and has a good application prospect. 展开更多
关键词 Leap Motion Immersive AHP PCA SVM KNN Hand Function Rehabilitation Evaluation System
在线阅读 下载PDF
基于深度学习的汽车保险片识别插接研究 认领
3
作者 曹宇 张庆鹏 《制造技术与机床》 北大核心 2020年第12期138-141,共4页
针对传统汽车保险片采用人工插接无法满足工厂批量化插接的问题,提出一种基于深度学习的汽车保险片自动插接算法,该方法使用CCD工业摄像机结合远心镜头采集保险片的图像信息。采用基于KNN算法匹配保险盒的保险片插件槽位置,使用Faster R... 针对传统汽车保险片采用人工插接无法满足工厂批量化插接的问题,提出一种基于深度学习的汽车保险片自动插接算法,该方法使用CCD工业摄像机结合远心镜头采集保险片的图像信息。采用基于KNN算法匹配保险盒的保险片插件槽位置,使用Faster R-CNN网络对保险片识别定位,算法对9种颜色的保险片准确识别,最后由SCARA四轴机器人自动完成插接操作。经过实验验证,对常见的9种颜色的保险片识别准确率能达到99.8%,对保险片插接平均周期为1 s和1.5 s时,SCARA机器人对6个汽车保险盒同时插接保险片的准确率达96.87%以上。 展开更多
关键词 机器视觉 深度学习 KNN Faster R-CNN
在线阅读 下载PDF
基于SIFT和CIE Lab的图像篡改检测 认领
4
作者 宋凯 覃圣淋 《沈阳建筑大学学报:自然科学版》 CAS CSCD 北大核心 2020年第5期932-938,共7页
目的提出一种将SIFT算法和CIE Lab颜色模型相结合的方法来检测复制-移动篡改图像,解决传统SIFT(Scale-invariant feature transform)算法无法应用颜色特征进行篡改图像检测所导致的特征关键点的错误匹配问题,提高篡改图像检测的准确度.... 目的提出一种将SIFT算法和CIE Lab颜色模型相结合的方法来检测复制-移动篡改图像,解决传统SIFT(Scale-invariant feature transform)算法无法应用颜色特征进行篡改图像检测所导致的特征关键点的错误匹配问题,提高篡改图像检测的准确度.方法分别提取图像的SIFT特征与Lab颜色特征;使用KNN(K-Nearest Neighbor)算法对提取的特征进行分类匹配,排除异常特征值.结果笔者所提方法与以往的SIFT算法相比较,其错误匹配个数明显下降,降低了时间复杂度,提高了检测准确率,对图像篡改部分的平移、缩放和旋转操作都具有较强的鲁棒性,这三种操作对应的F1值分别可达86.8%,88.4%,88.5%.结论 SIFT算法和CIE Lab颜色模型提取的特征能够较好地满足检测复制-移动篡改图像的要求,颜色信息能够有效地改善特征匹配效果,KNN算法能够成功地排除异常匹配点. 展开更多
关键词 图像篡改检测 SIFT CIE Lab 复制-移动篡改图像 KNN
在线阅读 下载PDF
网站用户行为分析及服务推荐研究 认领
5
作者 张婉婷 赵敏 《智能计算机与应用》 2020年第2期71-74,共4页
本文运用基于物品的协同过滤推荐算法设计法律资讯信息推荐系统。介绍了该算法需要的数学理论知识,如相似度计算方法、系统评估方法和KNN算法等。详细解释了基于物品的协同过滤推荐算法及其具体实现步骤。最后构建法律资讯信息推荐系统... 本文运用基于物品的协同过滤推荐算法设计法律资讯信息推荐系统。介绍了该算法需要的数学理论知识,如相似度计算方法、系统评估方法和KNN算法等。详细解释了基于物品的协同过滤推荐算法及其具体实现步骤。最后构建法律资讯信息推荐系统并对系统做出评估。通过实验仿真分析,发现基于物品的协同过滤算法在物品种类丰富,用户个性化需求强烈的领域优势明显。其相关的推荐和解释利用用户的历史行为数据,结果让用户信服。 展开更多
关键词 协同过滤 相似度 KNN 法律资讯信息推荐系统
在线阅读 免费下载
基于ResNet-18-KNN的变电站人员电气违规行为识别 认领
6
作者 白景涛 周照宇 +1 位作者 王中一 孙黎霞 《机械制造与自动化》 2020年第2期174-177,共4页
为了降低变电站工作人员在作业过程中的电气违规行为发生率,减少电力事故频次,将迁移学习方法、残差网络和K最近邻(KNN)分类器进行有效结合,建立了ResNet-18-KNN模型。使用图像增强方法对样本进行数据增强扩充,解决样本数据不足且不均... 为了降低变电站工作人员在作业过程中的电气违规行为发生率,减少电力事故频次,将迁移学习方法、残差网络和K最近邻(KNN)分类器进行有效结合,建立了ResNet-18-KNN模型。使用图像增强方法对样本进行数据增强扩充,解决样本数据不足且不均衡的问题;使用残差网络完成数据特征向量的提取;采用KNN分类器完成变电站人员电气违规行为的识别。根据实际电网算例,该方法与其他网络模型相比较,具有更好的性能,可以准确地判断变电站人员是否有电气违规行为,准确率达到90.7%。 展开更多
关键词 深度学习 迁移学习 数据增强 电气违规 行为识别 KNN 智能变电站
在线阅读 下载PDF
基于KNN的10 kV配电电缆绝缘状态评估 认领
7
作者 罗彦鹏 夏向阳 厉广城 《电工材料》 CAS 2020年第3期43-45,共3页
当前,配电电缆在电网的电力传输中得到了普遍的应用,停电试验属于分析电缆运行状态的主要手段之一。为了科学评估多因素条件下电缆绝缘状态,提出了KNN基础上的10 kV配电电缆绝缘寿命评估模型,评判方法更贴近10 kV电缆绝缘的实际状况。... 当前,配电电缆在电网的电力传输中得到了普遍的应用,停电试验属于分析电缆运行状态的主要手段之一。为了科学评估多因素条件下电缆绝缘状态,提出了KNN基础上的10 kV配电电缆绝缘寿命评估模型,评判方法更贴近10 kV电缆绝缘的实际状况。结果表明,基于KNN的绝缘状态评估模型有着可行性。 展开更多
关键词 10 kV电缆 KNN 状态
在线阅读 下载PDF
基于拉曼光谱和改进KNN算法的油纸绝缘设备老化阶段判别 认领
8
作者 赵金勇 周永阔 +2 位作者 陈钰 韩丙光 杨定坤 《光散射学报》 2020年第2期142-147,共6页
电力变压器是电力系统中不可或缺的核心组成。油纸绝缘设备运行老化的过程中,绝缘油或纸在电或热的作用下发生分解产生如糠醛、丙酮、甲醇、CO、CO2等各种反映绝缘老化状态的特征物质,并溶解于油中,使绝缘油中蕴含大量油纸绝缘老化信息... 电力变压器是电力系统中不可或缺的核心组成。油纸绝缘设备运行老化的过程中,绝缘油或纸在电或热的作用下发生分解产生如糠醛、丙酮、甲醇、CO、CO2等各种反映绝缘老化状态的特征物质,并溶解于油中,使绝缘油中蕴含大量油纸绝缘老化信息。为了对油纸绝缘老化阶段进行有效诊断,本文通过加速热老化试验,获取了大量老化油样,根据老化天数将样本分为12类,并通过拉曼光谱获取了230张拉曼谱图。通过KNN算法,利用皮尔森相关系数对待测样本类别进行了预测,之后对模型引入欧几里得距离,对KNN算法进行了改进,使预测正确率达到了87.92%,并且降低了类别预测偏差。 展开更多
关键词 拉曼光谱 油纸绝缘 热老化 光谱分析 KNN 老化诊断
在线阅读 下载PDF
基于特征融合的脑部图像多级分类 认领
9
作者 刘承裕 《国外电子测量技术》 2020年第11期28-33,共6页
目前医学图像数量巨大,利用计算机处理医学图像从而辅助医疗诊断是医学领域研究的热点。根据脑部图像具有对称性的特点,选择支持向量机-递归特征消除(SVM-RFE)算法对融合特征进行特征选择过程中,引入Pearson系数衡量特征信息的冗余度,... 目前医学图像数量巨大,利用计算机处理医学图像从而辅助医疗诊断是医学领域研究的热点。根据脑部图像具有对称性的特点,选择支持向量机-递归特征消除(SVM-RFE)算法对融合特征进行特征选择过程中,引入Pearson系数衡量特征信息的冗余度,将特征相关性指标融入SVM-RFE特征子集的筛选标准中,提升了融合特征的分类性能。在一级分类基础上,基于特征学习方法,构建了2Layer-RBM-KNN二级脑部图像分类模型,增加网络深度以进行更高层次的特征抽象,并且结合数据集探究了分类器的选择,实现样本再分类。 展开更多
关键词 脑部图像识别分类 特征融合 RBM KNN
不完整数据聚类算法研究 认领
10
作者 冷泳林 孙晓红 《计算机技术与发展》 2020年第8期61-65,72,共6页
服务类电子政务通过单向或互动的方式向社会和公民提供诸如天气、统计数据、道路交通等信息。这些服务类信息在数据采集过程中,不可避免地会出现各种各样的数据质量问题,数据的不完整性就是其中一种。数据的不完整性对后续的信息统计、... 服务类电子政务通过单向或互动的方式向社会和公民提供诸如天气、统计数据、道路交通等信息。这些服务类信息在数据采集过程中,不可避免地会出现各种各样的数据质量问题,数据的不完整性就是其中一种。数据的不完整性对后续的信息统计、挖掘都会造成严重影响。以不完整数据为研究对象,在分析了当前不完整数据聚类算法存在问题的基础上,提出一种基于KNN的不完整数据AP聚类算法。算法首先给出了连续数值型和分类型数据的相似性度量方法,然后利用AP聚类算法对数据集中的完整数据进行聚类,最后利用KNN思想将完整数据集中的吸引度矩阵和归属度矩阵扩展至整个数据集,继续执行迭代,直至收敛。实验将该算法同其他不完整数据聚类算法在聚类精度上进行比较,验证了提出的不完整数据聚类算法的有效性。 展开更多
关键词 电子政务 不完整数据 聚类 相似度 KNN 数据离散
在线阅读 下载PDF
基于多尺度细节优化的MSRCR图像去雾算法 认领
11
作者 王小芳 方登杰 +1 位作者 何海瑞 邹倩颖 《实验技术与管理》 CAS 北大核心 2020年第9期92-97,共6页
针对Retinex去雾后图片模糊、细节不明显现象,该文提出基于多尺度细节优化的MSRCR图像去雾算法。该算法首先采用MSRCR对图片进行整体去雾操作,在MSRCR算法处理图像像素分类过程中,为降低像素分类时间,该文采用K近邻算法(K nearest neigh... 针对Retinex去雾后图片模糊、细节不明显现象,该文提出基于多尺度细节优化的MSRCR图像去雾算法。该算法首先采用MSRCR对图片进行整体去雾操作,在MSRCR算法处理图像像素分类过程中,为降低像素分类时间,该文采用K近邻算法(K nearest neighbor,KNN)对图片像素进行快速分类;然后采用双边滤波算法对处理后的图片中的噪声和边缘损失进行处理;最后采用MsDB算法对图片细节进行优化。实验结果表明,该文算法相较传统算法而言,在合成雾天图像处理后图片的峰值信噪比(peaksignaltonoise ratio,PSNR)和结构相似性(structural similarity,SSIM)平均分别提升22.03%和21.58%;较自然雾天处理后图片的平均梯度、信息熵、Vollaths值平均分别提升127.62%、6.96%、227.61%。 展开更多
关键词 MSRCR KNN 双边滤波 MsDB
在线阅读 下载PDF
基于KNN-LSTM的PM2.5浓度预测模型 认领
12
作者 宋飞扬 铁治欣 +1 位作者 黄泽华 丁成富 《计算机系统应用》 2020年第7期193-198,共6页
目前多数PM2.5浓度预测模型仅利用单个站点的时间序列数据进行浓度预测,并没有考虑到空气质量监测站之间的区域关联性,这会导致预测存在一定的片面性.本文利用KNN算法选择目标站点所在区域中与其相关的空间因素,并结合LSTM模型,提出基... 目前多数PM2.5浓度预测模型仅利用单个站点的时间序列数据进行浓度预测,并没有考虑到空气质量监测站之间的区域关联性,这会导致预测存在一定的片面性.本文利用KNN算法选择目标站点所在区域中与其相关的空间因素,并结合LSTM模型,提出基于时空特征的KNN-LSTM的PM2.5浓度预测模型.以哈尔滨市10个空气质量监测站的污染物数据进行仿真实验,并将KNN-LSTM模型与其他预测模型进行对比,结果显示:模型相较于BP神经网络模型平均绝对误差(MAE)、均方根误差(RMSE)分别降低了19.25%、13.23%;相较于LSTM模型MAE、RMSE分别降低了4.29%、6.99%.表明本文所提KNN-LSTM模型能有效提高LSTM模型的预测精度. 展开更多
关键词 PM2.5预测 空间相关性 KNN LSTM
在线阅读 下载PDF
基于Spark的大规模文本KNN并行分类算法 认领
13
作者 李宏志 李苋兰 赵生慧 《湖南科技大学学报:自然科学版》 CAS 北大核心 2020年第1期90-97,共8页
在使用KNN算法进行大规模文本分类,需要处理频繁的迭代运算,针对现有Hadoop平台迭代运算效率较低的问题,本文提出一种基于Spark平台的并行优化KNN算法.主要从3个方面对算法进行优化,首先,对于训练数据集通过剪枝算法控制有效数据的规模... 在使用KNN算法进行大规模文本分类,需要处理频繁的迭代运算,针对现有Hadoop平台迭代运算效率较低的问题,本文提出一种基于Spark平台的并行优化KNN算法.主要从3个方面对算法进行优化,首先,对于训练数据集通过剪枝算法控制有效数据的规模,从而减少迭代运算的次数;其次,针对高维数据集采用ID3算法利用信息熵进行属性降维,减少文本相似度的运算量;最后,使用Spark并行计算平台,引入内存计算最大限度地减少了迭代运算的I/O次数,提高处理速度.通过实验,与常用的KNN算法相比,基于Spark的KNN文本并行分类算法在加速比、扩展性等主要性能指标上表现较优,能够较好地满足大规模文本分类的需求. 展开更多
关键词 KNN 并行化 文本分类 SPARK RDD MAPREDUCE
一种基于SMOTE的不均衡样本KNN分类方法 认领
14
作者 林泳昌 朱晓姝 《广西科学》 CAS 2020年第3期276-283,共8页
针对在数据样本不均衡时,K近邻(K-nearest Neighbor,KNN)方法的预测结果会偏向样本数占优类的问题,本文提出了一种基于合成少数类过采样方法(SMOTE)的KNN不均衡样本分类优化方法(KSID)。该方法过程为:首先使用SMOTE方法将不均衡的训练... 针对在数据样本不均衡时,K近邻(K-nearest Neighbor,KNN)方法的预测结果会偏向样本数占优类的问题,本文提出了一种基于合成少数类过采样方法(SMOTE)的KNN不均衡样本分类优化方法(KSID)。该方法过程为:首先使用SMOTE方法将不均衡的训练集均衡化,并训练逻辑回归模型;然后使用逻辑回归模型对训练集进行预测,获取预测为正样本的数据,通过使用SMOTE方法均衡化该正样本,并训练KNN模型;最后把测试集放入该结合逻辑回归方法的KNN模型进行预测,得到最终的预测结果。围绕6个不均衡数据集,将KSID与逻辑回归、KNN和支持向量机(SVM)决策树等方法进行对比实验,结果表明,KSID方法在准确率、查全率、查准率、F1值这4个性能指标上均优于其他3种方法。通过引入SMOTE,KSID方法克服了KNN模型遇到样本不均衡数据集时,产生分类偏向的问题,为进一步研究KNN方法的优化和应用提供参考。 展开更多
关键词 不均衡样本 KNN SMOTE KSID 逻辑回归 分类
在线阅读 免费下载
基于KNN算法识别合水地区长7储层岩性岩相 认领 被引量:1
15
作者 陈玉林 李戈理 +3 位作者 杨智新 肖飞 车锐媚 陈彦竹 《测井技术》 CAS 2020年第2期182-185,共4页
岩性岩相识别与划分是地层评价和油藏精细描述的一项重要工作。在岩性岩相分类中,基于Scikit-learn机器学习框架,采用岩心观察描述和薄片分析数据划分了鄂尔多斯盆地合水地区长7地层的岩性岩相,形成了机器学习样本库训练集和测试集;运用... 岩性岩相识别与划分是地层评价和油藏精细描述的一项重要工作。在岩性岩相分类中,基于Scikit-learn机器学习框架,采用岩心观察描述和薄片分析数据划分了鄂尔多斯盆地合水地区长7地层的岩性岩相,形成了机器学习样本库训练集和测试集;运用Python编程软件,编写基于KNN(K-近邻算法)的机器学习模块,对训练集中的数据进行学习,形成预测模型,用测试集对模型进行测试评价,测试结果显示KNN模型分类准确率为89.5%,总体预测效果较好,为后续储层三维精细建模提供了技术支持。 展开更多
关键词 测井评价 岩性岩相 KNN 机器学习 合水地区
在线阅读 下载PDF
低谷储热负荷特征提取方法研究 认领
16
作者 田坤 杨俊友 +2 位作者 韩子娇 王海鑫 唱一鸣 《东北电力技术》 2020年第6期13-17,25,共6页
蓄热式电采暖是提高风电消纳能力的重要手段。目前因为电网数据庞大且数据质量较差,传统单一方法对储热负荷不能进行准确提取,导致数据提取结果不精确,对进一步电采暖用户特性分析造成困难。针对上述问题,提出基于K-means聚类算法、K邻... 蓄热式电采暖是提高风电消纳能力的重要手段。目前因为电网数据庞大且数据质量较差,传统单一方法对储热负荷不能进行准确提取,导致数据提取结果不精确,对进一步电采暖用户特性分析造成困难。针对上述问题,提出基于K-means聚类算法、K邻近算法(KNN)、支持向量机(SVM) 3种算法相结合的电网储热负荷特征提取方法(KKS方法)。首先用K-means聚类,选取数据特征明显的数据作为训练集,然后用KNN和SVM进行训练,最后使用KNN和SVM对预处理过的数据进行提取,以提高对储热负荷数据质量提取的精确度,使储热负荷分析更加精确。以某省储热负荷为例,对比所提方法与传统方法,该方法提取结果比K-means、KNN、SVM单独使用分别多了32、16、24个用户数据,可知该方法提取准确度更高,显示出在负荷提取方面的优越性。 展开更多
关键词 储热 特征提取 KKS K-MEANS KNN SVM
在线阅读 下载PDF
Plant Disease Detection with Deep Learning and Feature Extraction Using Plant Village 认领
17
作者 Faye Mohameth Chen Bingcai Kane Amath Sada 《电脑和通信(英文)》 2020年第6期10-22,共13页
Nowadays, crop diseases are a crucial problem to the world’s food supplies, in a world where the population count is around 7 billion people, with more than 90% not getting access to the use of tools or features that... Nowadays, crop diseases are a crucial problem to the world’s food supplies, in a world where the population count is around 7 billion people, with more than 90% not getting access to the use of tools or features that would identify and solve the problem. At present, we live in a world dominated by technology on a significant scale, major network coverage, high-end smart-phones, as long as there are great discoveries and improvements in AI. The combination of high-end smart-phones and computer vision via Deep Learning has made possible what can be defined as “smartphone-assisted disease diagnosis”. In the area of Deep Learning, multiple architecture models have been trained, some achieving performance reaching more than 99.53% [1]. In this study, we evaluate CNN’s architectures applying transfer learning and deep feature extraction. All the features obtained will also be classified by SVM and KNN. Our work is feasible by the use of the open source Plant Village Dataset. The result obtained shows that SVM is the best classifier for leaf’s diseases detection. 展开更多
关键词 Plant Diseases Detection Feature Extraction Transfer Learning SVM KNN
在线阅读 免费下载
基于恐怖袭击特征分析的恐怖组织预测方法研究 认领
18
作者 罗维平 周博 《情报杂志》 CSSCI 北大核心 2020年第11期18-24,共7页
[目的/意义]根据不同恐怖组织所具有的不同的特征构建恐怖活动与恐怖组织关联性预测模型,对凶手未知的恐怖活动嫌疑人进行预测,得到准确率及精度较高的预测结果。[方法/过程]在对GTD提供的恐怖袭击数据进行清洗筛选的基础上,使用经过特... [目的/意义]根据不同恐怖组织所具有的不同的特征构建恐怖活动与恐怖组织关联性预测模型,对凶手未知的恐怖活动嫌疑人进行预测,得到准确率及精度较高的预测结果。[方法/过程]在对GTD提供的恐怖袭击数据进行清洗筛选的基础上,使用经过特征工程选择且通过学习曲线验证能使模型达到最优效果的29个特征变量作为输入变量输入机器学习模型进行训练,并针对各模型特点进行模型结果融合得到最终关联性模型。[结果/结论]单个模型预测效果最佳的为随机森林,精度为83.24%;对恐怖组织样本进行频率细分后,结合随机森林及KNN模型自身特点分别在高频、中频、低频段得到的模型精度为88.53%、87.25%、86.14%,模型性能整体得到提升,特别在低频恐怖组织预测上也能得到较好表现。 展开更多
关键词 恐怖袭击 预测模型 特征工程 机器学习 随机森林 KNN
在线阅读 下载PDF
基于Stacking集成学习算法的疾病风险预测——以妊娠糖尿病为例 认领
19
作者 周颂奇 白颖 《统计学与应用》 2020年第3期345-356,共12页
本文共采用了四种缺失值处理方案进行缺失值处理,并根据六种机器学习算法分析比较出了这四种缺失值处理方案的优劣程度。对于每一种机器学习算法,本文都给出了为防止算法模型过拟合所应采取的措施,并通过比较各算法预测结果的F1值,筛选... 本文共采用了四种缺失值处理方案进行缺失值处理,并根据六种机器学习算法分析比较出了这四种缺失值处理方案的优劣程度。对于每一种机器学习算法,本文都给出了为防止算法模型过拟合所应采取的措施,并通过比较各算法预测结果的F1值,筛选出合适的算法模型作为Stacking集成学习算法的初级学习器,然后选取逻辑回归算法为该集成学习算法的次级学习器。最终,通过调节逻辑回归算法的参数得到精度高、泛化能力强的基于妊娠期糖尿病患病风险预测问题的Stacking集成学习算法模型。 展开更多
关键词 KNN MLPC GBDT 随机森林 SVM 朴素贝叶斯 STACKING
在线阅读 下载PDF
基于天气对地铁的短时客流预测 认领
20
作者 金聪 周健勇 《物流科技》 2020年第3期99-104,共6页
随着社会的发展,人们的出行方式也呈现多元化。地铁因为安全、准时、环保等特点日益成为人们出行时优先考虑的交通工具。为了研究人们的出行方式,掌握客流特征,轨道公司进行了大量关于客流预测方面的研究。文章基于不同类型站点之间可... 随着社会的发展,人们的出行方式也呈现多元化。地铁因为安全、准时、环保等特点日益成为人们出行时优先考虑的交通工具。为了研究人们的出行方式,掌握客流特征,轨道公司进行了大量关于客流预测方面的研究。文章基于不同类型站点之间可能对应的引起客流量波动的因素不同,首先将宁波的3条线上的各个站点通过K-means聚类分成4种类型,在站点分好类的基础上分别在各个站点去做多元线性回归预测以及KNN算法预测客流,并比较两种算法的预测结果。 展开更多
关键词 客流预测 K-MEANS聚类 站点分类 多元线性回归 KNN
在线阅读 下载PDF
上一页 1 2 82 下一页 到第
使用帮助 返回顶部 意见反馈