期刊文献+
共找到595篇文章
< 1 2 30 >
每页显示 20 50 100
一种基于谱嵌入和局部密度的离群点检测算法 预览
1
作者 李长镜 赵书良 池云仙 《计算机科学》 CSCD 北大核心 2019年第3期260-266,共7页
离群点检测问题是数据挖掘领域的研究热点之一。现有的检测算法主要应用于离群点位于初始属性子空间或底层子空间各种线性组合等情况,当离群点嵌入局部非线性子空间时,进行离群点有效检测的难度很大。为此,文中分析了典型的谱嵌入算法... 离群点检测问题是数据挖掘领域的研究热点之一。现有的检测算法主要应用于离群点位于初始属性子空间或底层子空间各种线性组合等情况,当离群点嵌入局部非线性子空间时,进行离群点有效检测的难度很大。为此,文中分析了典型的谱嵌入算法在离群点检测上存在的不足,然后以局部密度为基础,提出了一种基于谱嵌入和局部密度的离群点检测算法。该算法采用迭代策略对不重要的特征向量进行高效筛查,以发现有助于检测出局部非线性子空间离群点的特征向量,并利用上一次迭代获得的基于局部密度的谱嵌入结果来改进下一次迭代的相似度图,经过多次迭代可以将离群点从正常点中分离。仿真实验结果表明,所提算法的检测精度优于当前其他典型算法,且该算法对参数的设置不敏感。 展开更多
关键词 离群点检测 谱嵌入 局部密度 迭代策略 相似度图 检测精度
在线阅读 免费下载
基于RBF神经网络的非线性野点检测方法
2
作者 金鑫 吴旭翔 《控制工程》 CSCD 北大核心 2019年第1期99-104,共6页
针对工业系统采集的数据容易出现野点的问题,提出一种异常数据的智能化检测方法。这种方法首先使用改进的径向基神经网络(RBFN)对工业系统的输出值进行预测,之后利用三倍方差准则的方法对预测值与系统的实际输出值之差进行检测。PH中和... 针对工业系统采集的数据容易出现野点的问题,提出一种异常数据的智能化检测方法。这种方法首先使用改进的径向基神经网络(RBFN)对工业系统的输出值进行预测,之后利用三倍方差准则的方法对预测值与系统的实际输出值之差进行检测。PH中和滴定过程仿真实验结果表明这种方法能够有效的对非线性系统数据中的野点进行检测。 展开更多
关键词 径向基神经网络 输入输出模型 野点检测 3倍方差准则
基于离群点检测的高压并联电抗器本体电流互感器测量异常故障在线诊断 预览
3
作者 滕予非 吴杰 +2 位作者 张真源 姜振超 黄琦 《电工技术学报》 EI CSCD 北大核心 2019年第11期2405-2414,共10页
为提升高压并联电抗器过电流在线监测系统的准确度,提出了基于离群点检测的高压并联电抗器本体电流互感器测量异常故障在线诊断方法。首先,利用Sigmoid函数对母线特定电压条件下电抗器过电流报警信号条件概率与母线电压有效值间的函数... 为提升高压并联电抗器过电流在线监测系统的准确度,提出了基于离群点检测的高压并联电抗器本体电流互感器测量异常故障在线诊断方法。首先,利用Sigmoid函数对母线特定电压条件下电抗器过电流报警信号条件概率与母线电压有效值间的函数关系进行拟合,并选取函数中心点及不确定域作为特征指标,构成二维关键特征数据点(KCDP),用以进行故障诊断。其次,将正常工况下获得的多个关键特征数据点以及检测日关键特征数据点构成诊断数据集,利用孤立森林算法对其进行离群点检测,计算集合中每个关键特征数据点的异常分数。最后,假设正常工况下关键特征数据点的异常分数满足威布尔分布,基于分布的置信区间给出了高压并联电抗器本体电流互感器测量异常故障的诊断判据。某实际500kV高压并联电抗器算例,验证了方法的有效性。 展开更多
关键词 高压并联电抗器 离群点检测 孤立森林算法 条件概率 威布尔分布
在线阅读 下载PDF
面向分类型矩阵数据的无监督孤立点检测算法 预览
4
作者 吴晓林 曹付元 《深圳大学学报:理工版》 CAS CSCD 北大核心 2019年第1期33-42,共10页
孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向... 孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向分类型矩阵数据的孤立点检测算法.在Marketbasket、Microsoft web和MovieLens真实数据集上的实验结果表明,与基于共同近邻(common-neighbor-based,CNB)算法、局部异常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效检测分类型矩阵数据中的孤立点. 展开更多
关键词 人工智能 孤立点检测 分类型矩阵数据 耦合度 内聚度 数据挖掘
在线阅读 免费下载
一种BP神经网络的室内定位WiFi标定方法 预览
5
作者 宋斌斌 余敏 +2 位作者 何肖娜 薛峰 阮超 《导航定位学报》 CSCD 2019年第1期43-47,共5页
针对不同型号智能手机间WiFi软硬件异构导致的对同一AP信号源的观测量存在偏差,最终影响定位精度的问题,提出一种使用BP神经网络的WiFi标定方法:使用离群点检测算法剔除不同手机RSSI数据对中的离群点,获得相对纯净的数据对输入到BP神经... 针对不同型号智能手机间WiFi软硬件异构导致的对同一AP信号源的观测量存在偏差,最终影响定位精度的问题,提出一种使用BP神经网络的WiFi标定方法:使用离群点检测算法剔除不同手机RSSI数据对中的离群点,获得相对纯净的数据对输入到BP神经网络进行训练;并对网络各层的权值和偏向值进行反复更新,使得输出值逼近真实值;当输出层误差的平方和小于阈值时则训练完成,保存各层的权值和偏向值就可得到较为稳定的网络标定模型,利用该模型可对不同型号手机的观测量进行校正。实验结果表明,该标定方法的定位精度比标定前可以提高39.72%,有效降低手机软硬件异构对定位精度的影响。 展开更多
关键词 软硬件异构 无线保真(WiFi)标定 反向传播(BP)神经网络 离群点检测 网络标定模型
在线阅读 下载PDF
基于One-class SVM的噪声图像分割方法 预览
6
作者 尚方信 郭浩 +1 位作者 李钢 张玲 《计算机应用》 CSCD 北大核心 2019年第3期874-881,共8页
为解决现有无监督图像分割模型对强噪声环境鲁棒性差、无法适应复杂混合噪声的问题,提出了一种基于One-class SVM方法的改进后的噪声鲁棒图像分割模型。首先,基于One-class SVM构建一种数据离群程度检测机制;然后,将离群程度值引入能量... 为解决现有无监督图像分割模型对强噪声环境鲁棒性差、无法适应复杂混合噪声的问题,提出了一种基于One-class SVM方法的改进后的噪声鲁棒图像分割模型。首先,基于One-class SVM构建一种数据离群程度检测机制;然后,将离群程度值引入能量泛函,令分割模型可以在多种噪声强度下获得较为准确的图像信息,同时避免现有方法在强噪声环境下,降权机制失效的问题;最后,通过最小化能量函数,驱动分割轮廓向目标边缘演化。在噪声图像分割实验中,当选取不同类型和强度的噪声时,该模型均能得到较为理想的分割结果。在F1-score评估标准下,该模型比基于局部相关熵的K-means(LCK)模型高0.2~0.3,在强噪声环境下具有更高的稳定性,且在分割收敛时间上仅略大于LCK模型0.1 s左右。实验结果表明,所提模型在未显著增加分割耗时的前提下,对于概率、极值及混合噪声均有着更强的鲁棒性,并且可以分割带有噪声的自然图像。 展开更多
关键词 图像分割 图像噪声 单类支持向量机 离群检测 能量项
在线阅读 下载PDF
大数据下的销售异常发现与定位模型研究
7
作者 刘菊君 姜磊 +2 位作者 彭雄 周倩 杨先圣 《小型微型计算机系统》 CSCD 北大核心 2019年第1期64-68,共5页
当今时代传统零售业竞争异常激烈且数据量庞大,因此在大数据平台下挖掘异常并让其辅助决策成为企业提高竞争力的有效手段.目前大多数离群点检测方法仅能对具有可比性的数据进行异常挖掘,但销售数据却受到季节性、节假日等因素影响而失... 当今时代传统零售业竞争异常激烈且数据量庞大,因此在大数据平台下挖掘异常并让其辅助决策成为企业提高竞争力的有效手段.目前大多数离群点检测方法仅能对具有可比性的数据进行异常挖掘,但销售数据却受到季节性、节假日等因素影响而失去可比性,且管理层的需求并不仅仅是挖掘异常,其最终目的是定位异常、实现责任到人等实用意义,从而针对销售数据的异常发现与定位方法成为一大难题.为此提出了大数据下的销售数据的异常发现与定位模型.该模型利用权重的思想使数据具有可比性,从不同角度的数据进行离群点检测后通过建立概率模型实现异常定位.由于权重思想及独有的异常定位两个特征,该模型在实际应用于步步高商业连锁股份有限公司时获得了相关专业人员的高度认可. 展开更多
关键词 大数据 离群点检测 异常发现 异常定位 权重
基于机群划分方法的风电场理论发电功率计算研究
8
作者 张小奇 张振宇 +2 位作者 孙骁强 万筱钟 王勃 《高电压技术》 EI CAS CSCD 北大核心 2019年第1期284-292,共9页
科学统计风电理论功率对评价其受阻情况至关重要,因此提出一种基于机群划分方法的风电场理论发电功率计算模型:首先,考虑到单机机头风速的测量偏差,通过多步k聚类算法剔除了风速数据中的异常点,完成原始数据清洗;其次,针对风速序列多重... 科学统计风电理论功率对评价其受阻情况至关重要,因此提出一种基于机群划分方法的风电场理论发电功率计算模型:首先,考虑到单机机头风速的测量偏差,通过多步k聚类算法剔除了风速数据中的异常点,完成原始数据清洗;其次,针对风速序列多重共线性特点易造成拟合失真的问题,利用方差膨胀系数进行共线性检验,并以此将风电场划分为线性强相关机群和线性弱相关机群;最后,分别利用风速中位数和弱相关风速序列建立了两个机群的理论功率神经网络拟合模型。实际算例表明:所提出的模型在多次随机测试后,风电场理论功率平均绝对偏差不超过一台单机的额定容量,相关系数接近0.98,电量相对偏差仅为0.47%,均优于其他常用方法。 展开更多
关键词 风电场 理论功率 机群划分 弃风电量 异常数据辨识 多重共线性
基于标签传递的异常检测算法研究 预览
9
作者 赵曼 赵耀 朱振峰 《数据采集与处理》 CSCD 北大核心 2019年第2期331-340,共10页
异常检测旨在检测出观测数据中的非正常值,被广泛应用于反信用卡欺诈、网络入侵检测、医疗分析以及气象预报等领域。在异常检测中,正常数据通常具有异常数据所不具备的某种内蕴结构。因此,如何有效地利用正常数据与异常数据在数据结构... 异常检测旨在检测出观测数据中的非正常值,被广泛应用于反信用卡欺诈、网络入侵检测、医疗分析以及气象预报等领域。在异常检测中,正常数据通常具有异常数据所不具备的某种内蕴结构。因此,如何有效地利用正常数据与异常数据在数据结构上的差异性将有助于提高异常检测性能。为此,本文提出了一种新颖的基于标签传递的异常检测算法。该算法通过图模型刻画正常数据所具有的内蕴结构,并通过多重标签传递来构建未标记正例样本与待测试样本的标签置信度的差异。最后,基于正例样本的标签置信度的统计特性分析,实现对测试样本的异常性判决。在人工合成及真实数据集上的实验验证了本文算法的有效性。 展开更多
关键词 标签传递 异常检测 图模型
在线阅读 下载PDF
基于数据挖掘技术的北方寒冷地区居民用水、用气数据处理方法探讨
10
作者 周浩 林波荣 +3 位作者 张仲宸 戚建强 郑立红 常晨晨 《暖通空调》 2019年第2期58-66,共9页
对于一个城市尺度的居民用气、用水数据系统,其数据量之大通常是人力无法或难以处理与分析的,往往需要借助于数据挖掘技术。基于天津市某城区3个小区用户2 a的用水、用气数据,采用数据标准化、基于临近性检测、箱线图等数据挖掘方法,对... 对于一个城市尺度的居民用气、用水数据系统,其数据量之大通常是人力无法或难以处理与分析的,往往需要借助于数据挖掘技术。基于天津市某城区3个小区用户2 a的用水、用气数据,采用数据标准化、基于临近性检测、箱线图等数据挖掘方法,对用户数据进行了用能异常、邻月用能数据变化异常等检测,并横向比较了3个小区的总体用能水平。结合问卷调研数据,提出了通过信息增益理论及C4.5决策树等数据挖掘算法建立用户用能水平与用户特征及用户行为间的关联关系的方法。本文的研究工作展示了从建筑用能数据中提取有效信息的过程,可为建筑能耗数据管理平台构建和应用提供新思路。 展开更多
关键词 数据挖掘 异常点检测 箱线图 信息增益率 C4.5决策树
基于维度熵的离群点检测算法 预览
11
作者 廖列法 罗斌 《计算机工程与设计》 北大核心 2019年第4期983-988,共6页
孤立森林离群点检测算法具有较大的随机性,且对噪声维度鲁棒性不够强。鉴于这些问题,提出一种基于维度熵的改进算法E-iForest。通过引入维度熵反馈样本分布,使用3个隔离策略作为选择隔离属性和隔离点的依据,调整路径长度的计算公式进行... 孤立森林离群点检测算法具有较大的随机性,且对噪声维度鲁棒性不够强。鉴于这些问题,提出一种基于维度熵的改进算法E-iForest。通过引入维度熵反馈样本分布,使用3个隔离策略作为选择隔离属性和隔离点的依据,调整路径长度的计算公式进行离群点检测。实验结果表明,该算法具有较好的检测效果和运行速度,与孤立森林相比检测结果更加稳定,对于噪声维度鲁棒性更强。 展开更多
关键词 离群点检测 孤立森林 维度熵 隔离策略 鲁棒性
在线阅读 下载PDF
基于双向LSTM的Seq2Seq模型在加油站时序数据异常检测中的应用 预览
12
作者 陶涛 周喜 +1 位作者 马博 赵凡 《计算机应用》 CSCD 北大核心 2019年第3期924-929,共6页
加油时序数据包含加油行为的多维信息,但是指定加油站点数据较为稀疏,现有成熟的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷,并不适用于挖掘加油站时序数据。提出一种基于深度学习的异常检测方法识别加油异... 加油时序数据包含加油行为的多维信息,但是指定加油站点数据较为稀疏,现有成熟的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷,并不适用于挖掘加油站时序数据。提出一种基于深度学习的异常检测方法识别加油异常车辆,首先通过自动编码器对加油站点采集到的相关数据进行特征提取,然后采用嵌入双向长短期记忆(Bi-LSTM)的Seq2Seq模型对加油行为进行预测,最后通过比较预测值和原始值来定义异常点的阈值。通过在加油数据集以及信用卡欺诈数据集上的实验验证了该方法的有效性,并且相对于现有方法在加油数据集上均方根误差(RMSE)降低了21.1%,在信用卡欺诈数据集上检测异常的准确率提高了1.4%。因此,提出的模型可以有效应用于加油行为异常的车辆检测,从而提高加油站的管理和运营效率。 展开更多
关键词 加油站时序数据 深度学习 Seq2Seq 双向长短期记忆 异常检测
在线阅读 下载PDF
基于Hadoop的局部异常检测算法 预览
13
作者 李永政 郝新兵 《信息技术与网络安全》 2019年第6期52-56,60共6页
为了提高局部异常检测算法的检测效率以及检测的准确度,提出基于Hadoop的分布式局部异常检测算法MR-DINFLO。该算法在INFLuencedOutlierness(INFLO)算法的基础上,引入了MapReduce计算框架,将数据点的k近邻、k距离、反向k近邻、局部离群... 为了提高局部异常检测算法的检测效率以及检测的准确度,提出基于Hadoop的分布式局部异常检测算法MR-DINFLO。该算法在INFLuencedOutlierness(INFLO)算法的基础上,引入了MapReduce计算框架,将数据点的k近邻、k距离、反向k近邻、局部离群因子的计算并行化处理,从而提高了检测效率。算法在计算各个数据对象之间的距离时采用加权距离,通过引入信息熵来判断离群属性,给离群属性以较大的权重,从而提高了异常检测的准确度。实验在3节点Hadoop集群上进行,输入数据为KDD-CUP99。当输入数据集大小为500万条时,所提出的MR-DINFLO算法检测准确度为0.94,检测时间为2589s。实验结果表明该算法具有高效可行性。 展开更多
关键词 异常检测 INFLuenced Outlierness HADOOP MAP REDUCE 并行化 信息熵
在线阅读 下载PDF
基于改进的OPTICS聚类和LOPW的离群数据检测算法 预览
14
作者 肖雪 薛善良 《计算机工程与科学》 CSCD 北大核心 2019年第5期885-892,共8页
针对现有的离群数据检测算法时间复杂度过高,且检测质量不佳的不足,提出一种新的基于改进的OPTICS聚类和LOPW的离群数据检测算法。首先,使用改进的OPTICS聚类算法对原始数据集进行预处理,筛选由聚类形成的可达图得到初步离群数据集;然后... 针对现有的离群数据检测算法时间复杂度过高,且检测质量不佳的不足,提出一种新的基于改进的OPTICS聚类和LOPW的离群数据检测算法。首先,使用改进的OPTICS聚类算法对原始数据集进行预处理,筛选由聚类形成的可达图得到初步离群数据集;然后,利用新定义的基于P权值的局部离群因子LOPW计算初步离群数据集中对象的离群程度,计算距离时引入去一划分信息熵增量确定属性的权重,提高离群检测准确性。实验结果表明,改进后的算法不仅提高了运算效率,而且提高了对离群数据检测的精确度。 展开更多
关键词 LOF算法 离群数据检测 OPTICS聚类 信息熵 加权距离
在线阅读 下载PDF
基于邻域粗糙隶属函数的离群点检测 预览
15
作者 杨晓玲 张贤勇 《计算机工程与设计》 北大核心 2019年第2期533-539,共7页
针对传统粗糙集的离群点检测方法难以处理数值型属性数据的问题,提出基于邻域粗糙隶属函数的离群点检测方法,其适用于数据包括数值型、符号型与混合型。基于混合型距离与自适应半径,定义邻域粗糙隶属函数刻画对象离群程度,构建邻域粗糙... 针对传统粗糙集的离群点检测方法难以处理数值型属性数据的问题,提出基于邻域粗糙隶属函数的离群点检测方法,其适用于数据包括数值型、符号型与混合型。基于混合型距离与自适应半径,定义邻域粗糙隶属函数刻画对象离群程度,构建邻域粗糙离群因子实施离群点检测,设计相应的离群点检测算法NRMFOD。UCI数据对比实验结果表明,NRMFOD算法具有有效性,优于3种常用检测算法(RMF、RBD、DIS算法)。 展开更多
关键词 离群点检测 邻域粗糙集 粗糙隶属函数 混合型属性数据 数据挖掘
在线阅读 下载PDF
基于改进距离和的异常点检测算法研究 预览
16
作者 李春生 于澍 刘小刚 《计算机技术与发展》 2019年第3期97-100,共4页
为了降低原始数据中的勘误影响,提高数据质量,深入分析了常用的基于距离的异常点检测算法,提出了一种新的基于改进距离的异常点检测算法,舍去了传统算法中对DB(d,p)参数的设置。首先,为了解决终端的不确定性选择属性困难的问题,引入了... 为了降低原始数据中的勘误影响,提高数据质量,深入分析了常用的基于距离的异常点检测算法,提出了一种新的基于改进距离的异常点检测算法,舍去了传统算法中对DB(d,p)参数的设置。首先,为了解决终端的不确定性选择属性困难的问题,引入了“属性隶属度”的概念,简化了检测属性的选择方式;其次,为了解决由于数据分布不均匀而导致的检测准确率较低的问题,改进了常用的距离度量,并采用改进的加权距离进行计算,得到距离矩阵,通过分析计算距离的总值,给出了一种异常评价方法用来判断异常点的异常程度;最后,以股票交易数据进行实验,与传统基于距离和的检测算法进行比较,结果表明该改进算法在异常点检测的准确度方面具有明显的改善。 展开更多
关键词 数据挖掘 改进距离 异常数据检测 距离和
在线阅读 下载PDF
基于最小超球面密度的孤立点检测算法 预览
17
作者 冯宇 苑易伟 《计算机技术与发展》 2019年第6期32-36,共5页
定义了最小超球面密度的概念,提出了一种基于最小超球面密度的孤立点检测算法(minimum hyper sphere density,MHSD)。该算法根据数据的 k 近邻和反 k 近邻获得数据的有效近邻,并使用最小超球面密度和有效近邻计算每个数据的密度背离程度... 定义了最小超球面密度的概念,提出了一种基于最小超球面密度的孤立点检测算法(minimum hyper sphere density,MHSD)。该算法根据数据的 k 近邻和反 k 近邻获得数据的有效近邻,并使用最小超球面密度和有效近邻计算每个数据的密度背离程度,进而计算每个数据的孤立程度,将孤立程度超过规定阈值的数据视为孤立点。实验数据为一个二维人工数据集和两个高维实际数据集,检测三个数据集的孤立点,对算法性能进行评估,并与经典的局部离群因子算法(local outlier factor,LOF)、离群影响因子算法(influenced outlierness,INFLO)和密度相似邻域离群因子算法(density similarity neighbor based outlier factor,DSNOF)进行比较。实验结果表明,基于最小超球面密度的孤立点检测算法可以准确检测出数据中的孤立点,且性能优于三种经典算法。 展开更多
关键词 立点检测 最小超球面 有效近邻 局部密度差 密度背离程度
在线阅读 下载PDF
利用聚类分析和离群点检测的数据填补方法 预览
18
作者 马永军 汪睿 +1 位作者 李亚军 陈海山 《计算机工程与设计》 北大核心 2019年第3期744-747,761共5页
为提高数据填补方法的正确率,提出利用核K-Means聚类和离群点检测来填补缺失数据的算法(KKMOD)。用核方法将数据集映射到高维空间,聚类后形成不同簇,在同簇内选择与缺失数据最相似的数据进行填补,使用核K-Means进行离群点检测,将检测到... 为提高数据填补方法的正确率,提出利用核K-Means聚类和离群点检测来填补缺失数据的算法(KKMOD)。用核方法将数据集映射到高维空间,聚类后形成不同簇,在同簇内选择与缺失数据最相似的数据进行填补,使用核K-Means进行离群点检测,将检测到的离群点去除填补值,重新放入数据集填补,算法不断迭代,直到填补的数据不再检测出离群点。实验结果表明,KKMOD方法能够充分考虑簇内关系,避免不同簇相互干扰,提高数据填补算法的正确率。 展开更多
关键词 核方法 聚类分析 缺失数据 数据填补 离群点检测
在线阅读 下载PDF
基于Bi-LSTM模型的轨迹异常点检测算法 预览
19
作者 韩昭蓉 黄廷磊 +1 位作者 任文娟 许光銮 《雷达学报》 CSCD 北大核心 2019年第1期36-43,共8页
定位技术的飞速发展催生了时空轨迹大数据,轨迹数据中往往存在着明显偏离轨迹的异常点。检测出轨迹中的异常点对提高数据质量和后续轨迹数据挖掘精度至关重要。该文提出了一种基于双向长短时记忆网络(Bidirectional Long Short-Term Mem... 定位技术的飞速发展催生了时空轨迹大数据,轨迹数据中往往存在着明显偏离轨迹的异常点。检测出轨迹中的异常点对提高数据质量和后续轨迹数据挖掘精度至关重要。该文提出了一种基于双向长短时记忆网络(Bidirectional Long Short-Term Memory, Bi-LSTM)模型的轨迹异常点检测算法。首先对每个轨迹点提取一个6维的运动特征向量,然后构建了一个Bi-LSTM模型,模型输入为一定序列长度的轨迹数据特征向量,输出为轨迹点的类型结果。同时,算法采用了欠采样和过采样的组合方法缓解类别不平衡对检测性能的影响。融合了长短时记忆网络单元和双向网络,Bi-LSTM模型能够自动学习正常点和邻近异常点在运动特征上的差异。基于真实船舶轨迹标注数据的实验结果表明,该文算法的检测性能显著优于恒定速度阈值法、不考虑数据时序性的经典机器学习分类算法和卷积神经网络模型,尤其是召回率达到了0.902,验证了该文算法的有效性。 展开更多
关键词 轨迹数据 异常检测 特征提取 双向长短时记忆网络
在线阅读 免费下载
基于中文极端积极评论的虚假评论检测方法 预览
20
作者 佘玉萍 《莆田学院学报》 2019年第2期33-37,93共6页
以检测电子商务中用户评论的虚假评论为目标,主要面向用户极端积极评论,从中文极端积极评论的筛选、中文评论文本情感量化、综合多种特征修正得分后的离群值分析等方面来探讨虚假评论的检测,设计可行的面向中文极端积极评论的虚假评论模... 以检测电子商务中用户评论的虚假评论为目标,主要面向用户极端积极评论,从中文极端积极评论的筛选、中文评论文本情感量化、综合多种特征修正得分后的离群值分析等方面来探讨虚假评论的检测,设计可行的面向中文极端积极评论的虚假评论模型(EPFRD)。实验表明,基于EPFRD模型可对中文虚假评论进行有效检测,从而对用户评论的真实性给出较可观的评价。 展开更多
关键词 中文极端积极评论 情感量化 离群值检测 虚假评论
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部 意见反馈