期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
Windows下SpamAssassin对中文垃圾邮件的过滤研究
1
作者 李玉峰 米晓琴 杨婷 《内蒙古农业大学学报:自然科学版》 CAS 北大核心 2019年第1期79-82,共4页
英文垃圾邮件过滤效果良好的开源软件Spam Assassin,在Windows下的应用研究较少。在Windows下安装配置Spa-m Assassin,针对中文邮件添加规则与学习贝叶斯库,基于真实邮件测试,取得了良好过滤效果。
关键词 WINDOWS SpamAssassin 中文垃圾邮件
基于变异特征检测的中文垃圾邮件过滤研究 预览
2
作者 李明轩 吴秀梅 王旭 《新疆电力技术》 2015年第1期61-64,共4页
当前,垃圾邮件日益成为信息时代人们的一个心病,它具有反复性、强制性、欺骗性和不健康性等特点,严重影响着人们正常的生活。本文通过对比垃圾邮件的变化,以及对垃圾邮件制造者目的的分析,针对中文垃圾邮件变异的几个重要特性,提出一个... 当前,垃圾邮件日益成为信息时代人们的一个心病,它具有反复性、强制性、欺骗性和不健康性等特点,严重影响着人们正常的生活。本文通过对比垃圾邮件的变化,以及对垃圾邮件制造者目的的分析,针对中文垃圾邮件变异的几个重要特性,提出一个提高垃圾邮件变异特征识别率的构想,对反垃圾邮件技术的研究有着一定的意义。 展开更多
关键词 中文垃圾邮件 变异特征 特征提取
在线阅读 下载PDF
中文垃圾邮件变异特征检测研究 预览
3
作者 冯劲 张宇清 +2 位作者 刘华浩 梁祥超 蔡凯新 《现代计算机:中旬刊》 2014年第3期10-14,共5页
通过对比垃圾邮件的变化,以及对垃圾邮件制造者目的的分析,总结出中文垃圾邮件特性变异的趋势。针对中文垃圾邮件变异的几个重要特性,以及中文的语言特点,在反垃圾邮件系统中加入拼音转换模块、繁简体转换模块和正则表达式匹配模块... 通过对比垃圾邮件的变化,以及对垃圾邮件制造者目的的分析,总结出中文垃圾邮件特性变异的趋势。针对中文垃圾邮件变异的几个重要特性,以及中文的语言特点,在反垃圾邮件系统中加入拼音转换模块、繁简体转换模块和正则表达式匹配模块。实验结果表明,该方法能够取得较高的垃圾邮件变异特征识别率。 展开更多
关键词 中文垃圾邮件 变异特征 特征提取
在线阅读 免费下载
基于文本分类的中文垃圾邮件过滤技术研究 预览
4
作者 朱军 饶元 +2 位作者 傅雷扬 张宁 刘锴 《长江大学学报自然科学版:理工(上旬)》 2012年第1X期102-105,共4页
由于语言上的差异,中文垃圾邮件过滤与英文邮件在信息处理技术上差别较大.针对中文垃圾邮件过滤的邮件训练集、过滤规则和分类器特征库更新不及时,经常出现误判和漏判等问题,以文本分类技术为基础,将基于规则方法和Bayes分类方法相结合... 由于语言上的差异,中文垃圾邮件过滤与英文邮件在信息处理技术上差别较大.针对中文垃圾邮件过滤的邮件训练集、过滤规则和分类器特征库更新不及时,经常出现误判和漏判等问题,以文本分类技术为基础,将基于规则方法和Bayes分类方法相结合,设计了一种中文垃圾邮件过滤方法,详细阐述了中文邮件过滤的邮件预处理、中文分词、特征选取等技术.试验结果表明,该方法可以明显改善中文垃圾邮件过滤效果. 展开更多
关键词 中文垃圾邮件 过滤 文本分类 BAYES分类 特征选取
在线阅读 免费下载
博弈论在邮件特征选择中的应用 预览 被引量:1
5
作者 孙晶涛 张秋余 +1 位作者 袁占亭 董建设 《电子科技大学学报》 EI CAS CSCD 北大核心 2011年第1期 95-99,共5页
特征选择在垃圾邮件过滤中起着十分重要的作用,本文分析讨论了现有邮件特征选择方法所存在的不足,并在此基础上,提出一种基于博弈论的邮件特征选择模型。该模型将博弈论应用于邮件特征选择中,以达到约减信息规模,提高垃圾邮件过滤效率... 特征选择在垃圾邮件过滤中起着十分重要的作用,本文分析讨论了现有邮件特征选择方法所存在的不足,并在此基础上,提出一种基于博弈论的邮件特征选择模型。该模型将博弈论应用于邮件特征选择中,以达到约减信息规模,提高垃圾邮件过滤效率的目的。在设计特征选择模型时,考虑到邮件样本自身的模糊隶属性对特征选择所产生的影响,在特征点对邮件类别的区分度定义中,通过引入由相融性度量定义的样本模糊隶属度函数,提高博弈邮件特征选择模型对实际问题的处理能力。在CDSCE语料库上的实验表明,该邮件特征选择模型的性能优于同类其他特征选择方法,验证了该邮件特征选择模型的有效性。 展开更多
关键词 中文垃圾邮件 特征选择 模糊聚类分析 博弈论 隶属度函数
在线阅读 免费下载
中文垃圾邮件多层次过滤技术的应用研究 预览 被引量:1
6
作者 刘延华 陈国龙 《计算机工程与应用》 CSCD 北大核心 2009年第34期 94-97,129,共5页
针对当前中文垃圾邮件过滤中存在的问题,提出了一种基于改进最小风险贝叶斯算法的多层次垃圾邮件过滤方法,并研究了其中关键应用技术。实验结果表明,所设计的多层次过滤算法不但在召回率和准确率上具有一定优势,还具有较高的过滤速... 针对当前中文垃圾邮件过滤中存在的问题,提出了一种基于改进最小风险贝叶斯算法的多层次垃圾邮件过滤方法,并研究了其中关键应用技术。实验结果表明,所设计的多层次过滤算法不但在召回率和准确率上具有一定优势,还具有较高的过滤速率,实际应用性较强。 展开更多
关键词 中文垃圾邮件 多层次过滤 最小风险贝叶斯 特征选择
在线阅读 下载PDF
基于贝叶斯算法的中文邮件过滤系统设计 预览
7
作者 刘延华 林嘉雯 《福建电脑》 2009年第11期 7-8,共2页
本文针对当前中文垃圾邮件过滤中存在的问题,提出了一种基于贝叶斯算法的中文垃圾邮件过滤模型。实验结果表明。所设计的邮件过滤算法在召回率和准确率上具有良好的应用效果。
关键词 中文垃圾邮件 贝叶斯 特征选择
在线阅读 下载PDF
基于贝叶斯算法的中文垃圾邮件过滤系统研究 预览
8
作者 刘浩然 丁攀 +2 位作者 郭长江 常金凤 崔静闯 《通信学报》 CSCD 北大核心 2018年第12期151-159,共9页
目前大部分中文垃圾邮件过滤系统受文本稀疏及模型特征局限的影响较大,其特征高维和特征局限的缺陷成为制约过滤效果的重要因素。针对特征高维问题,提出一种基于中心词扩展的TF-IDF(term frequency-inverse document frequency)特征提... 目前大部分中文垃圾邮件过滤系统受文本稀疏及模型特征局限的影响较大,其特征高维和特征局限的缺陷成为制约过滤效果的重要因素。针对特征高维问题,提出一种基于中心词扩展的TF-IDF(term frequency-inverse document frequency)特征提取算法,增加了特征节点的表达能力,实现了特征降维。针对分类模型特征局限和属性间条件独立性假设不成立问题,提出一种基于GWO_GA(grey wolf optimizer-genetic algorithm)结构学习算法的3层贝叶斯网络模型,放松了条件独立性假设,增加了特征多样性,最终形成基于中心词扩展的TF-IDF特征提取及GWO_GA结构学习的3层贝叶斯算法。通过大量中文邮件数据验证,算法可明显提高中文垃圾邮件过滤效果。 展开更多
关键词 贝叶斯网络 TF-IDF 遗传算法 短文本分类 中文垃圾邮件过滤
在线阅读 下载PDF
基于图正则化MNMF的中文垃圾邮件过滤 预览
9
作者 刘遵雄 黄志强 +1 位作者 郑淑娟 石菲 《计算机应用研究》 CSCD 北大核心 2013年第9期2672-2676,共5页
利用向量空间模型表示的文本邮件数据具有高维性,不利于邮件过滤模型的建立,需要对数据进行降维处理。最大间隔Semi-NMF(max—marginsemi—nonnegativemarxfactorization,MNMF)能够同时实现维数约减和邮件分类,而图正则化NMF能保... 利用向量空间模型表示的文本邮件数据具有高维性,不利于邮件过滤模型的建立,需要对数据进行降维处理。最大间隔Semi-NMF(max—marginsemi—nonnegativemarxfactorization,MNMF)能够同时实现维数约减和邮件分类,而图正则化NMF能保持数据空间的几何结构。基于以上两种NMF改进模型,提出了图正则化MNMF(graphregularizedMNMF,GMNMF)算法,并设计了一个迭代的求解算法。将GMNMF算法及其他相关算法用于中文垃圾邮件过滤实验,结果表明GMNMF算法构建的过滤模型要优于其他较好的算法构建的过滤模型。 展开更多
关键词 向量空间模型 维数约减 最大间隔Semi—NMF 图正则化MNMF 中文垃圾邮件过滤
在线阅读 下载PDF
面向垃圾邮件过滤的典型机器学习算法比较研究 预览
10
作者 丁华福 王莹莹 +2 位作者 韩咏 闵莉 邹钰 《黑龙江工程学院学报》 CAS 2012年第2期65-69,共5页
基于机器学习的垃圾邮件过滤技术是当前垃圾邮件过滤的主流方法。机器学习模型主要分为两类:以朴素贝叶斯(NB)为代表的生成模型和以逻辑回归模型(LR)、支持向量机模型(SVM)为代表的判别学习模型。以往对两种模型的研究都是针对... 基于机器学习的垃圾邮件过滤技术是当前垃圾邮件过滤的主流方法。机器学习模型主要分为两类:以朴素贝叶斯(NB)为代表的生成模型和以逻辑回归模型(LR)、支持向量机模型(SVM)为代表的判别学习模型。以往对两种模型的研究都是针对某一种语言进行,对于模型的语言独立性与相关性研究较少。因此,在中文数据集和英文数据集上比较典型的生产模型和判别学习模型的过滤性能。比较Bogo(Bogo系统是基于贝叶斯算法的,它是典型的生成模型)、逻辑回归模型和松弛在线支持向量机(两种典型的判别学习模型)在中英文数据集上的过滤性能。其中:实验是在公开英文数据集TREC05p-1、TREC06p和公开中文数据集TREC06c、SEWM2011上进行。实验结果显示基于判别模型垃圾邮件过滤器性能明显优于基于生成模型,并且相同的模型在中文数据集上显示了较好的效果。 展开更多
关键词 生成模型 判别模型 中文垃圾邮件过滤
在线阅读 下载PDF
高性能中文垃圾邮件过滤器 预览 被引量:6
11
作者 齐浩亮 程晓龙 +3 位作者 杨沐昀 何晓宁 李生 雷国华 《中文信息学报》 CSCD 北大核心 2010年第2期 76-83,共8页
设计并实现了基于在线过滤模式高性能中文垃圾邮件过滤器,能够较好地识别不断变化的垃圾邮件。以逻辑回归模型为基础,该文提出了字节级n元文法提取邮件特征,并采用TONE(Train Onor NearError)方法训练过滤器。在多个大规模中文垃... 设计并实现了基于在线过滤模式高性能中文垃圾邮件过滤器,能够较好地识别不断变化的垃圾邮件。以逻辑回归模型为基础,该文提出了字节级n元文法提取邮件特征,并采用TONE(Train Onor NearError)方法训练过滤器。在多个大规模中文垃圾邮件过滤公开评测数据上的实验结果表明,该文过滤器的性能在TREC06C数据上优于当年评测的最好成绩,在SEWM07立即反馈上1—ROCA值达到了0.0000%,并明显优于SEWM08评测在线过滤任务中的所有其他方法。 展开更多
关键词 计算机应用 中文信息处理 中文垃圾邮件过滤 在线学习 逻辑回归模型 字节级n元文法 TONE
在线阅读 下载PDF
抗好词攻击的中文垃圾邮件过滤模型 预览 被引量:5
12
作者 邓蔚 秦志光 +1 位作者 刘峤 程红蓉 《电子测量与仪器学报》 CSCD 2010年第12期 1146-1152,共7页
针对当前中文垃圾邮件过滤领域面临的好词攻击威胁,提出了一种鲁棒的中文垃圾邮件过滤模型。该模型基于多示例学习机制,并结合中文分词和特征选择方法,将一封邮件转化为若干示例的组合,然后应用多示例逻辑回归模型进行学习和分类。对多... 针对当前中文垃圾邮件过滤领域面临的好词攻击威胁,提出了一种鲁棒的中文垃圾邮件过滤模型。该模型基于多示例学习机制,并结合中文分词和特征选择方法,将一封邮件转化为若干示例的组合,然后应用多示例逻辑回归模型进行学习和分类。对多示例学习而言,当一封邮件中至少有一个示例为垃圾信息时,该邮件为垃圾邮件,否则为正常邮件。分别对训练数据集和测试数据集进行好词攻击,在多个大规模中文垃圾邮件过滤公开数据库上进行了测试。实验结果表明,在中文邮件过滤领域对抗好词攻击,分类器使用多示例反击策略较之于单示例反击策略有更强的鲁棒性。 展开更多
关键词 中文垃圾邮件过滤 敌手学习 多示例学习 逻辑回归 好词攻击 鲁棒性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈