期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
固定效应部分线性变系数面板模型的快速有效估计 预览
1
作者 丁飞鹏 陈建宝 《统计研究》 CSSCI 北大核心 2019年第3期113-123,共11页
本文将最小二乘支持向量机(LSSVM)和二次推断函数法(QIF)相结合,为个体内具有相关结构的固定效应部分线性变系数面板模型提供了一种新的快速估计方法;在一定的正则条件下,论证了参数估计量的渐近正态性和非参数估计量的收敛速度;采用Mon... 本文将最小二乘支持向量机(LSSVM)和二次推断函数法(QIF)相结合,为个体内具有相关结构的固定效应部分线性变系数面板模型提供了一种新的快速估计方法;在一定的正则条件下,论证了参数估计量的渐近正态性和非参数估计量的收敛速度;采用Monte Carlo模拟考察了估计方法在有限样本下的表现并将估计技术应用于现实数据分析。该方法不仅保证了估计的有效性和统计推断力,而且程序运行速度得到较大幅度提升。 展开更多
关键词 部分线性变系数面板模型 固定效应 最小二乘支持向量机 二次推断函数法
在线阅读 下载PDF
网络搜索数据和GWO-SVR模型的旅游短期客流量预测 预览
2
作者 王兰梅 陈崇成 +1 位作者 叶晓燕 潘淼鑫 《福州大学学报:自然科学版》 北大核心 2019年第5期598-603,共6页
利用皮尔森相关系数法处理网络搜索数据,用灰狼算法(grey wolf optimizer,GWO)优化支持向量回归(support vector regression,SVR)中的参数,提出并实现一种基于网络搜索数据和GWO-SVR模型的旅游短期客流量预测模型,并用参数优化后的SVR... 利用皮尔森相关系数法处理网络搜索数据,用灰狼算法(grey wolf optimizer,GWO)优化支持向量回归(support vector regression,SVR)中的参数,提出并实现一种基于网络搜索数据和GWO-SVR模型的旅游短期客流量预测模型,并用参数优化后的SVR对客流量进行建模预测.以四川省九寨沟和四姑娘山两个景区为例,构建GWO-SVR、ARIMA、BPNN、SVR、CS-SVR、PSO-SVR和无网络搜索数据等客流量预测模型进行实证分析.结果表明,GWO-SVR模型均优于其他模型,具有更高的预测精度. 展开更多
关键词 旅游客流量预测 网络搜索数据 支持向量回归 灰狼优化算法
在线阅读 免费下载
基于弹幕分析的在线直播平台用户理解 预览
3
作者 黄发良 谢国庆 陈子炜 《计算机系统应用》 2020年第2期250-256,共7页
弹幕评论是网络直播平台与用户交互的主要方式之一,借助弹幕行为的分析可以更有效地实现对网络直播平台的用户理解.通过采集和利用3大热门直播平台(斗鱼、熊猫与战旗)的弹幕相关数据,本文以假设验证的方式从用户属性与用户行为两个角度... 弹幕评论是网络直播平台与用户交互的主要方式之一,借助弹幕行为的分析可以更有效地实现对网络直播平台的用户理解.通过采集和利用3大热门直播平台(斗鱼、熊猫与战旗)的弹幕相关数据,本文以假设验证的方式从用户属性与用户行为两个角度对在线直播平台用户进行分析与理解,并建立基于用户行为特征时间序列的用户活跃模型对用户互动活跃度进行量化评估.研究表明,平台在线人数具有周期性变化的时间规律,观众地域具有沿海发达城市集中分布的空间取向,所提出的用户活跃模型能够对网络直播平台用户的行为活跃趋势做出合理的预测分析. 展开更多
关键词 用户理解 弹幕分析 在线直播 社会媒体
在线阅读 下载PDF
基于C-SOM和Spark的并行空间离群挖掘方法及应用
4
作者 潘淼鑫 林甲祥 +1 位作者 陈崇成 叶晓燕 《地球信息科学学报》 CSCD 北大核心 2019年第1期128-136,共9页
空间离群挖掘可以发现空间数据集中非空间属性值与邻域中其他空间对象明显不同的空间对象。随着空间数据量的快速增加,传统集中式处理模式面临单机性能瓶颈、难以扩展等问题,已逐渐不能满足应用需要。因此,本文根据Spark并行计算框架,... 空间离群挖掘可以发现空间数据集中非空间属性值与邻域中其他空间对象明显不同的空间对象。随着空间数据量的快速增加,传统集中式处理模式面临单机性能瓶颈、难以扩展等问题,已逐渐不能满足应用需要。因此,本文根据Spark并行计算框架,充分利用Spark快速内存计算和扩展性的优势,提出了一种基于考虑约束条件的空间离群挖掘算法(C-SOM)和Spark的并行空间离群挖掘算法和原型系统。该并行算法以C-SOM为核心,并行地在多个计算节点对全局数据集和各局部数据集执行C-SOM算法,得到全局离群和局部离群。轻量级的原型系统基于Spark实现了该并行算法,采用Browser/Server架构,提供给用户可视化的操作界面,简洁实用。最后,通过福建省东南沿海土壤化学元素调查数据和人工合成数据的离群分析,验证了该并行算法和原型系统的合理性、有效性和高效性。 展开更多
关键词 C-SOM SPARK 并行计算 空间离群 数据挖掘
固定效应部分线性单指数面板模型的快速有效估计及应用 预览
5
作者 丁飞鹏 陈建宝 《高校应用数学学报:A辑》 北大核心 2019年第2期127-141,共15页
将最小二乘支持向量机(LSSVM)和二次推断函数法(QIF)相结合,构造了个体内具有相关结构的固定效应部分线性单指数面板模型的新估计方法;在一定的正则条件下,证明了参数估计量的渐近正态性,导出了非参数估计量的收敛速度;Monte Carlo模拟... 将最小二乘支持向量机(LSSVM)和二次推断函数法(QIF)相结合,构造了个体内具有相关结构的固定效应部分线性单指数面板模型的新估计方法;在一定的正则条件下,证明了参数估计量的渐近正态性,导出了非参数估计量的收敛速度;Monte Carlo模拟了所述方法在各种相关结构下的有限样本表现,并与惩罚二次推断函数(PQIF)法进行了比较;将估计技术应用于分析我国人口结构与居民消费率的关系.研究发现,该方法改善了估计量的有效性,应用效果良好,程序运行速度快,适合经济变量间的线性和非线性关系研究以及大数据分析. 展开更多
关键词 固定效应部分线性单指数面板模型 最小二乘支持向量机 二次推导函数法 渐近性 MONTE CARLO模拟
在线阅读 下载PDF
基于隐私度和稳定度的D2D数据共享伙伴选择机制 预览
6
作者 黄章健 叶帼华 姚志强 《网络与信息安全学报》 2019年第6期31-41,共11页
设备到设备(D2D)数据共享已经成为一种很有前途的卸载蜂窝网络流量的解决方案,但数据共享伙伴的隐私脆弱性和服务不稳定性影响着共享服务的质量。针对这个问题,提出一种基于隐私度和稳定度的D2D数据共享伙伴选择机制(PSUS)。首先对提供... 设备到设备(D2D)数据共享已经成为一种很有前途的卸载蜂窝网络流量的解决方案,但数据共享伙伴的隐私脆弱性和服务不稳定性影响着共享服务的质量。针对这个问题,提出一种基于隐私度和稳定度的D2D数据共享伙伴选择机制(PSUS)。首先对提供者的隐私信息进行抽象和概括,根据提供者的隐私偏好和历史共享记录构建隐私度量的方法,得出提供者在不同共享服务中的隐私度;然后基于隐私度来设计数据共享过程,提供者在隐私偏好约束下缓存数据并在隐私度低的时候参与共享服务以满足提供者的隐私要求;最后在已满足隐私要求的提供者的基础上,设计一种多指标评价法来评估提供者的服务稳定性以选择稳定的共享伙伴。通过性能分析,证明所提机制的可行性。 展开更多
关键词 D2D数据共享 隐私偏好 隐私度量 多指标评价
在线阅读 免费下载
基于词向量句子相似度量的医疗科室推荐 预览 被引量:1
7
作者 宁建飞 黄发良 《福建师范大学学报:自然科学版》 CSCD 北大核心 2018年第4期10-15,共6页
针对医疗信息系统中传统科室推理方法存在的计算效率低下、推荐效果欠佳与知识库难于维护等问题,提出了基于词向量句子相似度量的医疗科室推荐方法.该方法采用深度学习工具构建医疗知识库词向量模型,以词向量代替语义词典检索或词频统... 针对医疗信息系统中传统科室推理方法存在的计算效率低下、推荐效果欠佳与知识库难于维护等问题,提出了基于词向量句子相似度量的医疗科室推荐方法.该方法采用深度学习工具构建医疗知识库词向量模型,以词向量代替语义词典检索或词频统计来实现医疗问答对的相似度量,建立基于句子相似度量的医疗科室推荐框架.通过专业医疗在线问医平台真实问答数据的实验,结果表明,与传统科室推理方法相比较,该方法具有更高的推荐准确率与工程可行性. 展开更多
关键词 词向量 句子相似度 医疗科室推荐
在线阅读 下载PDF
基于ARC的闪存数据库缓冲区算法 预览
8
作者 梁鑫 林铭炜 姚志强 《计算机系统应用》 2018年第3期156-161,共6页
闪存是一种纯电子设备,具备体积小、数据读取速度快、能耗低、抗震性强等优点,被用来部分替代机械硬盘从而提升存储系统的性能.但是,现有的缓冲区置换算法都是针对机械硬盘的物理特性进行设计和优化,因此有必要针对闪存的物理特性重新... 闪存是一种纯电子设备,具备体积小、数据读取速度快、能耗低、抗震性强等优点,被用来部分替代机械硬盘从而提升存储系统的性能.但是,现有的缓冲区置换算法都是针对机械硬盘的物理特性进行设计和优化,因此有必要针对闪存的物理特性重新设计缓冲区置换算法.提出一种新的面向闪存数据库的缓冲区替换算法CF-ARC.算法设计了一种新的页替换机制,即在替换干净页或者脏页的时候考虑其访问频度的大小,优先将访问频度少的干净页替换出缓冲区,使得热页继续留在缓冲区提高命中率,从而获得更好的性能,通过对实验结果的对比分析发现CF-ARC在多数情况下具有比其它置换算法更高的性能. 展开更多
关键词 闪存数据库 缓冲区置换算法 替换机制法 传统机械式硬盘 ARC算法
在线阅读 下载PDF
融合彩色信息与SIFT特征的帧内复制粘贴篡改检测 预览 被引量:1
9
作者 李小琛 黄添强 《计算机系统应用》 2018年第7期11-18,共8页
近年来在同源复制粘贴篡改检测中,SIFT特征得到了广泛的应用.但由于该特征在提取过程中摒弃了颜色信息,会造成一部分特征点的误匹配和漏匹配.为此,提出一种基于彩色信息与SIFT融合的CSIFT特征的检测方法,在提取特征点时加入颜色不变量信... 近年来在同源复制粘贴篡改检测中,SIFT特征得到了广泛的应用.但由于该特征在提取过程中摒弃了颜色信息,会造成一部分特征点的误匹配和漏匹配.为此,提出一种基于彩色信息与SIFT融合的CSIFT特征的检测方法,在提取特征点时加入颜色不变量信息,提高了匹配的准确性和效率.算法首先利用结构相似度将视频帧序列分段,提取每段序列的关键帧;然后提取关键帧的CSIFT特征;最终定位复制粘贴区域,并利用目标跟踪算法计算篡改区域在后续帧上的位置.通过实验验证了算法的鲁棒性,与基于SIFT等特征的算法相比,时间效率和准确性更高. 展开更多
关键词 视频篡改检测 CSIFT 颜色不变量 目标追踪 复制粘贴
在线阅读 下载PDF
基于社交关系的微博主题情感挖掘 预览 被引量:9
10
作者 黄发良 于戈 +3 位作者 张继连 李超雄 元昌安 卢景丽 《软件学报》 EI CSCD 北大核心 2017年第3期694-707,共14页
微博情感分析是社交媒体挖掘中的重要任务之一,在个性化推荐、舆情分析等方面具有重要的理论和应用价值.挖掘性能良好且可同步进行文档主题分析与情感分析的主题情感模型,近年来在以微博为代表的社交媒体情感分析中备受关注.然而,绝大... 微博情感分析是社交媒体挖掘中的重要任务之一,在个性化推荐、舆情分析等方面具有重要的理论和应用价值.挖掘性能良好且可同步进行文档主题分析与情感分析的主题情感模型,近年来在以微博为代表的社交媒体情感分析中备受关注.然而,绝大多数现有主题情感模型都只简单地假设不同微博的情感极性是互相独立的,这与微博生态的现实状况不相一致,从而导致这些模型无法对用户的真实情感进行有效建模.基于此,综合考虑了微博用户相互关联的事实,提出了基于LDA和微博用户关系的主题情感模型SRTSM(social relation topic sentiment model).该模型在LDA中加入情感层与微博用户关系参数,利用微博用户关系与微博主题学习微博的情感极性.针对新浪微博真实数据集上的大量实验结果表明:与代表性算法JST,Sentiment-LDA及DPLDA相比较,SRTSM模型能够对用户真实情感与讨论主题进行更加有效的分析建模. 展开更多
关键词 情感分析 微博情感分析 主题情感模型 社交关系 社会媒体处理
在线阅读 下载PDF
基于多特征融合的微博主题情感挖掘 预览 被引量:26
11
作者 黄发良 冯时 +1 位作者 王大玲 于戈 《计算机学报》 EI CSCD 北大核心 2017年第4期872-888,共17页
微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主... 微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主题是密切相关的.多数现有的微博情感分析方法都没有将微博主题与微博情感进行协同分析,或者在微博主题情感分析过程中没有考虑将用户关系、用户性格情绪等特征数据,从而导致微博情感分析与主题检测的效果难尽人意.为此,提出了一个基于多特征融合的微博主题情感挖掘模型TSMMF(Topic Sentiment Model based on Multi-feature Fusion),该模型将情感表情符号与微博用户性格情绪特征纳入到图模型LDA中实现微博主题与情感的同步推导.实验结果表明,与当前用于短文本情感主题挖掘的最优模型(JST,SLDA与DPLDA)相比较,TSMMF具有更优的微博主题情感检测性能. 展开更多
关键词 情感分析 主题检测 LDA 微博短文本 社会媒体处理 自然语言处理
在线阅读 下载PDF
优先关联的Web日志数据逼真生成算法 预览 被引量:2
12
作者 丘志鹏 肖如良 张锐 《计算机系统应用》 2017年第3期126-133,共8页
字段关联的构建方法是Web数据逼真生成中的困难问题.提出一种基于MIC的字段优先关联的Web数据逼真生成算法.该算法与现有的方法完全不同:首先,提取真实Web日志数据集中相应字段间的MIC系数;然后,结合字段的重尾特性,采用SE分布对字段... 字段关联的构建方法是Web数据逼真生成中的困难问题.提出一种基于MIC的字段优先关联的Web数据逼真生成算法.该算法与现有的方法完全不同:首先,提取真实Web日志数据集中相应字段间的MIC系数;然后,结合字段的重尾特性,采用SE分布对字段的重尾性进行建模;最后,建立字段关联模型,模拟出真实数据集中的字段间依赖性,从而逼真生成目标数据集.实验表明,生成的数据集能够保持合理的字段间的均衡性以及节点间的相似性. 展开更多
关键词 字段关联 数据生成 MIC系数 重尾
在线阅读 下载PDF
基于相邻请求的动态时间阈值会话识别算法 预览
13
作者 曾令 肖如良 《计算机应用》 CSCD 北大核心 2017年第11期3335-3338,共4页
在大数据平台的异常检测分析中,为提高会话序列建模的效率,提出一种基于相邻请求的动态调整时间间隔阈值的会话识别算法-DAITS算法。首先同时结合站点页面因子和用户访问页面时间的平均因子;然后在两者间加入合适的权重因子对时间阈... 在大数据平台的异常检测分析中,为提高会话序列建模的效率,提出一种基于相邻请求的动态调整时间间隔阈值的会话识别算法-DAITS算法。首先同时结合站点页面因子和用户访问页面时间的平均因子;然后在两者间加入合适的权重因子对时间阈值进行动态调整;最后根据判断是否超过该时间阈值来划分会话。实验结果表明,DAITS算法比传统使用固定阈值的方法在会话识别的精确率和查全率上提高了14.8%和13.2%,比动态调整阈值的方法在精确率和查全率上提高了6.2%和3.2%。 展开更多
关键词 异常检测 会话识别 会话序列 相邻请求 动态时间阈值
在线阅读 下载PDF
逼真生成表格式数据的非时间属性关联模型 预览
14
作者 张锐 肖如良 +1 位作者 倪友聪 杜欣 《计算机应用》 CSCD 北大核心 2017年第9期2684-2688,共5页
针对数据仿真过程中表格数据属性间关联难的问题,提出一种刻画表格数据中非时间属性间关联特征的H模型。首先,从数据集中提取评价主体和被评价主体关键属性,进行两重频数统计,得到关于关键属性的4个关系对;然后,计算各关系对的最... 针对数据仿真过程中表格数据属性间关联难的问题,提出一种刻画表格数据中非时间属性间关联特征的H模型。首先,从数据集中提取评价主体和被评价主体关键属性,进行两重频数统计,得到关于关键属性的4个关系对;然后,计算各关系对的最大信息系数(MIC)来评估各关系对的相关性,并采用拉伸指数分布(SE)对各关系对进行关系拟合;最后,设置评价主体和被评价主体的数据规模,根据拟合出的关系计算出评价主体的活跃度和被评价主体的流行度,通过活跃度总和等于流行度总和建立关联,得到非时间属性关联的H模型。实验结果表明,利用H模型能有效地刻画真实数据集中非时间属性间的关联特征。 展开更多
关键词 数据仿真 关联 最大信息系数 拉伸指数分布 属性关联
在线阅读 下载PDF
共享所有权证明:协作云数据安全去重新方法 预览 被引量:3
15
作者 熊金波 李素萍 +3 位作者 张媛媛 李璇 叶阿勇 姚志强 《通信学报》 CSCD 北大核心 2017年第7期18-27,共10页
针对共享文件的安全访问与去重问题,提出共享所有权证明(PoSW)的新概念,对其进行形式化定义,构造PoSW方案并对其进行扩展。在PoSW方案中,充分利用共享文件散布、收敛加密、秘密共享等技术对共享文件进行变换处理,实现对共享文件... 针对共享文件的安全访问与去重问题,提出共享所有权证明(PoSW)的新概念,对其进行形式化定义,构造PoSW方案并对其进行扩展。在PoSW方案中,充分利用共享文件散布、收敛加密、秘密共享等技术对共享文件进行变换处理,实现对共享文件的分享授权;提出一种新的挑战—响应协议,实现共享所有权证明,为共享文件的安全去重提供基础;引入多云服务提供商对PoSW进行扩展,通过复制策略和安全文件散布策略提高不同类型共享文件的可用性和可靠性。安全性分析和性能分析表明所提PoSW方案是安全和高效的。 展开更多
关键词 共享所有权证明 安全去重 收敛加密 安全文件散布 云存储
在线阅读 下载PDF
基于光流周期特性的视频帧率上转篡改检测 预览 被引量:1
16
作者 林晶 黄添强 +1 位作者 李小琛 林玲鹏 《计算机系统应用》 2017年第6期131-136,共6页
视频帧率上转是视频时域篡改的一种常见篡改手段,它通过周期性地在两个视频帧中间插入中间帧的方式,实现将视频由低帧率转换到高帧率的目标.本文提出了一种基于光流周期特性的视频帧率上转篡改检测算法,首先将视频转为帧图像序列,然后采... 视频帧率上转是视频时域篡改的一种常见篡改手段,它通过周期性地在两个视频帧中间插入中间帧的方式,实现将视频由低帧率转换到高帧率的目标.本文提出了一种基于光流周期特性的视频帧率上转篡改检测算法,首先将视频转为帧图像序列,然后采用Horn-Schunck光流法计算每帧图像每个像素点的光流矢量,并计算相邻帧图像光流的变化率.最后利用快速傅里叶变换对光流变化率数据进行频谱分析,根据最高谱线的幅值与平均幅值的比值阈值来判别视频是否经过篡改.实验表明,算法不仅能够准确识别待测视频是否经过帧率上转篡改,并且提高了视频压缩的鲁棒性能,具有一定的实际应用价值. 展开更多
关键词 视频篡改检测 帧率上转 时域篡改 光流 快速傅里叶变换
在线阅读 下载PDF
融合前景判别和圆形搜索的目标跟踪算法 预览
17
作者 林玲鹏 黄添强 林晶 《计算机应用》 CSCD 北大核心 2017年第11期3128-3133,共6页
针对运动目标在发生遮挡、形变、旋转和光照等变化时会导致跟踪误差大甚至丢失目标以及传统跟踪算法实时性差的问题,提出了一种融合前景判别和圆形搜索(cs)的目标跟踪算法。该算法采用了图像感知哈希技术来描述与匹配跟踪目标,跟踪... 针对运动目标在发生遮挡、形变、旋转和光照等变化时会导致跟踪误差大甚至丢失目标以及传统跟踪算法实时性差的问题,提出了一种融合前景判别和圆形搜索(cs)的目标跟踪算法。该算法采用了图像感知哈希技术来描述与匹配跟踪目标,跟踪过程使用了两种跟踪策略相结合的方法,能够有效地解决上述问题。首先,根据目标运动方向的不确定性和帧闽目标运动的缓慢性,通过CS算法搜索当前帧局部(目标周围)最佳匹配位置;然后,采用前景判别PBAS算法搜索当前帧全局最优目标前景;最终,选取两者与目标模板相似度更高者为跟踪结果,并根据匹配阈值判断是否更新目标模板。实验结果表明,所提算法在精度、准确率和实时性上都比MeanShift算法更好,在目标非快速运动时有较好的跟踪优势。 展开更多
关键词 目标跟踪 圆形搜索算法 前景判别 感知哈希 跟踪策略
在线阅读 下载PDF
基于差分隐私模型的云数据副本安全控制方案 预览 被引量:2
18
作者 任君 熊金波 姚志强 《网络与信息安全学报》 2017年第5期38-46,共9页
针对敌手利用重复数据删除作为侧信道攻击用户隐私信息的问题,提出一种安全的文件副本数量控制方案。核心思想是构建混合云架构,结合差分隐私中的隐私保护参数及收敛加密算法计算文件密钥值并对其进行二次加密,保证每个文件在服务器... 针对敌手利用重复数据删除作为侧信道攻击用户隐私信息的问题,提出一种安全的文件副本数量控制方案。核心思想是构建混合云架构,结合差分隐私中的隐私保护参数及收敛加密算法计算文件密钥值并对其进行二次加密,保证每个文件在服务器中只存有一个副本。与已有的通过设置阈值来控制副本数量的方案进行比较分析,所提方案可抵抗侧信道攻击、相关文件的攻击,以及针对加密算法的特定攻击,并节约了网络带宽及磁盘存储空间。 展开更多
关键词 关键词:重复数据删除:差分隐私 收敛加密 混合云 侧信道攻击
在线阅读 免费下载
基于KD树的信息发布隐私保护 预览
19
作者 林国滨 姚志强 +1 位作者 熊金波 林铭炜 《计算机系统应用》 2017年第8期206-211,共6页
随着医疗信息共享服务的发展,越来越多的患者病历信息被发布出来,敌手通过患者属性推断患者的隐私信息,从而造成患者隐私泄露.基于上述需求,提出基于KD树的隐私保护数据发布算法.利用KD树的性质,对每一维所在属性的泛化值进行分解,直到... 随着医疗信息共享服务的发展,越来越多的患者病历信息被发布出来,敌手通过患者属性推断患者的隐私信息,从而造成患者隐私泄露.基于上述需求,提出基于KD树的隐私保护数据发布算法.利用KD树的性质,对每一维所在属性的泛化值进行分解,直到所有属性的泛化值不能分解,以确保每个叶子节点的所有属性的泛化值的区域达到最小,以减少信息损失.在对等价元组属性分解期间,对每个节点敏感属性值个数做l多样性约束,以降低隐私泄漏风险.实验结果表明,方案可以减少隐私泄露风险和信息损失. 展开更多
关键词 隐私保护 数据发布 K-匿名 l-多样性 信息损失
在线阅读 下载PDF
基于稳态过程的多重分形Web日志仿真生成算法 预览 被引量:1
20
作者 彭行雄 肖如良 《计算机应用》 CSCD 北大核心 2017年第2期587-592,共6页
运行在服务器集群的软件系统需要Web日志的大规模数据集以满足性能测试的需求,但现有仿真生成算法因模型单一而无法满足要求。针对此问题,提出一种基于alpha稳态过程的多分形web日志的仿真生成算法。首先,在长相关尺度(LRD)下采用a... 运行在服务器集群的软件系统需要Web日志的大规模数据集以满足性能测试的需求,但现有仿真生成算法因模型单一而无法满足要求。针对此问题,提出一种基于alpha稳态过程的多分形web日志的仿真生成算法。首先,在长相关尺度(LRD)下采用alpha稳态过程来描述Web日志的自相似性;其次,在短相关尺度(RSD)下采用二项式b模型描述web日志的多重分形性;最后,将长相关模型和短相关模型融合于改进的ON/OFF框架中。与单一的模型相比,新算法的参数物理意义明确,具有良好的自相似性和多分形性。实验结果表明,该算法能够较准确地模拟真实Web日志.可以有效地应用于Web日志大规模数据集的仿真生成。 展开更多
关键词 稳态过程 多重分形 自相似 时间序列 日志分析 仿真生成
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部 意见反馈