期刊文献+
共找到373篇文章
< 1 2 19 >
每页显示 20 50 100
面向软件定义的铁路无线通信网络
1
作者 王开锋 张琦 +3 位作者 刘畅 杜亚珍 陈宁宁 高莺 《清华大学学报:自然科学版》 EI CAS CSCD 北大核心 2019年第2期142-147,共6页
针对铁路无线数据通信带宽不足、可靠性不高等问题,提出一种基于软件定义的铁路无线通信网络(RailSDN),将控制平面和数据平面分离,实现跨运营商异构网络协同工作,采用虚拟化技术实现用户的逻辑隔离,为用户提供透明的数据传输服务。基于M... 针对铁路无线数据通信带宽不足、可靠性不高等问题,提出一种基于软件定义的铁路无线通信网络(RailSDN),将控制平面和数据平面分离,实现跨运营商异构网络协同工作,采用虚拟化技术实现用户的逻辑隔离,为用户提供透明的数据传输服务。基于Markov决策过程建立网络资源调度模型,该模型考虑基础设施网络状态及用户需求等因素,以用户需求的满足程度为优化目标,搜索最优的链路分配决策,将用户需求与网络资源动态适配。测试结果表明:所提出的铁路无线通信网络具有很强的可扩展性,实现了用户需求的弹性定制,提高了网络资源的利用效率。 展开更多
关键词 铁路无线通信 软件定义网络 虚拟化 MARKOV 决策过程 动态适配
一种基于2D和3D联合信息的改进MDP跟踪算法 预览
2
作者 王正宁 周阳 +3 位作者 吕侠 曾凡伟 张翔 张锋军 《计算机科学》 CSCD 北大核心 2019年第3期97-102,共6页
在线多目标跟踪算法是自动驾驶和辅助驾驶系统的重要组成部分。目前,大部分多目标跟踪方法集中于图像域跟踪。虽然通过建立自适应在线模型或最小化能量函数可以解决大多数跟踪问题,但是如何处理复杂交通场景下目标的相互遮挡仍是研究者... 在线多目标跟踪算法是自动驾驶和辅助驾驶系统的重要组成部分。目前,大部分多目标跟踪方法集中于图像域跟踪。虽然通过建立自适应在线模型或最小化能量函数可以解决大多数跟踪问题,但是如何处理复杂交通场景下目标的相互遮挡仍是研究者们面临的难题。文中基于2D和3D联合信息提出了一种改进的基于马尔科夫决策过程(MDP)的跟踪算法,通过将原始MDP跟踪算法的相似性特征由图像域拓展到空间域,使用一种新的光流特征描述子即多图像前后向跟踪误差(Multi-image FB error)来代替原算法的多区域前后向跟踪误差(Multi-aspect FB error),取得了良好的跟踪效果。最后,采用KITTI数据库对本文算法进行测试,结果显示其综合性能相较于原算法有显著提升。 展开更多
关键词 多目标跟踪 马尔科夫决策过程 多图像光流 2D-3D联合特征
在线阅读 免费下载
水下滑翔蛇形机器人滑翔控制的强化学习方法
3
作者 张晓路 李斌 +1 位作者 常健 唐敬阁 《机器人》 EI CSCD 北大核心 2019年第3期334-342,共9页
研究了一种强化学习算法,用于水下滑翔蛇形机器人的滑翔运动控制.针对水动力环境难以建模的问题,使用强化学习方法使水下滑翔蛇形机器人自适应复杂的水环境,并自动学习仅通过调节浮力来控制滑翔运动.对此,提出了循环神经网络蒙特卡洛策... 研究了一种强化学习算法,用于水下滑翔蛇形机器人的滑翔运动控制.针对水动力环境难以建模的问题,使用强化学习方法使水下滑翔蛇形机器人自适应复杂的水环境,并自动学习仅通过调节浮力来控制滑翔运动.对此,提出了循环神经网络蒙特卡洛策略梯度算法,改善了由于机器人的状态难以完全观测而导致的算法难以训练的问题,并将水下滑翔蛇形机器人的基本滑翔动作控制问题近似为马尔可夫决策过程,从而得到有效的滑翔控制策略.通过仿真和实验证明了所提出方法的有效性. 展开更多
关键词 强化学习 水下滑翔蛇形机器人 马尔可夫决策过程 循环神经网络
复杂装备复合维修的组合维修决策模型研究 预览
4
作者 丁申虎 贾云献 《舰船电子工程》 2019年第7期142-145,149共5页
对于部件之间存在经济相关性的复杂装备,组合维修能提高维修效率并节省维修费用。论文针对辅以定期检测的工龄更换的复合维修策略,根据装备在运行过程中的状态,利用马尔科夫决策过程的相关理论,建立了以可靠性为约束条件,组合维修后可... 对于部件之间存在经济相关性的复杂装备,组合维修能提高维修效率并节省维修费用。论文针对辅以定期检测的工龄更换的复合维修策略,根据装备在运行过程中的状态,利用马尔科夫决策过程的相关理论,建立了以可靠性为约束条件,组合维修后可节省的维修费用最大为目标函数的组合维修决策数学模型,并用Matlab遗传算法工具箱对模型进行求解。最后,通过算例验证了该组合维修决策模型的有效性。 展开更多
关键词 经济相关性 马尔科夫决策过程 复合维修 复杂装备 组合维修
在线阅读 下载PDF
基于Q-learning的虚拟网络功能调度方法 预览
5
作者 王晓雷 陈云杰 +1 位作者 王琛 牛犇 《计算机工程》 CAS CSCD 北大核心 2019年第2期64-69,共6页
针对现有调度方法多数未考虑虚拟网络功能在实例化过程中的虚拟机选择问题,提出一种新的虚拟网络调度方法。建立基于马尔科夫决策过程的虚拟网络功能调度模型,以最小化所有服务功能链的服务延迟时间。通过设计基于Q-learning的动态调度... 针对现有调度方法多数未考虑虚拟网络功能在实例化过程中的虚拟机选择问题,提出一种新的虚拟网络调度方法。建立基于马尔科夫决策过程的虚拟网络功能调度模型,以最小化所有服务功能链的服务延迟时间。通过设计基于Q-learning的动态调度算法,优化虚拟网络功能的调度顺序和虚拟机选择问题,实现最短网络功能虚拟化调度时间。仿真结果表明,与传统的随机虚拟机选择策略相比,该方法能够有效降低虚拟网络功能调度时间,特别是在大规模网络中调度时间可降低约40%。 展开更多
关键词 网络功能虚拟化 服务功能链 调度模型 马尔科夫决策过程 Q-学习
在线阅读 下载PDF
考虑不确定因素的多模式城市交通网络路径决策 预览
6
作者 李浩楠 曹成铉 +1 位作者 柳雨彤 冯紫嫣 《科学技术与工程》 北大核心 2019年第12期319-324,共6页
由于时间的波动性与突发事件的影响,多模式城市交通网络的运行时常伴随着各种不确定性情况的发生。通过考虑多模式交通网络的出行特点与交通网络不同的运行状态,建立了基于马尔可夫决策过程的多模式交通网络的路线决策模型与算法,所提... 由于时间的波动性与突发事件的影响,多模式城市交通网络的运行时常伴随着各种不确定性情况的发生。通过考虑多模式交通网络的出行特点与交通网络不同的运行状态,建立了基于马尔可夫决策过程的多模式交通网络的路线决策模型与算法,所提方法应用到北京市多模式城市交通网络。结果显示,不同出发时间需要不同的路径决策以达到最小出行时间。基于马尔可夫决策过程的路径决策方法的有效性得到验证,它可以为出行者路线选择提供更合理的指示。 展开更多
关键词 多模式交通网络 路线决策 马尔可夫决策过程 出行时间
在线阅读 免费下载
综合能源并网CPS模型及信息化安全防护方案研究 预览
7
作者 李珂 柴守亮 +3 位作者 张超 边海峰 裴玮 张元博 《电工电能新技术》 CSCD 北大核心 2019年第6期68-73,共6页
大量分布式综合能源接入配电网,给配电网安全运行带来了新的问题与挑战,随之产生了对自动化数据接入及信息安全技术应用的新需求。综合能源并网系统是一个典型的信息物理系统。针对综合能源并网信息互联网化接入带来的信息安全问题,提... 大量分布式综合能源接入配电网,给配电网安全运行带来了新的问题与挑战,随之产生了对自动化数据接入及信息安全技术应用的新需求。综合能源并网系统是一个典型的信息物理系统。针对综合能源并网信息互联网化接入带来的信息安全问题,提出满足综合能源侧数据采集及电网主站侧应用的信息物理建模需求,并建立了其五元组信息物理模型,进而采用马尔可夫决策过程模型,设计了基于信息物理模型的安全防护方案,以满足面向综合能源的互联网信息接入和业务应用要求,算例分析结果证明了设计的综合能源并网信息物理模型和安全防护方法的有效性。 展开更多
关键词 综合能源 马尔可夫决策过程 CPS模型 安全防护 WI-FI
在线阅读 下载PDF
任务性能约束下传感器协同辐射控制策略 预览
8
作者 赖作镁 乔文昇 +1 位作者 古博 王师逸 《系统工程与电子技术》 EI CSCD 北大核心 2019年第8期1749-1754,共6页
传感器协同是作战飞机实现任务性能与射频(radio frequency,RF)隐身性能平衡的重要技术手段。针对传统引导搜索方法难以解决数据链的多拍信息引导搜索问题,采用概率方法,建立多拍连续引导信息与累积发现概率、累积被截获概率之间的关系... 传感器协同是作战飞机实现任务性能与射频(radio frequency,RF)隐身性能平衡的重要技术手段。针对传统引导搜索方法难以解决数据链的多拍信息引导搜索问题,采用概率方法,建立多拍连续引导信息与累积发现概率、累积被截获概率之间的关系。针对基于协方差的线性规划协同跟踪方法的单步决策问题,开展基于跟踪精度与被跟踪定位精度的多步联合优化。引入马尔可夫决策过程对机载传感器协同搜索、协同跟踪的典型空战动态过程进行建模,实现任务性能约束下的雷达RF隐身性能优化。通过典型空战场景的仿真验证,表明所提出的优化控制策略相比于经验控制策略能够减少雷达辐射时间43%以上。 展开更多
关键词 射频隐身 传感器协同搜索 传感器协同跟踪 马尔可夫决策过程
在线阅读 下载PDF
基于逆强化学习的示教学习方法综述 预览
9
作者 张凯峰 俞扬 《计算机研究与发展》 EI CSCD 北大核心 2019年第2期254-261,共8页
随着强化学习在自动机器人控制、复杂决策问题上的广泛应用,强化学习逐渐成为机器学习领域中的一大研究热点.传统强化学习算法是一种通过不断与所处环境进行自主交互并从中得到策略的学习方式.然而,大多数多步决策问题难以给出传统强化... 随着强化学习在自动机器人控制、复杂决策问题上的广泛应用,强化学习逐渐成为机器学习领域中的一大研究热点.传统强化学习算法是一种通过不断与所处环境进行自主交互并从中得到策略的学习方式.然而,大多数多步决策问题难以给出传统强化学习所需要的反馈信号.这逐渐成为强化学习在更多复杂问题中实现应用的瓶颈.逆强化学习是基于专家决策轨迹最优的假设,在马尔可夫决策过程中逆向求解反馈函数的一类算法.目前,通过将逆强化学习和传统正向强化学习相结合设计的一类示教学习算法已经在机器人控制等领域取得了一系列成果.对强化学习、逆强化学习以及示教学习方法做一定介绍,此外还介绍了逆强化学习在应用过程中所需要解决的问题以及基于逆强化学习的示教学习方法. 展开更多
关键词 强化学习 示教学习 逆强化学习 马尔可夫决策过程 多步决策问题
在线阅读 下载PDF
结合深度Q学习和注意模型的视频人脸识别 预览
10
作者 郑秋文 刘惠义 《信息技术》 2019年第4期111-115,120共6页
针对视频人脸识别中存在的动态人脸信息捕捉困难和局部人脸特征提取粗糙的问题,提出了一种基于深度Q学习和注意模型结合的视频人脸识别方法。首先,采用卷积神经网络(Convolutional Neural Network,CNN)训练视频数据可提取多维特征;其次... 针对视频人脸识别中存在的动态人脸信息捕捉困难和局部人脸特征提取粗糙的问题,提出了一种基于深度Q学习和注意模型结合的视频人脸识别方法。首先,采用卷积神经网络(Convolutional Neural Network,CNN)训练视频数据可提取多维特征;其次,将视频特征输入注意模型,根据视频数据时间连续性信息得到局部人脸特征、人脸位置和时间记忆单元;最后,采用Q学习迭代计算注意模型的输出,找到含人脸的最优帧序列,并以此计算视频匹配准确度。实验结果表明,该方法有效提高了复杂背景下视频人脸识别的准确性。 展开更多
关键词 视频人脸识别 深度Q学习 注意力模型 马尔科夫决策过程
在线阅读 下载PDF
一种基于MDP理论的武器火控系统精度可靠性增强方法研究 预览
11
作者 冯楠 张黎 《电子技术应用》 2019年第7期56-58,62共4页
火控系统的精度是一个非常重要的战术技术指标,而惯导系统的可靠性则对保证火控系统的精度起着重要的作用,冗余技术是提高惯导系统可靠性的有力保证。以陀螺仪为例建立了惯性导航设备冗余度优化设计的马氏决策控制模型,并进行了验证分析... 火控系统的精度是一个非常重要的战术技术指标,而惯导系统的可靠性则对保证火控系统的精度起着重要的作用,冗余技术是提高惯导系统可靠性的有力保证。以陀螺仪为例建立了惯性导航设备冗余度优化设计的马氏决策控制模型,并进行了验证分析,证明对此模型应用策略迭代算法的科学性与合理性。仿真结果表明,所建立的模型能够反映惯性导航设备冗余度优化设计的实质,仿真结果能够为SINS(捷联惯性导航系统)冗余结构性设计提供一定的工程参考。 展开更多
关键词 火控系统 冗余度 马尔可夫决策过程 可靠性
在线阅读 下载PDF
移动边缘计算中基于内容动态刷新的能耗优化 预览 被引量:1
12
作者 郭延超 高岭 +2 位作者 王海 郑杰 任杰 《计算机研究与发展》 CSCD 北大核心 2018年第3期563-571,共9页
随着移动互联网的飞速发展与相关技术的不断提升,社交类应用已成为现下主流应用之一.同时,手机应用的功能也越来越丰富,其能耗需求以及信息处理能力也越来越大.针对移动社交平台忽略网络状态、频繁刷新内容(文字、图片、视频等)造成的... 随着移动互联网的飞速发展与相关技术的不断提升,社交类应用已成为现下主流应用之一.同时,手机应用的功能也越来越丰富,其能耗需求以及信息处理能力也越来越大.针对移动社交平台忽略网络状态、频繁刷新内容(文字、图片、视频等)造成的高能耗以及运算能力问题,提出一种边缘计算模式下基于Markov决策过程(Markov decision process,MDP)的能耗优化模型.该模型考虑不同环境的网络状态,根据手机当前电量以及用户刷新频率,通过本地移动边缘计算层完成数据处理,在Markov决策过程生成的决策表中选择最优策略,动态选择最佳的网络接入以及刷新下载最佳的图片格式.该模型不仅减少刷新时间,而且能够降低移动平台的能耗.实验结果表明:相比于使用单一网络的图片刷新模式,在保证不减少用户刷新次数的前提下,该能耗优化模型降低能耗约12.1%. 展开更多
关键词 社交APP MARKOV决策过程 能耗优化 刷新模式 边缘计算
在线阅读 下载PDF
铁路钢轨网格化维修规划优化编制模型 预览
13
作者 白磊 贾传峻 +2 位作者 李擎 刘仍奎 孙全欣 《交通运输系统工程与信息》 CSCD 北大核心 2018年第4期171-177,共7页
优化编制铁路钢轨维修规划,对管理者合理利用维修资源、确保铁路行车安全具有重要意义.本文基于铁路基础设施网格化管理思想,按照一定规则将线性、连续的铁路钢轨设备,分割为等长的小区段,这些小区段称为钢轨网格.以钢轨网格为基本对象... 优化编制铁路钢轨维修规划,对管理者合理利用维修资源、确保铁路行车安全具有重要意义.本文基于铁路基础设施网格化管理思想,按照一定规则将线性、连续的铁路钢轨设备,分割为等长的小区段,这些小区段称为钢轨网格.以钢轨网格为基本对象,采用多阶段指数Markov模型,个性化描述钢轨网格状态变化规律;在此基础上,采用Markov决策过程方法,以规划周期内的期望总成本最小为目标函数,建立基于状态的维修策略模型,确定一个较长规划周期内的最优维修策略.作者采用了陇海线实际数据对提出模型的有效性进行了验证,计算结果表明,本文提出的模型优于基于阈值的中国铁路既有的管理方法. 展开更多
关键词 铁路运输 铁路钢轨 维修规划 网格化 MARKOV决策过程
在线阅读 下载PDF
Optimal Threshold Policies for Robust Data Center Control
14
作者 WENG Paul 邱泽麒 +2 位作者 COSTANZO John 阴小骐 SINOPOLI Bruno 《上海交通大学学报:英文版》 EI 2018年第1期52-60,共9页
具有返工过程的动态任务调度方法
15
作者 陈武一 王小明 《模具工业》 2018年第11期9-14,共6页
模具设计任务具有随机返工的典型特征,决策者无法做出最优决策,使用马尔可夫决策过程对具有返工过程的任务动态调度问题建立数学模型,由于返工需要更多的时间,导致无法在任务完工期内按时完工,研究旨在实现任务总拖期期望成本最小化为目... 模具设计任务具有随机返工的典型特征,决策者无法做出最优决策,使用马尔可夫决策过程对具有返工过程的任务动态调度问题建立数学模型,由于返工需要更多的时间,导致无法在任务完工期内按时完工,研究旨在实现任务总拖期期望成本最小化为目标,在此基础上应用多种排序规则组合优先筛选行动集解决动态规划维数灾难问题,对比单一的规则表明,该方法在求解问题上具有的优越性。 展开更多
关键词 动态调度 马尔科夫决策过程 多规则组合 模具设计 决策时刻
基于MDP随机路径模拟的电动汽车充电负荷时空分布预测
16
作者 张谦 王众 +2 位作者 谭维玉 刘桦臻 李晨 《电力系统自动化》 CSCD 北大核心 2018年第20期59-66,共8页
针对电动汽车时空转移随机性的问题,计及实时交通与温度,提出了一种基于马尔可夫决策过程随机路径模拟的城市电动汽车充电负荷时空分布预测方法。首先,根据各类车型充电方式与出行特点对各类电动汽车进行分类;其次,根据蒙特卡洛方法建... 针对电动汽车时空转移随机性的问题,计及实时交通与温度,提出了一种基于马尔可夫决策过程随机路径模拟的城市电动汽车充电负荷时空分布预测方法。首先,根据各类车型充电方式与出行特点对各类电动汽车进行分类;其次,根据蒙特卡洛方法建立各类电动汽车的时空转移模型,采用马尔可夫决策理论对出行路径进行实时动态随机模拟;根据电动汽车实测数据建立温度、交通能耗模型,计算得到实时单位里程耗电量。最后,以某典型城区为例,对不同温度、不同交通状况下电动汽车区域充电负荷进行计算。仿真结果表明,区域内快充负荷较大的节点充电波动性较大,环境温度升高或交通拥堵状况恶化会导致充电负荷高峰的持续时间增高。 展开更多
关键词 电动汽车 时空分布 马尔可夫决策过程 随机路径模拟 充电负荷
无线网络中基于深度Q学习的传输调度方案 预览 被引量:1
17
作者 朱江 王婷婷 +1 位作者 宋永辉 刘亚利 《通信学报》 CSCD 北大核心 2018年第4期35-44,共10页
要:针对无线网络中的数据传输问题,提出一种基于深度Q学习(QL,Qlearning)的传输调度方案。该方案通过建立马尔可夫决策过程(MDP,Markovdecisionprocess)系统模型来描述系统的状态转移情况;使用Q学习算法在系统状态转移概率未知的情况下... 要:针对无线网络中的数据传输问题,提出一种基于深度Q学习(QL,Qlearning)的传输调度方案。该方案通过建立马尔可夫决策过程(MDP,Markovdecisionprocess)系统模型来描述系统的状态转移情况;使用Q学习算法在系统状态转移概率未知的情况下学习和探索系统的状态转移信息,以获取调度节点的近似最优策略。另外,当系统状态的规模较大时,采用深度学习(DL,deeplearning)的方法来建立状态和行为之间的映射关系,以避免策略求解中产生的较大计算量和存储空间。仿真结果表明,该方法在功耗、吞吐量、分组丢失率方面的性能逼近基于策略迭代的最优策略,且算法复杂度较低,解决了维灾问题。 展开更多
关键词 无线网络传输 马尔可夫决策过程 Q学习 深度学习
在线阅读 下载PDF
A Heterogeneous Information Fusion Deep Reinforcement Learning for Intelligent Frequency Selection of HF Communication 预览
18
作者 Xin Liu Yuhua Xu +3 位作者 Yunpeng Cheng Yangyang Li Lei Zhao Xiaobo Zhang 《中国通信:英文版》 SCIE CSCD 2018年第9期73-84,共12页
关键词 频率选择 通讯方法 学习速度 信息 异构 熔化 环境状态 HF
在线阅读 下载PDF
Anti-chain based algorithms for timed/probabilistic refinement checking
19
作者 Ting WANG Tieming CHEN +1 位作者 Yang LIU Ye WANG 《中国科学:信息科学(英文版)》 SCIE EI CSCD 2018年第5期182-198,共17页
精炼检查回答一个实现模型是否是一个说明模型的精炼的问题,它具有为系统确认的大价值。一些精炼关系,例如,踪迹精炼和失败 / 分叉精炼,为不同确认目的被认出了。一般来说,精炼检查算法经常依靠子集建设,它处于州的空间爆炸问题... 精炼检查回答一个实现模型是否是一个说明模型的精炼的问题,它具有为系统确认的大价值。一些精炼关系,例如,踪迹精炼和失败 / 分叉精炼,为不同确认目的被认出了。一般来说,精炼检查算法经常依靠子集建设,它处于州的空间爆炸问题招致。最近,反链基于途径为踪迹精炼检查被建议了,并且结果显示出重要改进。在这份报纸,我们调查把反链途径用于预定精炼检查的问题(预定实现对一预定或 untimed 说明)并且检查的概率的精炼(概率的实现对一个非概率的说明),并且证明州的空间能被采用反链途径更加减少。所有算法集成于检查工具的模型轻拍,并且实验被进行了显示出反链的申请的效率。 展开更多
关键词 检查工具 算法集成 精炼 反链 非概率 空间爆炸 模型 ing
考虑职业倦怠的护士夜班指派问题
20
作者 朱嫣然 耿娜 Andrea Matta 《工业工程与管理》 CSSCI 北大核心 2018年第4期172-178,193共8页
护士排班问题旨在满足一系列如法律法规、患者需求等约束条件的前提下,制定出在特定时间段内最优的护士值班表。职业倦怠是指服务于助人行业的人们因工作时间过长、工作量过大、工作强度过高所经历的一种疲惫不堪的状态。护士经常经历... 护士排班问题旨在满足一系列如法律法规、患者需求等约束条件的前提下,制定出在特定时间段内最优的护士值班表。职业倦怠是指服务于助人行业的人们因工作时间过长、工作量过大、工作强度过高所经历的一种疲惫不堪的状态。护士经常经历疾病和死亡,不可避免地加班和上夜班,所以较容易产生职业倦怠。主要研究考虑职业倦怠的护士排班问题。前期研究表明夜班对护士的职业倦怠有较显著的影响,应用马尔科夫决策过程建立了考虑职业倦怠的护士夜班指派模型。该模型在考虑患者需求的前提下在特定时间段内为一组不同倦怠水平的护士指派夜班。利用夜班指派模型输出的最佳指派方案进行了仿真,并与几种常用的不考虑倦怠因素的指派方案进行了比较分析,最后对最优指派策略进行了敏感度分析,验证了考虑职业倦怠的护士夜班指派模型的实用价值与意义。 展开更多
关键词 职业倦怠 马尔科夫决策过程 夜班指派
上一页 1 2 19 下一页 到第
使用帮助 返回顶部 意见反馈