期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Markov决策过程不确定策略特征模式 预览 被引量:2
1
作者 黄镇谨 陆阳 +1 位作者 杨娟 方欢 《计算机科学》 CSCD 北大核心 2013年第4期263-266,共4页
马尔科夫决策过程可以建模具有不确定性特征的复杂系统,而在进行模型分析时需要采用策略对不确定性进行处理。首先,研究不同策略下时空有界可达概率问题,给出不确定性解决策略的定义及分类方法。其次,在时间无关策略下,证明基于确定性... 马尔科夫决策过程可以建模具有不确定性特征的复杂系统,而在进行模型分析时需要采用策略对不确定性进行处理。首先,研究不同策略下时空有界可达概率问题,给出不确定性解决策略的定义及分类方法。其次,在时间无关策略下,证明基于确定性选取动作和随机选取动作的时空有界可达概率的一致性,并且论证了时间依赖策略相对于时间无关策略具有更好的时空有界可达概率。最后结合实例简要阐述了结论的正确性。 展开更多
关键词 马尔科夫决策过程 不确定性策略 时空有界可达概率
在线阅读 免费下载
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈