浏览全部资源
扫码关注微信
纸质出版:1988
移动端阅览
杨春巍. F有限折扣模型的策略迭代法[J]. 土木与环境工程学报(中英文), 1988,10(2).
Yang Chunwei. THE TACTICS ALTERNATIVE METHOD FOR THE MODEL OF F FINITE DISCOUNT[J]. Journal of Civil and Environmental Engineering, 1988, 10(2).
杨春巍. F有限折扣模型的策略迭代法[J]. 土木与环境工程学报(中英文), 1988,10(2). DOI: 10.11835/j.issn.1674-4764.1988.02.013.
Yang Chunwei. THE TACTICS ALTERNATIVE METHOD FOR THE MODEL OF F FINITE DISCOUNT[J]. Journal of Civil and Environmental Engineering, 1988, 10(2). DOI: 10.11835/j.issn.1674-4764.1988.02.013.
本文研究马尔科夫决策规划(MDP){S
(A_(i)
i∈S)
q
Γ
V}的求值运算。为了保证用长期总期望报酬∑ E_π{R_1|y_0=i}作为目标函数具有收敛性
引进一个折扣因子β(0
0
浏览量
8
下载量
CSCD
关联资源
相关文章
相关作者
相关机构