期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于模拟退火策略的Sarsa强化学习方法 预览
1
作者 郝文宁 +1 位作者 陈刚 余晓晗 《计算机仿真》 北大核心 2019年第4期219-222,228共5页
针对传统强化学习算法(如Sarsa算法)收敛速度缓慢的问题,提出了基于模拟退火策略的Sarsa(SA-Sarsa)算法。在策略选择上使用模拟退火策略替代ε-greedy策略,利用退火速率控制算法的收敛速度,有效克服了Sarsa算法直接通过随机数与贪婪值... 针对传统强化学习算法(如Sarsa算法)收敛速度缓慢的问题,提出了基于模拟退火策略的Sarsa(SA-Sarsa)算法。在策略选择上使用模拟退火策略替代ε-greedy策略,利用退火速率控制算法的收敛速度,有效克服了Sarsa算法直接通过随机数与贪婪值比较选择策略而导致的陷入局部最优解的问题,达到了保证最优解、提高收敛速度的目的。通过迷宫的路径规划问题仿真,将SA-Sarsa算法与Q-Learning和Sarsa两种传统算法进行了对比,实验表明,SA-Sarsa学习算法在取得同等最优解下探索效率高且收敛速度更快。 展开更多
关键词 强化学习 算法 模拟退火 迷宫仿真
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈