欢迎转载,请注明出处:https://blog.csdn.net/tayhh/article/details/81290137
<https://blog.csdn.net/tayhh/article/details/81290137>
主要从下面几个模块来介绍
1.任务与目标
2.单步强化学习:K-摇臂赌博机
3.有限多步强化学习:有模型学习
4.有限多步强化学习:免模型学习
5.无穷多步强化学习:值函数近似
6.模仿学习
1.任务与目标
2.单步强化学习:K-摇臂赌博机
3.有限多步强化学习:有模型学习
4.有限多步强化学习:免模型学习
5.无穷多步强化学习:值函数近似
6.模仿学习
热门工具 换一换