强化学习的数学原理 西湖大学赵世钰老师

2020-04-09

强化学习的数学原理 - 西湖大学赵世钰老师

资源介绍

本仓库提供了一个资源文件的下载,该资源文件为西湖大学赵世钰老师的《强化学习的数学原理》。这本书从零开始,通过数学角度,结合大量例子,循序渐进地揭示了强化学习的本质原理。该书为纯英文书籍,适合对强化学习有深入学习需求的研究者和学生。

书籍章节

该书包含以下章节:

  1. Chapter 1 Basic Concepts - 基本概念
  2. Chapter 2 State Values and Bellman Equation - 状态值与贝尔曼方程
  3. Chapter 3 Optimal State Values and Bellman Optimality Equation - 最优状态值与贝尔曼最优方程
  4. Chapter 4 Value Iteration and Policy Iteration - 值迭代与策略迭代
  5. Chapter 5 Monte Carlo Methods - 蒙特卡洛方法
  6. Chapter 6 Stochastic Approximation - 随机逼近
  7. Chapter 7 Temporal-Difference Methods - 时序差分方法
  8. Chapter 8 Value Function Approximation - 值函数逼近
  9. Chapter 9 Policy Gradient Methods - 策略梯度方法
  10. Chapter 10 Actor-Critic Methods - 演员-评论家方法
  11. Appendix C Convergence of Sequences - 序列的收敛性

适用人群

  • 对强化学习有深入研究需求的研究者
  • 希望从数学角度理解强化学习的学生
  • 对强化学习算法有兴趣的工程师和开发者

使用说明

  1. 下载资源文件。
  2. 使用支持PDF格式的阅读器打开文件。
  3. 按照章节顺序阅读,逐步理解强化学习的数学原理。

注意事项

  • 该书为纯英文书籍,建议具备一定的英语阅读能力。
  • 书中包含大量数学公式和推导,建议具备一定的数学基础。

希望这本书能够帮助你深入理解强化学习的数学原理,并在实际应用中取得更好的效果。

下载链接

强化学习的数学原理-西湖大学赵世钰老师