欢迎光临散文网会员登陆 & 注册

强化学习基础概念之智能体的种类

2023-03-29 17:27 作者:下辈子也不会早起 0人读过 | 我要投稿

强化学习智能体分类：

（1）基于模型的强化学习。策略（和/或）价值函数，环境模型。如：迷宫游戏、迷宫、围棋、迷宫、象棋等这类规则明确，且可以枚举下一个状态的所有可能（比如象棋黑方走了一步后，可以列举此时红方可能要走的棋子和要走的方式）。

（2）模型无关的强化学习。策略（和/或）价值函数，没有环境模型，环境是黑箱，比如Atari游戏、王者荣耀游戏，其需要大量的采样。

标签：

强化学习基础概念之智能体的种类的评论 (共条)