北大公开课-人工智能基础 30 对抗性搜索之博弈中的最优决策


假设有max和min两个玩家,各自需要找出在限定展示下的对于自己的最优决策——两个玩家的对抗性搜索(博弈)

两个玩家的目标一致,使自己的收益最大化 V,使对方的收益最小化 -V

冯诺伊曼式博弈理论(算法有冯诺伊曼式的,也有非冯诺伊曼式的)

两个智能体的博弈(互相action),形成一棵决策树
本质上最优决策是由一系列minimax的值来串接起来的,
在最优决策路线上,每一个节点的值,都是使自己的价值V最大化,使对方的价值最小化 -V
