07:46
根据林哥的回答我画了个方便理解的图
黄色的点就是固定随机种子对整个学习过程的‘影响’
可以是
这些策略里的任意一种状态
AI会根据当下的状态找到一个吃当前果子的唯一解,不一定是最优解。
然后固定这个步骤的答案,