北大公开课-人工智能基础 10 智能体之智能主体的类别

五种最基础的智能体类型,包括了几乎所有智能体的类型


简单反射智能体的结构



简单反射agent的算法
定义三个量
状态:对于当前感知的状态输入,将感知对应为状态
规则:对于状态所匹配的规则
行为:基于规则返回的对应行为
首先,定义行为action为空,然后根据上述感知->状态->规则->行动
返回对应于当前感知的行为

举例,一个简单反射agent的例子
胸透系统,


一个基于模型的反射agent
还可以处理部分可观测环境
增加了状态的存储,
增加了环境变化的信息
增加了行动的对应


基于模型的简单反射agent算法
增加部分: 增加了第四个变量 model
stage,表示了对于当前外部状态的理解
model,是关于下一个状态,如何依赖于当前状态和动作的描述
rule,一套条件-动作的对应规则
action,当前动作,初始定义为空
在主要算法中,增加了update-state 函数,用于基于当前的状态、动作、感知、模型,来决定当前的状态,并更新到状态中。
根据状态-动作的规则表匹配,得到相应于当前状态的动作,
并将该动作返回

基于目标的agent
增加了 ,如果动作A,则结果如何
增加了目标信息


通过效用utility函数,得到一个特殊的状态,用于表示某个状态是否有效(对于目标而言)的度量函数

更通用的性能度量的agent
理性agent的效用要求

学习agent,
优越性在于,可以在一个未知的环境中运行,增加了机器学习功能。
和初始的aget结构相似。
增了一个评论者,对于学习的元素,性能的元素,对于性能进行改进,生成问题,得到经验,

学习agent的要素
学习要素、性能要素、问题发生器

对于atari游戏(视频游戏机)的深度学习,强化学习模型
和普通agent的区别,增加了红线部分,增加了外部环境的回报值,并根据外部环境的回报值,决定下一步的行为。


其他agent



是否具有学习功能,
自主性如何
单一或多个agnet
三者的交集——智能agent。。也即是说智能agent的要求就是可学习的,有自主性的,群体智能的。


智能体的几个特化例子,用UML符号表示
生物智能体,机器人智能体,计算智能体
多个智能体是单个智能体的聚合,
单个智能体包括,
简单反射agent,基于模型的agent,基于目标的agent,基于效用的agent,学习型agent,其他agent。

