AI中的代理环境

环境是世界上围绕代理的一切,但它不是代理本身的一部分。环境可以描述为代理存在的情况。

环境是智能体生活、操作和为智能体提供感知和行动的地方。一个环境通常被认为是非女性主义的。

环境特点

根据 Russell 和 Norvig 的说法,从代理的角度来看,环境可以具有各种特征:

  1. 完全可观察 vs 部分可观察

  2. 静态与动态

  3. 离散 vs 连续

  4. 确定性与随机性

  5. 单代理 vs 多代理

  6. 情节与顺序

  7. 已知与未知

  8. 可访问与不可访问

1. 完全可观察与部分可观察:

  • 如果代理传感器可以在每个时间点感知或访问环境的完整状态,那么它就是一个完全可观察的环境,否则它是部分可观察的

  • 一个完全可观察的环境很容易,因为不需要维护内部状态来跟踪世界的历史。

  • 一个在所有环境中都没有传感器的代理,那么这样的环境被称为不可观察的

2. 确定性与随机性:

  • 如果代理的当前状态和选择的动作可以完全确定环境的下一个状态,则这种环境称为确定性环境。

  • 随机环境本质上是随机的,不能完全由代理决定。

  • 在确定性的、完全可观察的环境中,代理不需要担心不确定性。

3. 情节与顺序:

  • 在情节环境中,存在一系列一次性动作,并且动作只需要当前感知。

  • 然而,在顺序环境中,代理需要记忆过去的动作来确定下一个最佳动作。

4. 单代理 vs 多代理

  • 如果一个环境中只涉及一个代理,并且自己运行,那么这样的环境称为单代理环境。

  • 但是,如果多个代理在一个环境中运行,则这样的环境称为多代理环境。

  • 多代理环境中的代理设计问题与单代理环境不同。

5. 静态 vs 动态:

  • 如果在代理进行审议时环境可以改变自身,那么这种环境称为动态环境,否则称为静态环境。

  • 静态环境很容易处理,因为代理在决定行动时不需要继续观察世界。

  • 然而,对于动态环境,代理需要在每个动作中不断观察世界。

  • 出租车驾驶是动态环境的一个例子,而填字游戏是静态环境的一个例子。

6. 离散 vs 连续:

  • 如果在一个环境中可以执行的感知和动作是有限的,那么这样的环境称为离散环境,否则称为连续环境。

  • 国际象棋游戏是在离散环境下进行的,因为可以执行的移动数量是有限的。

  • 自动驾驶汽车是连续环境的一个例子。

7. 已知与未知

  • 已知和未知实际上并不是环境的特征,而是代理执行动作的知识状态。

  • 在已知环境中,代理知道所有操作的结果。在未知环境中,代理需要了解其工作原理才能执行操作。

  • 很可能已知环境部分可观察,而未知环境完全可观察。

8. 可访问与不可访问

  • 如果代理能够获得关于状态环境的完整和准确的信息,那么这样的环境称为可访问环境,否则称为不可访问环境。

  • 其状态可以由其温度定义的空房间是无障碍环境的一个示例。

  • 关于地球上事件的信息是无法进入的环境的一个例子。


  • 使用社交账号登录,本站支持
全部评论(0)