人工智能中的 Wumpus 世界

Wumpus世界:

Wumpus 世界是一个简单的世界示例,用于说明基于知识的代理的价值并表示知识表示。它的灵感来自1973 年 Gregory Yob的电子游戏Hunt the Wumpus

Wumpus世界是一个洞穴,有4/4个房间与通道相连。所以总共有16个房间相互连接。我们有一个以知识为基础的代理人,他将在这个世界上前进。洞里有一个房间,里面住着一只名叫乌姆普斯的野兽,它会吃掉任何进入房间的人。Wumpus 可以被特工射中,但特工只有一支箭。在Wumpus的世界里,有一些深不见底的坑房,如果特工掉进坑里,他就会被永远困在那里。这个洞穴令人兴奋的是,在一个房间里有可能找到一堆金子。所以代理的目标是找到金子并爬出洞穴,而不会掉入坑中或被 Wumpus 吃掉。特工拿金子出来会得到奖励,被Wumpus吃掉或掉进坑里会受到惩罚。

注意:这里的 Wumpus 是静止的,不能移动。

以下是表示 Wumpus 世界的示例图。它显示了一些带有坑的房间,一个带有 Wumpus 的房间和一个位于世界 (1, 1) 平方位置的代理。

人工智能中的 Wumpus 世界

还有一些组件可以帮助代理在洞穴中导航。这些组件如下所示:

  1. Wumpus房间旁边的房间很臭,所以会有一些恶臭。

  2. 靠近 PIT 的房间有微风,所以如果代理靠近 PIT,那么他会感觉到微风。

  3. 当且仅当房间里有金子时,房间里才会有闪光。

  4. 如果特工面对它,Wumpus 可以被特工杀死,Wumpus 会发出可怕的尖叫声,在洞穴的任何地方都可以听到。

Wumpus世界的PEAS描述:

为了解释 Wumpus 世界,我们给出了 PEAS 描述如下:

性能指标:

  • 如果特工带着金币从洞穴中出来,则+1000 奖励积分。

  • 被Wumpus吃掉或掉进坑里会受到-1000分的惩罚。

  • 每个动作 -1,使用箭头 -10。

  • 如果任何一个特工死亡或从洞穴中出来,游戏就会结束。

环境:

  • 一个 4*4 的房间网格。

  • 代理最初在房间正方形 [1, 1] 中,面向右侧。

  • 除了第一个方格 [1,1] 之外,Wumpus 和黄金的位置是随机选择的。

  • 除了第一个方格之外,洞穴的每个方格都可以是一个概率为 0.2 的坑。

执行器:

  • 左转,

  • 右转

  • 前进

  • 抓住

  • 释放

  • 射击。

传感器:

  • 如果特工在与 Wumpus 相邻的房间内,他会感觉到恶臭(不是对角线)。

  • 如果特工在与坑直接相邻的房间里,他会感觉到微风

  • 代理会感知到房间里有金子闪光

  • 如果他走进一堵墙,代理会感觉到碰撞

  • 当Wumpus被射击时,它会发出可怕的尖叫声,在洞穴的任何地方都可以感知到。

  • 这些感知可以表示为五个元素列表,其中每个传感器都有不同的指标。

  • 例如,如果代理感知到恶臭、微风,但没有闪光、没有颠簸和尖叫,那么它可以表示为:
    [Stench, Breeze, None, None, None]

Wumpus世界属性:

  • 部分可观察: Wumpus 世界是部分可观察的,因为智能体只能感知附近的环境,例如相邻的房间。

  • 确定性:它是确定性的,因为世界的结果和结果是已知的。

  • Sequential:顺序很重要,所以是顺序的。

  • 静态:它是静态的,因为 Wumpus 和 Pits 没有移动。

  • 离散:环境是离散的。

  • 一个代理:环境是单个代理,因为我们只有一个代理,Wumpus 不被视为代理。

探索 Wumpus 世界:

现在我们将探索 Wumpus 世界,并将通过应用逻辑推理来确定代理如何找到其目标。

代理第一步:

最初,agent 在第一个房间或正方形 [1,1] 上,我们已经知道这个房间对 agent 来说是安全的,所以为了在下图 (a) 上表示房间是安全的,我们将添加符号好的。符号A代表代理,符号B代表微风,G代表闪光或黄金,V代表访问的房间,P代表坑,W代表Wumpus。

在房间 [1,1] 特工感觉不到任何微风或任何恶臭,这意味着相邻的方格也没有问题。

人工智能中的 Wumpus 世界

代理的第二步:

现在代理需要向前移动,所以它要么移动到 [1, 2],要么移动到 [2,1]。让我们假设代理移动到房间 [2, 1],在这个房间代理感觉到一些微风,这意味着 Pit 就在这个房间周围。坑可以在[3, 1]或[2,2],所以我们要加符号P? 话说,这就是坑房吗?

现在代理会停下来思考,不会做出任何有害的举动。代理将返回 [1, 1] 房间。房间 [1,1] 和 [2,1] 被代理访问过,因此我们将使用符号 V 来表示访问过的方块。

代理第三步:

在第三步,现在代理将移动到房间 [1,2],这是可以的。在房间 [1,2] 中,agent 感觉到一股恶臭,这意味着附近一定有 Wumpus。但是根据游戏规则,Wumpus 不能在房间 [1,1] 中,也不能在 [2,2] 中(特工在 [2,1] 时没有检测到任何恶臭)。因此 agent 推断 Wumpus 在房间 [1,3] 中,并且在当前状态下,没有微风,这意味着在 [2,2] 中没有 Pit 也没有 Wumpus。所以它是安全的,我们将其标记为 OK,并且代理在 [2,2] 中进一步移动。

人工智能中的 Wumpus 世界

代理第四步:

在房间 [2,2],这里没有臭味,也没有微风,所以让我们假设代理决定移动到 [2,3]。在房间 [2,3] 处,智能体感觉到闪光,所以它应该抓住金子爬出洞穴。


  • 使用社交账号登录,本站支持
全部评论(0)