Intro to AI, Rational Agents

第一章笔记是该课程的开篇介绍, 核心是定义什么是智能体 (Agent) 以及智能体所处的环境 (Environment)

智能体 (Agents)

AI的中心问题是创建一个理性的智能体 (rational agent) 。理性智能体是一个拥有目标或偏好，并试图执行一系列行动以期在这些目标下获得最佳（或最优）期望结果的实体。

智能体的“理性”并非指无所不知或完美，而是在其知识范围内做出最优的期望选择。

智能体的构成与环境：

智能体的设计在很大程度上取决于其所处环境的类型。因此，理解环境的属性至关重要。根据不同的分类依据, 智能体所处的环境可以有如下几种:

可观察性 (Observability)：
- 在完全可观察 (fully observable) 的环境中，智能体完全了解其状态。
- 在部分可观察 (partially observable) 的环境中，智能体无法获得关于状态的全部信息，因此必须维护一个对世界状态的内部估计。
确定性 (Determinism)：
- 在确定性 (deterministic) 环境中，在特定状态下执行一个行动只有一个确定的结果。
- 在随机性 (stochastic) 环境中，转移模型存在不确定性，即一个行动可能有多个不同概率的结果。
智能体数量 (Number of Agents)：
- 在多智能体 (multi-agent) 环境中，一个智能体需要与其他智能体共同行动。为了避免行为被其他智能体预测，它可能需要将其行动随机化 (randomize) 。
动态性 (Dynamism)：
- 如果环境在智能体行动时不会发生变化，则称之为静态 (static) 环境。
- 动态 (dynamic) 环境则会随着智能体的交互而改变。
物理规则 (Physics)：
- 如果环境具有已知的物理规则 (known physics)，智能体就了解其转移模型（即使是随机的），并可以在规划时利用这些知识。
- 如果物理规则是未知的 (unknown)，智能体则需要通过有目的的行动来学习这些动态规律。