Intro to AI, Rational Agents
第一章笔记是该课程的开篇介绍, 核心是定义什么是智能体 (Agent) 以及智能体所处的环境 (Environment)
智能体 (Agents)
AI的中心问题是创建一个理性的智能体 (rational agent) 。理性智能体是一个拥有目标或偏好,并试图执行一系列行动以期在这些目标下获得最佳(或最优)期望结果的实体 。
智能体的“理性”并非指无所不知或完美,而是在其知识范围内做出最优的期望选择。
智能体的构成与环境:
智能体存在于一个环境 (environment) 中,该环境是针对特定智能体实例的 。
智能体通过传感器 (sensors) 与环境交互,并通过执行器 (actuators) 对环境施加影响 。
智能体与其所处的环境共同构成一个世界 (world) 。例如,一个跳棋程序的“世界”就是虚拟棋盘和对手 。

环境类型 (Types of Environments)
智能体的设计在很大程度上取决于其所处环境的类型 。因此,理解环境的属性至关重要。根据不同的分类依据, 智能体所处的环境可以有如下几种:
可观察性 (Observability):
在完全可观察 (fully observable) 的环境中,智能体完全了解其状态 。
在部分可观察 (partially observable) 的环境中,智能体无法获得关于状态的全部信息,因此必须维护一个对世界状态的内部估计 。
确定性 (Determinism):
在确定性 (deterministic) 环境中,在特定状态下执行一个行动只有一个确定的结果 。
在随机性 (stochastic) 环境中,转移模型存在不确定性,即一个行动可能有多个不同概率的结果 。
智能体数量 (Number of Agents):
- 在多智能体 (multi-agent) 环境中,一个智能体需要与其他智能体共同行动 。为了避免行为被其他智能体预测,它可能需要将其行动随机化 (randomize) 。
动态性 (Dynamism):
如果环境在智能体行动时不会发生变化,则称之为静态 (static) 环境 。
动态 (dynamic) 环境则会随着智能体的交互而改变 。
物理规则 (Physics):
如果环境具有已知的物理规则 (known physics),智能体就了解其转移模型(即使是随机的),并可以在规划时利用这些知识 。
如果物理规则是未知的 (unknown),智能体则需要通过有目的的行动来学习这些动态规律 。