《人工智能:一种现代的方法》笔记(一)
本章的主要問題就是理解什么是Agent,如何根據特定問題構建出合適的Agent模型以及可以構建出什么樣的Agent的問題。
智能Agent
- 理性Agent
- 環境的性質
- Agent的結構
- 基于反射的Agent
- 基于模型的Agent
- 基于目標的Agent
- 基于效用的Agent
理性Agent
理性的判斷依賴于以下四個方面:
- 定義成功標準的性能度量(P)
- Agent 對環境的先驗知識(E)
- Agent可以完成的行動(A)
- Agent截止到此時的感知序列(S)
理性Agent的定義:對每一個可能的感知序列,根據已知的感知序列提供的證據和Agent具有的先驗知識,理性Agent應該選擇能使其性能度量最大化的行動。
環境的性質
考慮任務環境是理性Agent要“求解”的基本“問題”。
根據理性的定義,我們的任務環境也必須將上述的四個方面性能度量、環境·、Agent執行器、傳感器歸結在一起才能構建出合適的任務環境。(根據四方面的首字母定義該描述為PEAS描述)
簡單例子:自動駕駛出租車系統
更多示例:
Agent的結構
Agent程序,它實現的是把感知信息映射到行動的Agent 函數。
假設該程序要在某個具備物理傳感器和執行器的計算裝置上運行——我們稱為體系結構。
Agent =體系結構+程序
基于反射的Agent
這類Agent基于當前的感知和內置的規則集選擇行動,不關注感知歷史。雖然結構簡單,但只感知當前的信息,對于許多需要考慮歷史對當前影響的場景是不適用的。
基于模型的Agent
這類Agent不僅僅是有規則集,還有它需要知道Agent的行動會對環境造成什么影響,即知道世界如何運轉,在內部需要有一個世界模型(model)
基于目標的Agent
這類Agent除了知道自己當前的狀態,還可以用目標信息來描述想要達到的狀態,基于目標的Agent更加的明確,通過目標的指引,利用自己已知的模型和感知的信息不斷更新自己的狀態以達到目標。
此類決策與前面描述的條件-行動規則有根本的不同,原因是它考慮了未來——包括“如果我這樣做會發生什么?”和“這樣做會讓我高興嗎?”這樣的問題。基于目標用的做動作是是推理,而基于反射是基于規則進行行動的。
基于效用的Agent
這類Agent是對于基于目標Agent更加精細化的描述,如果說基于目標的Agent對于性能度量是二值的,那么基于效用的Agent對于目標的性能度量是從0到1的連續值。
總結
以上是生活随笔為你收集整理的《人工智能:一种现代的方法》笔记(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 人工智能 一种现代方法 第7章 逻辑Ag
- 下一篇: 基于ROS的机械臂手眼标定-常见错误排查