《人工智能:一种现代的方法》总结 第二章
第二章 智能Agent
這一章主要討論了Agent的各個方面,給讀者一個初步的了解。
Agent是什么?Agent,在我看來,是一個在環境中,可以感知周圍環境,并根據環境而進行動作的一個object。當然,我們需要的是一個理性的Agent。而理性的Agent做出的動作,應該是讓它的性能度量最大化的動作,也就是說,該動作是一個正向性的動作。
當然,不同的價值觀對于正向的標準是不同的,所以一個智能Agent需要根據所了解的知識來做出相應的行為。但是它又不能僅僅是根據其設計人員的價值觀來判斷事物,這樣的話它就缺乏了自主性。我們需要的理性Agent應該能通過自身的學習來彌補之前的所了解的不足和缺陷。就如同剛出生的嬰兒一般,理性Agent剛開始的時候可能會存在諸多隨機的行為來處理事務,但是根據經驗的積累,就逐漸形成了一套此Agent認為的價值觀。
由于智能Agent依賴與環境,所以我們需要知道環境的性質。PEAS(性能,環境,執行器,傳感器)是我們設計Agent的時候需要首先詳細說明清楚的任務環境。它存在著很多維度:觀察性,傳感器是否可以完全記錄Agent周圍環境的狀態;Agent數量,需要多少Agent
來完成特定的任務;隨機性,環境中下一個狀態是否完全取決于Agent
根據當前環境執行的動作;延續性,Agent的下一個片段是否依賴于之前片段中采取的行動;動態性,環境是否會變化;連續性,變化是否連續;未知性,Agent知識庫中是否知道次問題的解決辦法。
Agent其自身也存在著結構。Agent是一個體系結構和程序的組合,程序一定要適應體系結構。本書繼續介紹了四種基本的Agent程序:簡單反射Agent,它僅僅根據當前的環境感知來選擇動作,它雖然很簡潔,它的智能卻是很有限的,并且很多情況現會陷入無限循環當中,隨機化是解決這個問題的一個很好的辦法;基于模型反射的Agent,根據感知歷史來維持內部狀態,并且根據已有的知識反應出當前狀態無法看到的信息,再來選擇動作;基于目標的Agent,根據當前狀態以及目標信息來確定動作,也就是說它和之前兩種不同的是,它考慮了動作的結果,當然,因此它的效率就會相對低,但是它可以使過程變得相對更靈活;基于效用的Agent,它在之前三種的基礎上增加了對于行動結果的效益判斷,它可以使期望效用最大化,但是對于這點需要深一步的研究。
學習Agent,由評判元件、學習元件、性能元件、問題產生器構成。學習元件通過評判元件的反饋來讓Agent知道如何能做的更好,并確定如何修改負責動作的性能元件,問題產生器就是提供實驗行動的元件。
總結
以上是生活随笔為你收集整理的《人工智能:一种现代的方法》总结 第二章的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WinRAR v5.40 官网无广告弹窗
- 下一篇: 视频和音频的测试点