生活随笔
收集整理的這篇文章主要介紹了
15.1 基本概念
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
15.1 基本概念
- 機(jī)器學(xué)習(xí)中的規(guī)則(rule)通常是指語義明確,能描述數(shù)據(jù)分布所隱含的客觀規(guī)律或者是領(lǐng)域概念,可寫作“若……則……”形式的邏輯規(guī)則?!耙?guī)則學(xué)習(xí)”(rule learning)是從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)出一組能用于對未見實例進(jìn)行判別的規(guī)則。
- 形式化的看,一條規(guī)則形如:
- 結(jié)果 👈 f1 ∩ f2 ∩ f3 ∩ f4
- 其中邏輯蘊(yùn)含符號 👈右邊部分稱作 規(guī)則體,表示該條規(guī)則的前提,左邊部分稱為“規(guī)則頭”,表示該條規(guī)則的結(jié)果。規(guī)則體是由邏輯文字 fk 組成的合取式,其中合取符號 ∩ 用來表示“并且”。每個文字 fk都是對示例屬性進(jìn)行檢驗的布爾表達(dá)式,例如色澤 = 烏黑或者是非(根蒂=硬挺)。L是規(guī)則體中文字的個數(shù),稱為規(guī)則的長度。規(guī)則頭中的結(jié)果同樣也是邏輯文字,一般用來表示所判別的目標(biāo)類別或者是概念。例如”好瓜“,這樣的邏輯規(guī)則也被稱作為if-then規(guī)則
- 與神經(jīng)網(wǎng)絡(luò),支持向量機(jī)這樣的黑箱模型相比,規(guī)則學(xué)習(xí)具有更好的了解釋性,能夠使得用戶直觀的對判別過程有所了解,另一方面,數(shù)理邏輯具有極強(qiáng)的表達(dá)能力,絕大多數(shù)人類知識都能通過數(shù)理邏輯進(jìn)行簡潔的刻畫和表達(dá),例如”父親的父親是爺爺“,這樣的知識不容易用函數(shù)表達(dá)式進(jìn)行表述,而用一階邏輯則可以方便的寫為YY (X,Y)👈 父親(X,Z) ∩ 父親(Z,Y)。因此,規(guī)則學(xué)習(xí)能更自然的在學(xué)習(xí)過程中引入領(lǐng)域知識。此外,邏輯規(guī)則的抽象描述能力在處理一些高度復(fù)雜的AI任務(wù)時具有明顯的優(yōu)勢,例如在自然問答系統(tǒng)中可能會遇到非常多,甚至無窮多的可能答案,此時如果能夠基于邏輯規(guī)則進(jìn)行抽象表述或者是推理,則將帶來極大的便利。
- 假設(shè)我們從西瓜集學(xué)得規(guī)則集合R:
- 規(guī)則一:好瓜 👈 (根蒂 = 蜷縮) ∩ (臍部 = 凹陷)
- 規(guī)則二:不是好瓜 👈 (紋理 = 模糊)
- 規(guī)則1的長度為2,它通過判斷兩個邏輯文字的賦值來對實例進(jìn)行判別。復(fù)合該規(guī)則的樣本被稱為該規(guī)則的覆蓋(cover)。需要注意的是:被規(guī)則一覆蓋的樣本是好瓜,但是沒有被規(guī)則一覆蓋的瓜未必不是好瓜。只有被規(guī)則二這樣以 非好瓜為頭的規(guī)則覆蓋才不是好瓜。
- 顯然,規(guī)則集合中的每條規(guī)則都可以看作一個子模型,規(guī)則集合是這些子模型的一個集成。當(dāng)同一個實例被判別結(jié)果不同的多條規(guī)則覆蓋時,稱發(fā)生了沖突,解決沖突的辦法稱為沖突消除。常用的沖突消除的策略有投票法,排序法,元規(guī)則法。投票法是將判別相同的規(guī)則數(shù)最多的結(jié)果作為最終的結(jié)果。排序法是在規(guī)則的幾何上定義一個順序,在發(fā)生沖突的時候使用排序最前的規(guī)則,相應(yīng)的規(guī)則學(xué)習(xí)過程稱為帶序規(guī)則學(xué)習(xí)或者是優(yōu)先級規(guī)則學(xué)習(xí)。元規(guī)則法是根據(jù)領(lǐng)域知識事先設(shè)定了一些元規(guī)則,即關(guān)于規(guī)則的規(guī)則。例如,發(fā)生沖突時使用最小的規(guī)則,然后根據(jù)元規(guī)則的指導(dǎo)來使用規(guī)則集
- 此外,從訓(xùn)練集學(xué)到的規(guī)則集合也許不能覆蓋所有可能的未見實例,例如前述規(guī)則集合R 無法對根蒂 = 蜷縮,臍部 = 稍凹 ∩ 紋理 = 清晰的實例進(jìn)行判別。這樣的情況在屬性數(shù)目很多的時候常出現(xiàn)。因此,規(guī)則學(xué)習(xí)算法通常設(shè)置一條默認(rèn)規(guī)則,由他來處理規(guī)則集合未被覆蓋的樣本。例如為 R 增加一條默認(rèn)的規(guī)則:未被1,2覆蓋的都不是好瓜
- 從形式語言表達(dá)能力而言,規(guī)則可以分為兩類:命題規(guī)則和一階規(guī)則。前者是原子命題和邏輯連接詞與,或,非,和蘊(yùn)含構(gòu)成的簡單陳述句。例如:規(guī)則集R 就是一個命題規(guī)則集,根蒂 = 蜷縮,臍部 = 稍凹 都是原子命題。
- 后者的基本成分是能夠描述事物的屬性和關(guān)系的,原子公式,例如表示父子關(guān)系的謂詞,父親(X,Y)就是原子公式,再如表示加一操作。
- 顯然,一階規(guī)則能夠表達(dá)復(fù)雜的關(guān)系,因此也被稱為關(guān)系型規(guī)則。以西瓜數(shù)據(jù)為例,若我們簡單的把屬性當(dāng)作謂詞來定義實例和屬性值之間的關(guān)系,則命題規(guī)則集R可以改寫為一階規(guī)則集R’
- 規(guī)則一:好瓜(X) 👈 根蒂(X,蜷縮) ∩ 臍部(X,凹陷)
- 規(guī)則二: 非好瓜(X) 👈 紋理(X,模糊)
- 從形式語言系統(tǒng)的角度來看,命題規(guī)則是一階規(guī)則的特例,因此一階規(guī)則的學(xué)習(xí)比命題規(guī)則要復(fù)雜的多。
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖
總結(jié)
以上是生活随笔為你收集整理的15.1 基本概念的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。