周志华《机器学习》课后习题解析(第一章)绪论
周志華老師的《機(jī)器學(xué)習(xí)》(西瓜書(shū))一書(shū),沒(méi)有公布答案,于是我們從網(wǎng)上搜集了各題目的答案,供大家參考。
參考答案 第一章 緒論
1.1.表1.1中若只包含編號(hào)為1,4的兩個(gè)樣例,試給出相應(yīng)的版本空間。
表1.1 西瓜數(shù)據(jù)集(精簡(jiǎn))
| 1 | 青綠 | 蜷縮 | 濁響 | 是 |
| 2 | 烏黑 | 稍蜷 | 沉悶 | 否 |
本題解答:CSDN博主「四去六進(jìn)一」
原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224
答:
假設(shè)空間指的是問(wèn)題所有假設(shè)組成的空間,我們可以把學(xué)習(xí)過(guò)程看作是在假設(shè)空間中搜索的過(guò)程,搜索目標(biāo)是尋找與訓(xùn)練集“匹配”的假設(shè)。
假設(shè)數(shù)據(jù)集有種屬性,第個(gè)屬性可能的取值有種,加上該屬性的泛化取值,所以可能的假設(shè)有。再用空集表示沒(méi)有正例,假設(shè)空間中一共種假設(shè)。現(xiàn)實(shí)問(wèn)題中常面臨很大的假設(shè)空間,我們可以尋找一個(gè)與訓(xùn)練集一致的假設(shè)集合,稱(chēng)之為版本空間。版本空間從假設(shè)空間剔除了與正例不一致和與反例一致的假設(shè),它可以看成是對(duì)正例的最大泛化。版本空間的可以通過(guò)搜索假設(shè)空間來(lái)得到,這樣需要遍歷完整的假設(shè)空間。如果數(shù)據(jù)集中有正例,則可以先對(duì)一個(gè)正例進(jìn)行最大泛化,得到個(gè)假設(shè),然后再對(duì)這些假設(shè)進(jìn)行剔除操作,可以適當(dāng)精簡(jiǎn)計(jì)算量。數(shù)據(jù)集有3個(gè)屬性,每個(gè)屬性2種取值,一共 種假設(shè),分別為
1.色澤=青綠 根蒂=蜷縮 敲聲=濁響
2.色澤=青綠 根蒂=蜷縮 敲聲=沉悶
3.色澤=青綠 根蒂=稍蜷 敲聲=濁響
4.色澤=青綠 根蒂=稍蜷 敲聲=沉悶
5.色澤=烏黑 根蒂=蜷縮 敲聲=濁響
6.色澤=烏黑 根蒂=蜷縮 敲聲=沉悶
7.色澤=烏黑 根蒂=稍蜷 敲聲=濁響
8.色澤=烏黑 根蒂=稍蜷 敲聲=沉悶
9.色澤=青綠 根蒂=蜷縮 敲聲=*
10.色澤=青綠 根蒂=稍蜷 敲聲=*
11.色澤=烏黑 根蒂=蜷縮 敲聲=*
12.色澤=烏黑 根蒂=稍蜷 敲聲=*
13.色澤=青綠 根蒂=* 敲聲=濁響
14.色澤=青綠 根蒂=* 敲聲=沉悶
15.色澤=烏黑 根蒂=* 敲聲=濁響
16.色澤=烏黑 根蒂=* 敲聲=沉悶
17.色澤=* 根蒂=蜷縮 敲聲=濁響
18.色澤=* 根蒂=蜷縮 敲聲=沉悶
19.色澤=* 根蒂=稍蜷 敲聲=濁響
20.色澤=* 根蒂=稍蜷 敲聲=沉悶
21.色澤=青綠 根蒂=* 敲聲=*
22.色澤=烏黑 根蒂=* 敲聲=*
23.色澤=* 根蒂=蜷縮 敲聲=*
24.色澤=* 根蒂=稍蜷 敲聲=*
25.色澤=* 根蒂=* 敲聲=濁響
26.色澤=* 根蒂=* 敲聲=沉悶
27.色澤=* 根蒂=* 敲聲=*
28.空集?
編號(hào)1的數(shù)據(jù)可以刪除(不包含數(shù)據(jù))
編號(hào)1的數(shù)據(jù)可以刪除 (包含了數(shù)據(jù))
所以版本空間為:1.色澤=青綠 根蒂=蜷縮 敲聲=濁響
9.色澤=青綠 根蒂=蜷縮 敲聲=*
13.色澤=青綠 根蒂=* 敲聲=濁響
17.色澤=* 根蒂=蜷縮 敲聲=濁響
21.色澤=青綠 根蒂=* 敲聲=*
23.色澤=* 根蒂=蜷縮 敲聲=*
25.色澤=* 根蒂=* 敲聲=濁響
一般情況下版本空間是正例的泛化,但由于數(shù)據(jù)集中只有1個(gè)正例,所以在版本空間中依然包含了這個(gè)樣本的假設(shè)(假設(shè)1)。
1.2.與使用單個(gè)合取式來(lái)進(jìn)行假設(shè)表示相比,使用“析合范式”將使得假設(shè)空間具有更強(qiáng)的表示能力。例如:
會(huì)把“(色澤=青綠)^(根蒂=蜷縮)^(敲聲=清脆”以及“(色澤=烏黑)^(根蒂=硬挺)^(敲聲=沉悶)”都分類(lèi)為“好瓜”,若使用最多包含k個(gè)合取式的析合范式來(lái)表達(dá)1.1的西瓜分類(lèi)問(wèn)題的假設(shè)空間,試估算有多少種可能的假設(shè)。
本題解答:CSDN博主「weixin_41587767」
原文鏈接:https://blog.csdn.net/weixin_41587767/java/article/details/86290695
答:
表1.1包含4個(gè)樣例,3種屬性,假設(shè)空間中有3?4?4+1=493?4?4+1=49種假設(shè)。最多包含k個(gè)合取式來(lái)表達(dá)假設(shè)空間,顯然k的最大值是49。
不考慮空集的話(huà),剩下48種可能:
全部不泛化 2?3?3=182?3?3=18種假設(shè)
一個(gè)屬性泛化:2?3+3?3+2?3=212?3+3?3+2?3=21種假設(shè)
兩個(gè)屬性泛化:2+3+3=82+3+3=8種假設(shè)
三屬性泛化:1種假設(shè)
用這48種假設(shè)的排列組合來(lái)組成析合范式,展開(kāi)序列為(也就是楊輝三角的一排):
1, 48, 1128, 17296,...... 17296, 1128, 48, 1 共49個(gè)數(shù), 左邊的1代表‘空’,一個(gè)都不選,右邊的1代表全部選。
如果k=48,就是說(shuō)最多采用48種合取式來(lái)組成析合范式,排除一種都不選的情況,就是2^48 - 1種。(2^48是根據(jù)二項(xiàng)式定理得的)
如果0<k<48,那就把展開(kāi)序列的前k+1(因?yàn)檎归_(kāi)序列從0開(kāi)始數(shù))項(xiàng)全部加起來(lái)再減1
如果指定了k的個(gè)數(shù),那就是展開(kāi)序列的第k+1(因?yàn)檎归_(kāi)序列從0開(kāi)始數(shù))項(xiàng)的數(shù)
但是,這個(gè)結(jié)果得去重才行,因?yàn)榉夯菍?duì)若干種假設(shè)的包含(包容),它本身不是某種假設(shè)。把泛化的 * 展開(kāi)后,
就是若干種具體的假設(shè)。如果此題采取48,那么把 * 展開(kāi)后,假設(shè)集合中一定有重復(fù),而且一種具體假設(shè)還不止重復(fù)一次。
此題應(yīng)該采用18種具體假設(shè)來(lái)計(jì)算, 就是:2^18 - 1
以下python代碼沒(méi)有考慮全部為空的情況(-1),且沒(méi)有考慮去重。
#?-*-?coding:?utf-8?-*-def?strige(max):#楊輝三角S?=?[1]while?max:?N?=?S[:]N.append(0)S?=?[N[i-1]+N[i]?for?i?in?range(len(N))]max?-=?1return?S?def?cal_Permutations(total_num?=0,select_num=?0,most_num?=?0):re_total_num?=?0re_select_num?=?0re_most_num?=?0if?total_num?==?0:raise?ValueError,'pls?indicate?total?numbers'returnif?select_num>total_num?or?most_num>total_num:raise?ValueError,'select_num?or?most_num?can?not?bigger?than?total_num'returns?=?strige(total_num)for?x?in?s:re_total_num?+=?xre_select_num?=?s[select_num]for?y?in?range(0,most_num+1):re_most_num?+=?s[y]return?{'input_parameter':{'total_num':total_num,'most_num':most_num,'select_num':select_num},'output_permutations':s,'output_usual_count':{'total_num':re_total_num,'most_num':re_most_num,'select_num':re_select_num}}result?=?cal_Permutations(48,40,48) print?(result)1.3.若數(shù)據(jù)包含噪聲,則假設(shè)空間中可能不存在與所有訓(xùn)練樣本都一致的假設(shè)。在此情形下,試設(shè)計(jì)一種歸納偏好用于假設(shè)選擇。
本題解答:CSDN博主「四去六進(jìn)一」
原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224
答:
通常認(rèn)為兩個(gè)數(shù)據(jù)的屬性越相近,則更傾向于將他們分為同一類(lèi)。若相同屬性出現(xiàn)了兩種不同的分類(lèi),則認(rèn)為它屬于與他最臨近幾個(gè)數(shù)據(jù)的屬性。也可以考慮同時(shí)去掉所有具有相同屬性而不同分類(lèi)的數(shù)據(jù),留下的數(shù)據(jù)就是沒(méi)誤差的數(shù)據(jù),但是可能會(huì)丟失部分信息。
4.本章1.4節(jié)在論述“沒(méi)有免費(fèi)的午餐”定理時(shí),默認(rèn)使用了“分類(lèi)錯(cuò)誤率”作為性能度量來(lái)對(duì)分類(lèi)器進(jìn)行評(píng)估。若換用其他性能度量,則式(1.1)將改為:
,
試證明沒(méi)有免費(fèi)的午餐”定理仍成立。
本題解答:CSDN博主「四去六進(jìn)一」
原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224
答:
還是考慮二分類(lèi)問(wèn)題,NFL首先要保證真是目標(biāo)函數(shù)均勻分布,對(duì)于有個(gè)樣本的二分類(lèi)問(wèn)題,顯然f共有 種情況。其中一半是與假設(shè)一致的,也就 。
此時(shí), ,應(yīng)該是個(gè)常數(shù),隱含的條件就該是(一個(gè)比較合理的充分條件) 。如果不滿(mǎn)足, NFL 應(yīng)該就不成立了(或者不那么容易證明)。
5.試述機(jī)器學(xué)習(xí)在互聯(lián)網(wǎng)搜索的哪些環(huán)節(jié)起什么作用。
本題解答:CSDN博主「四去六進(jìn)一」
原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224
答:
1.最常見(jiàn)的,消息推送,比如某東經(jīng)常說(shuō)某些商品我可能會(huì)感興趣,然而并沒(méi)有。
2.網(wǎng)站相關(guān)度排行,通過(guò)點(diǎn)擊量,網(wǎng)頁(yè)內(nèi)容進(jìn)行綜合分析。
3.圖片搜索,現(xiàn)在大部分還是通過(guò)標(biāo)簽來(lái)搜索,不過(guò)基于像素的搜索也總會(huì)有的吧。
往期精彩回顧適合初學(xué)者入門(mén)人工智能的路線(xiàn)及資料下載機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機(jī)器學(xué)習(xí)在線(xiàn)手冊(cè)深度學(xué)習(xí)筆記專(zhuān)輯AI基礎(chǔ)下載(pdf更新到25集)機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專(zhuān)輯獲取一折本站知識(shí)星球優(yōu)惠券,復(fù)制鏈接直接打開(kāi):https://t.zsxq.com/yFQV7am本站qq群1003271085,加入微信群請(qǐng)掃碼喜歡文章,點(diǎn)個(gè)在看總結(jié)
以上是生活随笔為你收集整理的周志华《机器学习》课后习题解析(第一章)绪论的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 周志华《机器学习》课后习题(第五章):神
- 下一篇: 周志华《机器学习》课后习题解析(第二章)