1.11 超过人的表现-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授
| 1.10 理解人的表現 | 回到目錄 | 1.12 改善你的模型的表現 |
超過人的表現 (Surpassing Human-level Performance)
很多團隊會因為機器在特定的識別分類任務中超越了人類水平而激動不已,我們談談這些情況,看看你們自己能不能達到。
我們討論過機器學習進展,會在接近或者超越人類水平的時候變得越來越慢。我們舉例談談為什么會這樣。
假設你有一個問題,一組人類專家充分討論辯論之后,達到0.5%的錯誤率,單個人類專家錯誤率是1%,然后你訓練出來的算法有0.6%的訓練錯誤率,0.8%的開發錯誤率。所以在這種情況下,可避免偏差是多少?這個比較容易回答,0.5%是你對貝葉斯錯誤率的估計,所以可避免偏差就是0.1%。你不會用這個1%的數字作為參考,你用的是這個差值,所以也許你對可避免偏差的估計是至少0.1%,然后方差是0.2%。和減少可避免偏差比較起來,減少方差可能空間更大。
但現在我們來看一個比較難的例子,一個人類專家團和單個人類專家的表現和以前一樣,但你的算法可以得到0.3%訓練錯誤率,還有0.4%開發錯誤率。現在,可避免偏差是什么呢?現在其實很難回答,事實上你的訓練錯誤率是0.3%,這是否意味著你過擬合了0.2%,或者說貝葉斯錯誤率其實是0.1%呢?或者也許貝葉斯錯誤率是0.2%?或者貝葉斯錯誤率是0.3%呢?你真的不知道。但是基于本例中給出的信息,你實際上沒有足夠的信息來判斷優化你的算法時應該專注減少偏差還是減少方差,這樣你取得進展的效率就會降低。還有比如說,如果你的錯誤率已經比一群充分討論辯論后的人類專家更低,那么依靠人類直覺去判斷你的算法還能往什么方向優化就很難了。所以在這個例子中,一旦你超過這個0.5%的門檻,要進一步優化你的機器學習問題就沒有明確的選項和前進的方向了。這并不意味著你不能取得進展,你仍然可以取得重大進展。但現有的一些工具幫助你指明方向的工具就沒那么好用了。
現在,機器學習有很多問題已經可以大大超越人類水平了。例如,我想網絡廣告,估計某個用戶點擊廣告的可能性,可能學習算法做到的水平已經超越任何人類了。還有提出產品建議,向你推薦電影或書籍之類的任務。我想今天的網站做到的水平已經超越你最親近的朋友了。還有物流預測,從 AAA 到 BBB 開車需要多久,或者預測快遞車從 AAA 開到 BBB 需要多少時間。或者預測某人會不會償還貸款,這樣你就能判斷是否批準這人的貸款。我想這些問題都是今天的機器學習遠遠超過了單個人類的表現。
請注意這四個例子,所有這四個例子都是從結構化數據中學習得來的,這里你可能有個數據庫記錄用戶點擊的歷史,你的購物歷史數據庫,或者從A到B需要多長時間的數據庫,以前的貸款申請及結果的數據庫,這些并不是自然感知問題,這些不是計算機視覺問題,或語音識別,或自然語言處理任務。人類在自然感知任務中往往表現非常好,所以有可能對計算機來說在自然感知任務的表現要超越人類要更難一些。
最后,這些問題中,機器學習團隊都可以訪問大量數據,所以比如說,那四個應用中,最好的系統看到的數據量可能比任何人類能看到的都多,所以這樣就相對容易得到超越人類水平的系統。現在計算機可以檢索那么多數據,它可以比人類更敏銳地識別出數據中的統計規律。
除了這些問題,今天已經有語音識別系統超越人類水平了,還有一些計算機視覺任務,一些圖像識別任務,計算機已經超越了人類水平。但是由于人類對這種自然感知任務非常擅長,我想計算機達到那種水平要難得多。還有一些醫療方面的任務,比如閱讀ECG或診斷皮膚癌,或者某些特定領域的放射科讀圖任務,這些任務計算機做得非常好了,也許超越了單個人類的水平。
在深度學習的最新進展中,其中一個振奮人心的方面是,即使在自然感知任務中,在某些情況下,計算機已經可以超越人類的水平了。不過現在肯定更加困難,因為人類一般很擅長這種自然感知任務。
所以要達到超越人類的表現往往不容易,但如果有足夠多的數據,已經有很多深度學習系統,在單一監督學習問題上已經超越了人類的水平,所以這對你在開發的應用是有意義的。我希望有一天你也能夠搭建出超越人類水平的深度學習系統。
課程板書
| 1.10 理解人的表現 | 回到目錄 | 1.12 改善你的模型的表現 |
總結
以上是生活随笔為你收集整理的1.11 超过人的表现-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1.10 理解人的表现-深度学习第三课《
- 下一篇: 1.12 改善你的模型表现-深度学习第三