机器学习专业术语
1.什么是泛化能力?
?在機器學習方法中,泛化能力通俗來講就是指學習到的模型對未知數據的預測能力。在實際情況中,我們通常通過測試誤差來評價學習方法的泛化能力。
?泛化能力(generalization ability)是指一個機器學習算法對于沒有見過的樣本的識別能力。我們也叫做舉一反三的能力,或者叫做學以致用的能力。
舉個例子,通過學習,小學生就可以熟練的掌握加減法,那么他們是怎么做到的呢?第一步學生們先感性的知道了在有一個蘋果的基礎上再拿來一個蘋果的話就是一種加法,第二步知道個數可以用阿拉伯數字抽象的表示,到了0到9這十個數字和他們的抽象含義,第三步學習十以內的加減法,第四步推廣到了多位數的加減法。
我們訓練一個機器學習算法也是如此,通過感性的告訴機器一個加上一個等于兩個,之后算法通過自己的學習,推廣計算多位數的加減法,多位數的加減法是無窮多個的,如果機器在不斷的測試中都能夠算對,那么我們認為機器已經總結出了加法的內部規律并且能夠學以致用,如果說機器只會計算你給機器看過的比如3+3=6,而不會計算沒有教過的8+9=17,那么我們認為機器只是死記硬背,并沒有學以致用的能力,也就是說泛化能力非常的低,同時我們也把這種現象叫做這個算法過擬合(over-fitting)了。(過擬合是一種分類器會發生的現象,而泛化能力可以理解為對分類器的一種性能的評價)
2. 什么是過擬合
過擬合通常可以理解為,模型的復雜度要高于實際的問題,所以就會導致模型死記硬背的記住,而沒有理解背后的規律。就比如說人腦要比唐詩復雜得多,即使不理解內容,我們也能背下來,但是理解了內容和寫法對于我們理解記憶其他唐詩有好處,如果死記硬背那么就僅僅記住了而已。
3. 什么是欠擬合
欠擬合(under-fitting)是和過擬合相對的現象,可以說是模型的復雜度較低,沒法很好的學習到數據背后的規律。就好像開普勒在總結天體運行規律之前,他的老師第谷記錄了很多的運行數據,但是都沒法用數據去解釋天體運行的規律并預測,這就是在天體運行數據上,人們一直處于欠擬合的狀態,只知道記錄過的過去是這樣運行的,但是不知道道理是什么。
4. 什么是不收斂
不收斂一般是形容一些基于梯度下降算法的模型,收斂是指這個算法有能力找到局部的或者全局的最小值,(比如找到使得預測的標簽和真實的標簽最相近的值,也就是二者距離的最小值),從而得到一個問題的最優解。如果說一個機器學習算法的效果和瞎蒙的差不多那么基本就可以說這個算法沒有收斂,也就是根本沒有去學習。
5. 什么是魯棒性
魯棒性亦稱健壯性、穩健性、強健性,是系統的健壯性,它是在異常和危險情況下系統生存的關鍵,是指系統在一定(結構、大小)的參數攝動下,維持某些性能的特性。例如,計算機軟件在輸入錯誤、磁盤故障、網絡過載或有意攻擊情況下,能否不死機、不崩潰,就是該軟件的魯棒性。響應快速性所謂的響應快速性就是處于穩定狀態的系統對于外部環境改變的快速反應能力,也是系統在受到擾動后迅速進入穩態的能力。對于生物模塊來講,任何輸入信號,無論是信號分子、蛋白質,還是代射物,都會降解、排出或者轉化成其他物質。生物模塊必須要在這些輸入信號消失之前做出響應,才能確保自身功能的發揮。 --------------------- 本文來自 樂觀的Madge 的CSDN 博客 ,全文地址請點擊:https://blog.csdn.net/lmj1436140682/article/details/51984734?utm_source=copy
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
- 上一篇: faster-rcnn中添加Mask中的
- 下一篇: data augmentation 数据