【深度学习】训练集、测试集和验证集
碼字不易,如果各位看官感覺該文章對你有所幫助,麻煩點個關注,如果有任何問題,請留言交流。如需轉載,請注明出處,謝謝。
文章鏈接:https://blog.csdn.net/herocheney/article/details/118300553
目錄
一、深度學習的數據
二、訓練集、測試集和驗證集
三、訓練集、測試集和驗證集的比例
一、深度學習的數據
? ? ? ? 在深度學習或機器學習的過程中,數據無疑是驅動模型的主要能量,通過訓練現有數據,得到相應的網絡參數,使得我們所設計的模型具有泛化性,能夠預測一些未知的,沒有出現的樣本,并將該參數應用到實際當中,是模型訓練的主要流程,數據的干凈程度,完備程度等,是網絡學習好壞的重中之重。
二、訓練集、測試集和驗證集
? ? ? ? 我們通常把訓練的數據分為三個文件夾:訓練集、測試集和驗證集。
下面這個比喻非常恰當:模型的訓練與學習,類似于老師教學生學知識的過程。
1、訓練集(train set):用于訓練模型以及確定參數。相當于老師教學生知識的過程。
2、驗證集(validation set):用于確定網絡結構以及調整模型的超參數。相當于月考等小測驗,用于學生對學習的查漏補缺。
3、測試集(test set):用于檢驗模型的泛化能力。相當于大考,上戰場一樣,真正的去檢驗學生的學習效果。
參數(parameters)是指由模型通過學習得到的變量,如權重和偏置。
超參數(hyperparameters)是指根據經驗進行設定的參數,如迭代次數,隱層的層數,每層神經元的個數,學習率等。
三、訓練集、測試集和驗證集的比例
根據吳恩達的視頻所述,如果當數據量不是很大的時候(萬級別以下)的時候將訓練集、驗證集以及測試集劃分為6:2:2;若是數據很大,可以將訓練集、驗證集、測試集比例調整為98:1:1。
總結
以上是生活随笔為你收集整理的【深度学习】训练集、测试集和验证集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Antd】rawData.some i
- 下一篇: python怎么解微分方程组_pytho