统计学习综述
統(tǒng)計學(xué)習(xí)綜述
概念
? 統(tǒng)計學(xué)習(xí)是關(guān)于計算機(jī)基于數(shù)據(jù)構(gòu)建概率統(tǒng)計模型并運用模型對數(shù)據(jù)進(jìn)行預(yù)測和分析的一門學(xué)科。也稱統(tǒng)計機(jī)器學(xué)習(xí)。
特點
* 以計算機(jī)及網(wǎng)絡(luò)為平臺,建立在計算機(jī)及網(wǎng)絡(luò)上的。 * 以數(shù)據(jù)為研究對象,是數(shù)據(jù)驅(qū)動的學(xué)科 * 目的是對數(shù)據(jù)進(jìn)行預(yù)測與分析 * 以方法為中心,構(gòu)建模型并應(yīng)用模型進(jìn)行預(yù)測和分析 * 是概率論、統(tǒng)計學(xué)、信息論、計算機(jī)理論、最優(yōu)化理論及計算機(jī)科學(xué)等多個領(lǐng)域的交叉學(xué)科統(tǒng)計學(xué)習(xí)的對象–數(shù)據(jù)
* 基本假設(shè):同類數(shù)據(jù)具有一定的統(tǒng)計規(guī)律性,這是統(tǒng)計學(xué)習(xí)的前提。 * 以變量會變量組表示數(shù)據(jù) * 分類:分為由連續(xù)變量和離散變量表示的類型目的
- 簡要的說,對數(shù)據(jù)(特別是未知新數(shù)據(jù))的預(yù)測與分析
- 是通過構(gòu)建概率統(tǒng)計模型實現(xiàn)的
- 總目標(biāo):考慮學(xué)習(xí)什么樣的模型和如何學(xué)習(xí)模型,以使模型能對數(shù)據(jù)進(jìn)行準(zhǔn)確的預(yù)測和分析,同時也要考慮盡可能地提高學(xué)習(xí)效率。
方法
- 基于數(shù)據(jù)構(gòu)建概率統(tǒng)計模型從而對數(shù)據(jù)進(jìn)行預(yù)測和分析
- 統(tǒng)計學(xué)習(xí)分類
- 監(jiān)督學(xué)習(xí),用于分類、標(biāo)注與回歸問題
- 無監(jiān)督學(xué)習(xí)
- 強(qiáng)化學(xué)習(xí)
- 統(tǒng)計學(xué)習(xí)三要素
- 模型
- 策略
- 算法
- 步驟:
- 得到一個有限的訓(xùn)練數(shù)據(jù)集合
- 確定包含所有可能的模型的假設(shè)空間,即學(xué)習(xí)模型的集合
- 確定模型選擇的準(zhǔn)則,即學(xué)習(xí)策略
- 實現(xiàn)求解最優(yōu)模型的算法,即學(xué)習(xí)的算法
- 通過學(xué)習(xí)方法選擇最優(yōu)模型
- 利用學(xué)習(xí)的最優(yōu)模型對新數(shù)據(jù)進(jìn)行預(yù)測或分析
重要性
總結(jié)
- 上一篇: 统计学习的分类
- 下一篇: 统计学习方法的三要素