【数学基础】一份非常适合人工智能学习的概率论基础材料中文版 (国内教材精华)...
機器學習,需要一定的數學基礎,需要掌握的數學基礎知識特別多,如果從頭到尾開始學,估計大部分人來不及,我建議先學習最基礎的數學知識,基礎知識可以分為高等數學、線性代數、概率論與數理統計三部分,我整理了相關數學基礎資料:
源文件下載:
https://github.com/fengdu78/Data-Science-Notes/tree/master/0.math
內容簡介
一、斯坦福大學CS229數學基礎
這是斯坦福大學 CS 229 機器學習課程的基礎材料,是斯坦福各大人工智能課程的數學基礎,對人工智能課程做了優化,強烈推薦!!
我們對原始教程進行了翻譯,翻譯版本做成了在線閱讀版本。
(點擊查看:1.線性代數,2.概率論)
二、國內大學的數學基礎教材精華
這個是我考研考博時候整理的中文教材的資料,分為高等數學、線性代數、概率論與數理統計三部分,我把和機器學習相關的數學知識進行了整理,進行公布。
本文是概率論和數理統計部分,建議收藏慢慢看。
概率論和數理統計
隨機事件和概率
1.事件的關系與運算
(1) 子事件:,若發生,則發生。
(2) 相等事件:,即,且?。
(3) 和事件:(或),與中至少有一個發生。
(4) 差事件:,發生但不發生。
(5) 積事件:(或),與同時發生。
(6) 互斥事件(互不相容):=。
(7) 互逆事件(對立事件):?
2.運算律(1) 交換律:?(2) 結合律:?(3) 分配律:
3.德摩根律
?
4.完全事件組
兩兩互斥,且和事件為必然事件,即
5.概率的基本公式(1)條件概率:?,表示發生的條件下,發生的概率。
(2)全概率公式:?
(3) Bayes 公式:
?注:上述公式中事件的個數可為可列個。
(4)乘法公式:??
6.事件的獨立性
(1)與相互獨立
(2),,兩兩獨立?;?;;
(3),,相互獨立?;??;??;?
7.獨立重復試驗
將某試驗獨立重復次,若每次實驗中事件 A 發生的概率為,則次試驗中發生次的概率為:?
8.重要公式與結論?
?
?
(5)條件概率滿足概率的所有性質, 例如:.???
(6)若相互獨立,則?
(7)互斥、互逆與獨立性之間的關系:?與互逆?與互斥,但反之不成立,與互斥(或互逆)且均非零概率事件與不獨立.
(8)若相互獨立,則與也相互獨立,其中分別表示對相應事件做任意事件運算后所得的事件,另外,概率為 1(或 0)的事件與任何事件相互獨立.
隨機變量及其概率分布
1.隨機變量及概率分布
取值帶有隨機性的變量,嚴格地說是定義在樣本空間上,取值于實數的函數稱為隨機變量,概率分布通常指分布函數或分布律
2.分布函數的概念與性質
定義:?
性質:(1)
(2)?單調不減
(3) 右連續
(4)?
3.離散型隨機變量的概率分布
4.連續型隨機變量的概率密度
概率密度;非負可積,且:
(1)
(2)
(3)為的連續點,則:
分布函數
5.常見分布
(1) 0-1 分布:
(2) 二項分布::?
(3) Poisson分布::?
(4) 均勻分布:
(5) 正態分布:?
(6)指數分布:
(7)幾何分布:
(8)超幾何分布:?
6.隨機變量函數的概率分布
(1)離散型:
則:?
(2)連續型:
則:,?
7.重要公式與結論
(1)??
(2)?
(3)?
(4)?
(5) 離散型隨機變量的分布函數為階梯間斷函數;連續型隨機變量的分布函數為連續函數,但不一定為處處可導函數。
(6) 存在既非離散也非連續型隨機變量。
多維隨機變量及其分布
1.二維隨機變量及其聯合分布
由兩個隨機變量構成的隨機向量, 聯合分布為
2.二維離散型隨機變量的分布
(1) 聯合概率分布律?
(2) 邊緣分布律??
(3) 條件分布律??
3. 二維連續性隨機變量的密度
(1) 聯合概率密度
(2) 分布函數:
(3) 邊緣概率密度:??
(4) 條件概率密度:?
4.常見二維隨機變量的聯合分布
(1) 二維均勻分布:?,
(2) 二維正態分布:,
5.隨機變量的獨立性和相關性
和的相互獨立::
(離散型)?(連續型)
和的相關性:
相關系數時,稱和不相關, 否則稱和相關
6.兩個隨機變量簡單函數的概率分布
離散型:??則:
連續型:??則:
,
7.重要公式與結論
(1) 邊緣密度公式:??
(2)?
(3) 若服從二維正態分布?則有:
與相互獨立,即與不相關。
關于的條件分布為:?
關于的條件分布為:?
(4) 若與獨立,且分別服從?則:
(5) 若與相互獨立,和為連續函數, 則和也相互獨立。
隨機變量的數字特征
1.數學期望
離散型:;
連續型:?
性質:
(1)?
(2)?
(3) 若和獨立,則
(4)
2.方差:
3.標準差:,
4.離散型:
5.連續型:
性質:
(1)
(2)?與相互獨立,則
(3)
(4) 一般有?
(5)
(6)
6.隨機變量函數的數學期望
(1) 對于函數
為離散型:;
為連續型:
(2)?;;??;
7.協方差
8.相關系數
,階原點矩?;?階中心矩?
性質:
(1)
(2)
(3)
(4)
(5)??,其中
?,其中
9.重要公式與結論
(1)
(2)
(3)?且?,其中
,其中
(4) 下面 5 個條件互為充要條件:
????
注:與獨立為上述 5 個條件中任何一個成立的充分條件,但非必要條件。
數理統計的基本概念
1.基本概念
總體:研究對象的全體,它是一個隨機變量,用表示。
個體:組成總體的每個基本元素。
簡單隨機樣本:來自總體的個相互獨立且與總體同分布的隨機變量,稱為容量為的簡單隨機樣本,簡稱樣本。
統計量:設是來自總體的一個樣本,)是樣本的連續函數,且中不含任何未知參數,則稱為統計量。
樣本均值:
樣本方差:
樣本矩:樣本階原點矩:
樣本階中心矩:
2.分布
分布:,其中相互獨立,且同服從
分布:?,其中且,?相互獨立。
分布:,其中且,相互獨立。
分位數:若則稱為的分位數
3.正態總體的常用樣本分布
(1) 設為來自正態總體的樣本,
則:
或者
4)
4.重要公式與結論
(1) 對于,有
(2) 對于,有;
(3) 對于,有?
(4) 對于任意總體,有?
本文首發于“機器學習初學者”公眾號
總結
以上是生活随笔為你收集整理的【数学基础】一份非常适合人工智能学习的概率论基础材料中文版 (国内教材精华)...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【NLP】打破BERT天花板:11种花式
- 下一篇: 为什么销量总是做不好预测?或许你只差这一