《概率论》:最大似然估计 和 求法
《概率論》:最大似然估計 和 求法
視頻地址:https://www.bilibili.com/video/BV1KL4y187jV/
1. 最大似然估計思路
從樣本情況推測自然界概率模型,到底自然界真實情況是不是這樣?不好說,不一定。
2. 方法
- 第一步:自然界模型中,我們假設,抽中1的概率θ\thetaθ,抽2的概率(1?θ)(1-\theta)(1?θ),但θ\thetaθ到底多少不知道。
- 第二步:那么我從大數據中抽了五個球,因為數據樣本非常大,所以不考慮排列,如圖①①②①②概率是 L(θ)=θ3(1?θ)2L(\theta)=\theta^3(1-\theta)^2L(θ)=θ3(1?θ)2
【楊哥講解】
其實自然界 到底什么樣的θ\thetaθ都是有可能的,θ=0.1\theta=0.1θ=0.1,有可能抽出這樣的樣本;θ=0.5\theta=0.5θ=0.5也能抽出這樣的樣本,無非抽出的概率不同。
最大似然估計法,就是認為,我們抽出來這樣的樣本,那么我就認為這種情況是最經常發生的。也就是讓L(θ)=θ3(1?θ)2L(\theta)=\theta^3(1-\theta)^2L(θ)=θ3(1?θ)2取最大,我們認為這時候的θ\thetaθ就是自然界的θ\thetaθ。
- 第三步:求 L(θ)L(\theta)L(θ)最大值,一般轉換成求 -lnL(θ)L(\theta)L(θ)最小值
【楊哥講解】
- 取對數不改變函數單調性,又能很好地換減運算:① 將指數換成系數;②將聯乘變成了連加
這里我認為講的有點小問題,要加負號最小,所以一階導=0,雖然不影響結果,但這樣邏輯上才合適
- 第四步:我們認為的大數據最終概率分布是這樣的
但,大數據里真的是這樣么?
3.思考
我們用李宏毅《機器學習》里面的一個例子,來看一個有趣的現象。
我們真實情況下有1類一個,2,3,4類 各4個,現在通過這種抽樣的思路來對測試數據進行分類(c1是class 1,C2 不是class2),看看它在屬于1類的的概率。
計算的情況是 訓練數據 是C1類的概率<0.5
但人眼一眼就看出,它就是Class1
所以最大似然估計,是通過 統計學來假設樣本存在概率的 ,和真實情況有可能非常接近,有可能有一定差距。換句話說就是 ,此算法有時候具有優勢,有時候并不特別準確。
總結
以上是生活随笔為你收集整理的《概率论》:最大似然估计 和 求法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 变电站用ABB高低压转换自耦变压器
- 下一篇: 基于Java+Mysql的超市管理系统(