Jensen 不等式
- 參考:
- 《數值最優化方法》—— 高立
- Jensen不等式初步理解及證明
- Jensen不等式講解與證明
文章目錄
- 1. 凸集與凸函數
- 1.1 凸集
- 1.2 凸函數
- 2. Jensen不等式
- 2.1 Jensen不等式
- 2.2 證明
- 2.3 擴展
1. 凸集與凸函數
1.1 凸集
定義:設集合 C?RnC \subset \mathbb{R}^nC?Rn,若對 ?x,y∈C\forall x,y \in C?x,y∈C,有
θx+(1?θ)y∈C,θ∈[0,1]\theta x + (1-\theta)y \in C, \theta \in [0,1] θx+(1?θ)y∈C,θ∈[0,1]
則稱 CCC 為 凸集
幾何意義:若 x,yx,yx,y 屬于凸集 CCC 則 xxx 與 yyy 連線上的所有點都屬于凸集 CCC
性質:凸集關于加法、數乘和交運算都是封閉的。對于凸集 C1,C2∈RnC_1,C_2 \in \mathbb{R}^nC1?,C2?∈Rn,β∈R\beta \in \mathbb{R}β∈R,則
1.2 凸函數
定義:設集合 C?RnC \subset \mathbb{R}^nC?Rn 為非空凸集,函數 f:C→Rf: C \to \mathbb{R}f:C→R。若對 ?x,y∈C\forall x,y \in C?x,y∈C,有
f(θx+(1?θ)y)≤θf(x)+(1?θ)f(y),θ∈[0,1]f(\theta x + (1-\theta)y) \leq \theta f(x)+(1-\theta)f(y), \theta \in [0,1] f(θx+(1?θ)y)≤θf(x)+(1?θ)f(y),θ∈[0,1]
則稱 fff 為 CCC 上 凸函數。若不等式對 x≠yx\neq yx?=y 嚴格成立,則稱 fff 為 CCC 上的 嚴格凸函數
幾何意義:凸函數曲線上任意兩點連線都在函數曲線之上
判定方法
2. Jensen不等式
2.1 Jensen不等式
- 根據凸函數性質,凸集 CCC 上的凸函數 fff 上的兩點 x1,x2x_1,x_2x1?,x2? 滿足
θf(x1)+(1?θ)f(x2)≥f(θx1+(1?θ)x2),θ∈[0,1]\theta f(x_1)+(1-\theta)f(x_2) \geq f(\theta x_1 + (1-\theta)x_2) , \theta \in [0,1] θf(x1?)+(1?θ)f(x2?)≥f(θx1?+(1?θ)x2?),θ∈[0,1] - 把上式推廣到 nnn 個點的情況,即得 Jensen 不等式:對于凸函數 fff,其所在凸集 CCC 中的任意點集 {xi}?C\{x_i\} \subset C{xi?}?C,若 θi≥0\theta_i \geq 0θi?≥0 且 ∑iθi=1\sum_i\theta_i = 1∑i?θi?=1,則有
∑i=1Mθif(xi)≥f(∑i=1Mθixi)\sum_{i=1}^M\theta_i f(x_i) \geq f(\sum_{i=1}^M\theta_i x_i) i=1∑M?θi?f(xi?)≥f(i=1∑M?θi?xi?)
2.2 證明
- 可以使用數學歸納法證明,參見:Jensen不等式講解與證明
2.3 擴展
在概率論中,如果把 θi\theta_iθi? 看作離散型隨機變量 XXX 取值 xix_ixi? 的概率,則根據Jensen不等式
E[f(X)]≥f(E[X])E[f(X)] \geq f(E[X]) E[f(X)]≥f(E[X])
把Jensen不等式拓展到連續情況,有
∫f(x)p(x)dx≥f(∫xp(x)dx)\int f(x)p(x)dx \geq f(\int xp(x)dx) ∫f(x)p(x)dx≥f(∫xp(x)dx)
這里 fff 是凸函數,ppp 是隨機變量的概率密度函數
當隨機變量X是常數時,Jensen不等式中等號成立。從幾何角度容易理解(此時凸函數 f(x)=cf(x) = cf(x)=c是一條直線)
總結
以上是生活随笔為你收集整理的Jensen 不等式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大话数据结构4 - 初识单链表
- 下一篇: DialogBoxParam(hinst