琴森不等式及其证明
Jensen's Inequality
Jensen’s Inequality中文譯名琴森不等式,要想了解琴森不等式,首先需要知道凸函數(convex function)與凹函數(concave function)的概念。 由于凸函數和凹函數是相反的概念,因此這里只介紹凸函數即可。
1 凸函數的概念
如下圖中的紅色曲線就是一個凸函數(可能直觀上來看這個曲線是凹的,別弄反了)。
我們在高中就已經學習過相關知識,這里僅溫習一下,用數學的語言描述凸函數就是:
如果個函數具有如下性質:每條弦都位于函數上或函數上方,我們就說這個函數是凸函數。位于x=a到x=b之間的任何一個x值都可以寫成λa+(1?λ)b\lambda a+(1-\lambda )bλa+(1?λ)b的形式,其中0≤λ≤10 \le \lambda \le 10≤λ≤1,弦上的對應點可以寫成:λf(a)+(1?λ)f(b)\lambda f(a) + (1-\lambda )f(b)λf(a)+(1?λ)f(b),函數上的對應值為f(λa+(1?λ)b)f(\lambda a+(1-\lambda )b)f(λa+(1?λ)b),這樣凸函數的性質就可以表示為:
f(λa+(1?λ)b)≤λf(a)+(1?λ)f(b)f(\lambda a+(1-\lambda )b) \le \lambda f(a) + (1-\lambda )f(b)f(λa+(1?λ)b)≤λf(a)+(1?λ)f(b)
這等價于要求函數的二階導數處處為正。
2 琴森不等式
假設f(x)f(x)f(x)是區間(a,b)(a,b)(a,b)上的凸函數,則對任意的x1,x2,...,xn∈(a,b)x_1, x_2,...,x_n \in (a,b)x1?,x2?,...,xn?∈(a,b)有不等式:
f(x1+x2+...+xnn)≤f(x1)+f(x2)+...+f(xn)nf(\frac{x_1+x_2+...+x_n}{n}) \le \frac{f(x_1)+f(x_2)+...+f(x_n)}{n}f(nx1?+x2?+...+xn??)≤nf(x1?)+f(x2?)+...+f(xn?)?
成立,當且僅當x1=x2=...=xnx_1=x_2=...=x_nx1?=x2?=...=xn?時等號成立。
另外,假設f(x)f(x)f(x)是區間(a,b)(a,b)(a,b)上的凸函數,則對任意的x1,x2,...,xn∈(a,b)x_1, x_2,...,x_n \in (a,b)x1?,x2?,...,xn?∈(a,b),有∑i=1nai=1\sum_{i=1}^n{a_i}=1∑i=1n?ai?=1,且aia_iai?均大于0,則有:
f(a1x1+a2x2+...+anxn)≤a1f(x1)+a2f(x2)+...+anf(xn)f(a_1x_1+a_2x_2+...+a_nx_n) \le a_1f(x_1)+a_2f(x_2)+...+a_nf(x_n)f(a1?x1?+a2?x2?+...+an?xn?)≤a1?f(x1?)+a2?f(x2?)+...+an?f(xn?)
巧妙的是,由于有∑i=1nai=1\sum_{i=1}^n{a_i}=1∑i=1n?ai?=1,且aia_iai?均大于0的約束,這樣可以將aia_iai?看作是隨機變量xix_ixi?的概率,上式左側就剛好是隨機變量XXX的期望E(X)E(X)E(X),因此上式等價于:
f(E(X))≤E(f(X))f(E(X)) \le E(f(X))f(E(X))≤E(f(X))
3 證明琴森不等式
那么琴森不等式的結論如何證明呢?下面使用數學歸納法證明。
證明:
已知當n=2的時候,琴森不等式成立,即:
f(λa+(1?λ)b)≤λf(a)+(1?λ)f(b)f(\lambda a+(1-\lambda )b) \le \lambda f(a) + (1-\lambda )f(b)f(λa+(1?λ)b)≤λf(a)+(1?λ)f(b)
假設當n=N時該結論成立,有:
f(∑i=1naixi)≤∑i=1naif(xi)f(\sum_{i=1}^n{a_ix_i}) \le \sum_{i=1}^n{a_if(x_i)}f(i=1∑n?ai?xi?)≤i=1∑n?ai?f(xi?)
只需證明當n=N+1時該結論仍然成立即可,當n=N+1時,有:
因此,當n=N+1時,不等式仍然成立,即證。
----- 本文完 -----
總結
- 上一篇: 卡斯柯信号有限公司的分散自律调度集中系统
- 下一篇: maven详解2020