2.5 导数-深度学习-Stanford吴恩达教授
| 2.4 梯度下降法 | 回到目錄 | 2.6 更多導數的例子 |
導數 (Derivatives)
這個視頻我主要是想幫你獲得對微積分和導數直觀的理解。或許你認為自從大學畢以后你再也沒有接觸微積分。這取決于你什么時候畢業,也許有一段時間了,如果你顧慮這點,請不要擔心。為了高效應用神經網絡和深度學習,你并不需要非常深入理解微積分。因此如果你觀看這個視頻或者以后的視頻時心想:“哇哦,這些知識、這些運算對我來說很復雜。”我給你的建議是:堅持學習視頻,最好下課后做作業,成功的完成編程作業,然后你就可以使用深度學習了。在第四周之后的學習中,你會看到定義的很多種類的函數,通過微積分他們能夠幫助你把所有的知識結合起來,其中有的叫做前向函數和反向函數,因此你不需要了解所有你使用的那些微積分中的函數。所以你不用擔心他們,除此之外在對深度學習的嘗試中,這周我們要進一步深入了解微積分的細節。所有你只需要直觀地認識微積分,用來構建和成功的應用這些算法。最后,如果你是精通微積分的那一小部分人群,你對微積分非常熟悉,你可以跳過這部分視頻。其他同學讓我們開始深入學習導數。
一個函數 f(a)=3af(a)=3af(a)=3a ,它是一條直線。下面我們來簡單理解下導數。讓我們看看函數中幾個點,假定 a=2a=2a=2 ,那么 f(a)f(a)f(a) 是 aaa 的3倍等于6,也就是說如果 a=2a=2a=2 ,那么函數 f(a)=6f(a)=6f(a)=6 。假定稍微改變一點點 aaa 的值,只增加一點,變為2.001,這時 aaa 將向右做微小的移動。0.001的差別實在是太小了,不能在圖中顯示出來,我們把它右移一點,現在 f(a)f(a)f(a) 等于 aaa 的3倍是6.003,畫在圖里,比例不太符合。請看綠色高亮部分的這個小三角形,如果向右移動0.001,那么 f(a)f(a)f(a) 增加0.003, f(a)f(a)f(a) 的值增加3倍于右移的 aaa ,因此我們說函數 f(a)f(a)f(a) 在 a=2a=2a=2 ,是這個導數的斜率,或者說,當 a=2a=2a=2 時,斜率是3。導數這個概念意味著斜率,導數聽起來是一個很可怕、很令人驚恐的詞,但是斜率以一種很友好的方式來描述導數這個概念。所以提到導數,我們把它當作函數的斜率就好了。更正式的斜率定義為在上圖這個綠色的小三角形中,高除以寬。即斜率等于0.003除以0.001,等于3。或者說導數等于3,這表示當你將 aaa 右移0.001,f(a)f(a)f(a) 的值增加3倍水平方向的量。
現在讓我們從不同的角度理解這個函數。 假設 a=5a=5a=5 ,此時 f(a)=3a=15f(a)=3a=15f(a)=3a=15 。 把 aaa 右移一個很小的幅度,增加到5.001,f(a)=15.003f(a)=15.003f(a)=15.003。 即在 a=5a=5a=5 時,斜率是3,這就是表示,當微小改變變量 aaa 的值,df(a)da=3\frac{df(a)}{da}=3dadf(a)?=3 。一個等價的導數表達式可以這樣寫 ddaf(a)\fracze8trgl8bvbq{da}f(a)dad?f(a),不管你是否將 f(a)f(a)f(a) 放在上面或者放在右邊都沒有關系。 在這個視頻中,我講解導數討論的情況是我們將 aaa 偏移0.001,如果你想知道導數的數學定義,導數是你右移很小的 aaa 值(不是0.001,而是一個非常非常小的值)。通常導數的定義是你右移 aaa (可度量的值)一個無限小的值, f(a)f(a)f(a) 增加3倍(增加了一個非常非常小的值)。也就是這個三角形右邊的高度。
那就是導數的正式定義。但是為了直觀的認識,我們將探討右移 這個值,即使 a=0.001a=0.001a=0.001 并不是無窮小的可測數據。導數的一個特性是:這個函數任何地方的斜率總是等于3,不管 a=2a=2a=2 或 a=5a=5a=5 ,這個函數的斜率總等于3,也就是說不管 aaa 的值如何變化,如果你增加0.001, f(a)f(a)f(a) 的值就增加3倍。這個函數在所有地方的斜率都相等。一種證明方式是無論你將小三角形畫在哪里,它的高除以寬總是3。
我希望帶給你一種感覺:什么是斜率?什么是導函數?對于一條直線,在例子中函數的斜率,在任何地方都是3。在下一個視頻讓我們看一個更復雜的例子,這個例子中函數在不同點的斜率是可變的。
課程PPT
| 2.4 梯度下降法 | 回到目錄 | 2.6 更多導數的例子 |
總結
以上是生活随笔為你收集整理的2.5 导数-深度学习-Stanford吴恩达教授的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2.4 梯度下降法-深度学习-Stanf
- 下一篇: 2.6 更多导数例子-深度学习-Stan