當(dāng)前位置：首頁 > 人工智能 > 循环神经网络 >内容正文

循环神经网络

（pytorch-深度学习）双向循环神经网络

發(fā)布時(shí)間：2024/8/23 循环神经网络 24 豆豆

生活随笔收集整理的這篇文章主要介紹了（pytorch-深度学习）双向循环神经网络小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

雙向循環(huán)神經(jīng)網(wǎng)絡(luò)

一般，我們認(rèn)為循環(huán)神經(jīng)網(wǎng)絡(luò)模型都是假設(shè)當(dāng)前時(shí)間步是由前面的較早時(shí)間步的序列決定的，因此它們都將信息通過隱藏狀態(tài)從前往后傳遞。
有時(shí)候，當(dāng)前時(shí)間步也可能由后面時(shí)間步?jīng)Q定。
例如，當(dāng)我們寫下一個(gè)句子時(shí)，可能會(huì)根據(jù)句子后面的詞來修改句子前面的用詞。雙向循環(huán)神經(jīng)網(wǎng)絡(luò)通過增加從后往前傳遞信息的隱藏層來更靈活地處理這類信息。

給定時(shí)間步 $t$ 的小批量輸入 $Xt∈Rn×d\boldsymbol{X}_t \in \mathbb{R}^{n \times d}$ （樣本數(shù)為 $n$ ，輸入個(gè)數(shù)為 $d$ ）
隱藏層激活函數(shù)為 $?\phi$ 。

在雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的架構(gòu)中，設(shè)

該時(shí)間步正向隱藏狀態(tài)為 $H→t∈Rn×h\overrightarrow{\boldsymbol{H}}_t \in \mathbb{R}^{n \times h}$ （正向隱藏單元個(gè)數(shù)為 $h$ ）
反向隱藏狀態(tài)為 $H←t∈Rn×h\overleftarrow{\boldsymbol{H}}_t \in \mathbb{R}^{n \times h}$ （反向隱藏單元個(gè)數(shù)為 $h$ ）。

我們可以分別計(jì)算正向隱藏狀態(tài)和反向隱藏狀態(tài)：

$H→t=?(XtWxh(f)+H→t?1Whh(f)+bh(f)),H←t=?(XtWxh(b)+H←t+1Whh(b)+bh(b))\begin{aligned} \overrightarrow{\boldsymbol{H}}_t &= \phi(\boldsymbol{X}_t \boldsymbol{W}_{xh}^{(f)} + \overrightarrow{\boldsymbol{H}}_{t-1} \boldsymbol{W}_{hh}^{(f)} + \boldsymbol{b}_h^{(f)}),\\ \overleftarrow{\boldsymbol{H}}_t &= \phi(\boldsymbol{X}_t \boldsymbol{W}_{xh}^{(b)} + \overleftarrow{\boldsymbol{H}}_{t+1} \boldsymbol{W}_{hh}^{(b)} + \boldsymbol{b}_h^{(b)})\end{aligned}$

其中權(quán)重 $Wxh(f)∈Rd×h\boldsymbol{W}_{xh}^{(f)} \in \mathbb{R}^{d \times h}$ 、 $Whh(f)∈Rh×h\boldsymbol{W}_{hh}^{(f)} \in \mathbb{R}^{h \times h}$ 、 $Wxh(b)∈Rd×h\boldsymbol{W}_{xh}^{(b)} \in \mathbb{R}^{d \times h}$ 、 $Whh(b)∈Rh×h\boldsymbol{W}_{hh}^{(b)} \in \mathbb{R}^{h \times h}$ 和偏差 $bh(f)∈R1×h\boldsymbol{b}_h^{(f)} \in \mathbb{R}^{1 \times h}$ 、 $bh(b)∈R1×h\boldsymbol{b}_h^{(b)} \in \mathbb{R}^{1 \times h}$ 均為模型參數(shù)。

然后通過連結(jié)兩個(gè)方向的隱藏狀態(tài) $H→t\overrightarrow{\boldsymbol{H}}_t$ 和 $H←t\overleftarrow{\boldsymbol{H}}_t$ 來得到隱藏狀態(tài) $Ht∈Rn×2h\boldsymbol{H}_t \in \mathbb{R}^{n \times 2h}$ ，并將其輸入到輸出層。

輸出層計(jì)算輸出 $Ot∈Rn×q\boldsymbol{O}_t \in \mathbb{R}^{n \times q}$ （輸出個(gè)數(shù)為 $q$ ）：

$Ot=HtWhq+bq,\boldsymbol{O}_t = \boldsymbol{H}_t \boldsymbol{W}_{hq} + \boldsymbol{b}_q,$

其中權(quán)重 $Whq∈R2h×q\boldsymbol{W}_{hq} \in \mathbb{R}^{2h \times q}$ 和偏差 $bq∈R1×q\boldsymbol{b}_q \in \mathbb{R}^{1 \times q}$ 為輸出層的模型參數(shù)。不同方向上的隱藏單元個(gè)數(shù)也可以不同。

總結(jié)

以上是生活随笔為你收集整理的（pytorch-深度学习）双向循环神经网络的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：重返数学史的黄金时代，由数学推动诞生的人
下一篇：全部物理宇宙全部能由数学理解