當前位置：首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

【火炉炼AI】深度学习004-Elman循环神经网络

發布時間：2024/1/8 ChatGpt 32 豆豆

生活随笔收集整理的這篇文章主要介紹了【火炉炼AI】深度学习004-Elman循环神经网络小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

【火爐煉AI】深度學習004-Elman循環神經網絡

(本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 )

Elman神經網絡是最早的循環神經網絡，由Elman于1990年提出，又稱為SRN（Simple Recurrent Network, 簡單循環網絡）。SRN考慮了時序信息，當前時刻的輸出不僅和當前時刻的輸入有關，還和前面所有時刻的輸入有關。SRN是RNN結構中最簡單的一種，相對于傳統的兩層全連接前饋網絡，它僅僅在全連接層添加了時序反饋連接。

簡單點來理解，以前的深度神經網絡的計算可以簡單理解為：yt=f(Xt)，而SRN卻把上一個時刻的結果也當做輸入放入模型中，相當于yt=f(Xt,yt-1)，由于這種遞歸性，每一個yt結果不僅僅和自身的特征向量Xt有關，還和前一個時刻的輸出結果yt-1有關，如此遞歸，便認為yt和以前的所有的Xt，Xt-1,Xt-2...都有關，那么yt就相當于“記住了”前面Ｎ個時刻的所有輸入變量X.

那么SRN是怎么做到這一點的了？SRN一般分為四層：輸入層，隱含層，承接層，輸出層，和前面講到的簡單神經網絡不同的是，承接層就起到一個臨時變量Var的作用，在t-1時刻得到的結果yt-1后，把yt-1輸出的同時也保存一份給Var，然后再計算t時刻的結果是，把Var也當做一個變量輸入，所以Var相當于一個延時算子，達到記憶的目的，使得整個網絡結構具有適應時間序列的應變能力。如下圖所示：

圖中的循環層其實就是承接層，名稱不同而已，這個網絡結構不太容易看出時序性，故而展開后為：

圖片來源于Recurrent Neural Network(循環神經網絡).

關于更多更復雜的循環神經網絡結構，可以參考博文循環神經網絡(RNN, Recurrent Neural Networks)介紹

那么怎么建立并訓練SRN模型了？

1. 構建并訓練Elman循環神經網絡

1.1 準備數據集

此次我們自動生成一系列數據，該系列數據包含四段數據，如下為數據生成函數。

# 準備數據集 # 用np生成一些序列數據，這個序列數據有四段 def waveform_dataset(points_num):'''建立波形數據集，這個數據集含有四段，每一段的數據點數為points_num'''stage1=1*np.cos(np.arange(points_num))stage2=2*np.cos(np.arange(points_num))stage3=3*np.cos(np.arange(points_num))stage4=4*np.cos(np.arange(points_num))dataset_X=np.array([stage1,stage2,stage3,stage4])# 4行points_num列dataset_X=dataset_X.reshape(points_num*4,1) # 轉變為：4*points_num行，一列，即為整個序列amp1 = np.ones(points_num) # 每一段數據的幅度不同分別是1,4,2,0.5amp2 = 4 + np.zeros(points_num) amp3 = 2 * np.ones(points_num) amp4 = 0.5 + np.zeros(points_num) dataset_y=np.array([amp1,amp2,amp3,amp4]).reshape(points_num*4,1)return dataset_X,dataset_y 復制代碼

可以看看數據集的分布情況：

1.2 構建并訓練模型

直接上代碼，此處用neurolab模塊中的現有函數newelm()來構建一個SRN模型，包含兩層神經網絡。

# 構建并訓練模型 import neurolab as nl net = nl.net.newelm([[-2, 2]], [10, 1], [nl.trans.TanSig(), nl.trans.PureLin()]) # 創建兩層的神經網絡 net.layers[0].initf = nl.init.InitRand([-0.1, 0.1], 'wb') net.layers[1].initf= nl.init.InitRand([-0.1, 0.1], 'wb') net.init() # 網絡的初始化 error = net.train(dataset_X, dataset_y, epochs=3000, show=300, goal=0.01) 復制代碼

-------------------------------------輸---------出--------------------------------

Epoch: 300; Error: 0.08632353521527447; Epoch: 600; Error: 0.07758197978278435; Epoch: 900; Error: 0.047083147244329486; Epoch: 1200; Error: 0.03948011155907889; Epoch: 1500; Error: 0.03808612642771739; Epoch: 1800; Error: 0.03600983543384789; Epoch: 2100; Error: 0.04108011778013388; Epoch: 2400; Error: 0.0388262030539809; Epoch: 2700; Error: 0.033576743782171244; Epoch: 3000; Error: 0.03329548827926802; The maximum number of train epochs is reached

--------------------------------------------完-------------------------------------

1.3 用訓練好的模型預測新樣本

此處假設訓練集所用的dataset_X為新樣本，那么看看得到的結果和預測值之間的差異。

# 用訓練好的模型預測新樣本 predict_y=net.sim(dataset_X) plt.plot(dataset_y,label='dataset') plt.plot(predict_y,label='predicted') plt.legend() plt.title('Comparison of Truth and Predicted') 復制代碼

當然，我們也可以用函數waveform_dataset()來產生一些新數據，然后用訓練好的模型預測一下試試。

# 生成新的數據集 newset_X,newset_y=waveform_dataset(100) predict_y=net.sim(newset_X) plt.plot(newset_y,label='dataset') plt.plot(predict_y,label='predicted') plt.legend() plt.title('Comparison of Truth and Predicted') 復制代碼

可以發現，對于新產生的序列數據，該模型也能夠大體預測出來。

########################小**********結###############################

1，neurolab中已經集成了一些簡單的神經網絡方面的函數，比如最簡單的循環神經網絡模型--Elman循環神經網絡，對于復雜的或者需要自己定義的循環神經網絡，需要用其他更復雜的深度學習框架。

1，Elman循環神經網絡模型是一種最簡單的循環神經網絡結構，只能解決一些相對簡單的序列數據問題。

#################################################################

注：本部分代碼已經全部上傳到（我的github）上，歡迎下載。

參考資料:

1, Python機器學習經典實例，Prateek Joshi著，陶俊杰，陳小莉譯

總結

以上是生活随笔為你收集整理的【火炉炼AI】深度学习004-Elman循环神经网络的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。