mxnet deepspeech网络结构打印
采用示例https://github.com/apache/incubator-mxnet/tree/master/example/speech_recognition
訓練命令為
python main.py --configfile deepspeech.cfg
在文件stt_layer_warpctc.py的 net = mx.sym.Concat(*fc_seq, dim=0) 這一行的下面添加一行,
mx.viz.print_summary(net, shape={"data": (1, 1600, 161)})
即可以打印出網絡結構,不過打印結果有點恐怖,居然有292020行,也就是29萬多行,貼不出來,貼一下直接網頁就卡死了
我還是想辦法,把參數改小一點,比如在deepspeech.cfg中,把參數改為:
buckets = [20, 40]
num_rnn_layer = 3
num_hidden_rnn_list = [1760, 1760, 1760]
上面的語句也相應的改為
mx.viz.print_summary(net, shape={"data": (1, 40, 161)})
打印出來的網絡結構,也挺大的,1150行,還是粘不下,我上傳到了百度網盤
鏈接:https://pan.baidu.com/s/1uJ_0_vmgVBTW7fSkYIM_uw?
提取碼:7rvv
___________________________________________
上面這一行也可以采用?mx.viz.plot_network(net, shape={"data": (1, 40, 161)}).view(),會把網絡結構保存為一個pdf文件,我把該pdf文件上傳到了?https://download.csdn.net/download/zhqh100/12116047,可以參考一下
————————————————————————
上面的方法有點弱,但是上傳到CSDN的資源自己居然無法刪除(感覺好惡心),,只好先留著
另一種打印方法是在文件stt_layer_warpctc.py的 “return net” 前添加一行
mx.viz.plot_network(net, shape={"data": (1, 40, 161), "label":(1, 183)}).view()
也會把網絡結構保存為一個pdf文件,我也上傳到了
鏈接:https://pan.baidu.com/s/1uJ_0_vmgVBTW7fSkYIM_uw?
提取碼:7rvv
————————————————————————
上面代碼中的參數值,我是在文件stt_io_bucketingiter.py中,
self.provide_label = [('label', (self.batch_size, self.maxLabelLength))]
這一行的下面添加了打印
print(self.provide_data)
print(self.provide_label)
獲取到的
_____________________________________________
本文完
?
return mx.io.DataBatch(data_all, label_all, pad=0,bucket_key=self.buckets[i],provide_data=provide_data,provide_label=self.provide_label)
?
總結
以上是生活随笔為你收集整理的mxnet deepspeech网络结构打印的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mxnet speech_recogni
- 下一篇: tensorflow deep_spee