當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【chainer速成】chainer图像分类从模型自定义到测试

發布時間：2025/3/20 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了【chainer速成】chainer图像分类从模型自定义到测试小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章首發于微信公眾號《有三AI》

【chainer速成】chainer圖像分類從模型自定義到測試

歡迎來到專欄《2小時玩轉開源框架系列》，這是我們第八篇，前面已經說過了caffe，tensorflow，pytorch，mxnet，keras，paddlepaddle，cntk。

今天說chainer，本文所用到的數據，代碼請參考我們官方git

https://github.com/longpeng2008/LongPeng_ML_Course

作者&編輯?|?湯興旺??

01?chainer是什么

chainer是一個基于python的深度學習框架，能夠輕松直觀地編寫復雜的神經網絡架構。

當前大多數深度學習框架都基于“Define-and-Run”方案。也就是說，首先定義網絡，然后用戶定期向其提供小批量的訓練數據。由于網絡靜態定義的，因此所有的邏輯必須作為數據嵌入到網絡架構中。

相反，chainer采用“Define-by-Run”方案，即通過實際的前向計算動態定義網絡。更確切地說，chainer存儲計算歷史而不是編程邏輯。這樣，Chainer不需要將條件和循環引入網絡定義?。chainer的核心理念就是Define-by-Run。

02?chainer訓練準備

2.1?chainer安裝

chainer安裝很簡單，只需要在終端輸入下面命令即可安裝：

pip?install?chainer

2.2?數據讀取

在chainer中讀取數據是非常簡單的。數據讀取部分的代碼如下：

import?numpy?as?npimport?osfrom?PIL?import?Imageimport?globfrom?chainer.datasets?import?tuple_datasetclass?Dataset():def?__init__(self,?path,?width=60,?height=60):channels?=?3path?=?glob.glob('./mouth/*')pathsAndLabels?=?[]index?=?0for?p?in?path:print(p?+?","?+?str(index))pathsAndLabels.append(np.asarray([p,?index]))index?=?index?+?1allData?=?[]for?pathAndLabel?in?pathsAndLabels:path?=?pathAndLabel[0]label?=?pathAndLabel[1]imagelist?=?glob.glob(path?+?"/*")for?imgName?in?imagelist:allData.append([imgName,?label])allData?=?np.random.permutation(allData)imageData?=?[]labelData?=?[]

下面解釋下在chainer中讀取數據的一些特色，完整代碼請移步github。

在chainer中我們通過chainer.datasets模塊來獲取數據集，其最基本的數據集就是一個數組，平時最常見的NumPy和CuPy數組都可以直接用作數據集。在本實例中我們采用的是元組數據集即TupleDataset()來獲取數據。

2.3?網絡定義

它的網絡定義和pytorch基本上是相似的，如下：

class?MyModel(Chain):def?__init__(self):super(MyModel,?self).__init__()with?self.init_scope():self.conv1?=?L.Convolution2D(in_channels=3,?out_channels=12,?ksize=3,?stride=2)self.bn1?=?L.BatchNormalization(12)self.conv2?=?L.Convolution2D(in_channels=12,?out_channels=24,?ksize=3,?stride=2)self.bn2?=?L.BatchNormalization(24)self.conv3?=?L.Convolution2D(in_channels=24,?out_channels=48,?ksize=3,?stride=2)self.bn3?=?L.BatchNormalization(48)self.fc1?=?L.Linear(None,?1200)self.fc2?=?L.Linear(1200,?128)self.fc3?=?L.Linear(128,?2)def?__call__(self,x):return?self.forward(x)def?forward(self,?x):h1?=?F.relu(self.conv1(x))h2?=?F.relu(self.conv2(h1))h3?=?F.relu(self.conv3(h2))h4?=?F.relu(self.fc1(h3))h5?=?F.relu(self.fc2(h4))x?=?self.fc3(h5)return?(x)

上面的例子和之前說過的caffe、tensorflow、pytorch等框架采用的網絡結構是一樣。這里不在贅述，我具體說下這個框架的特色。

(1)?MyModel(Chain)

Chain在chainer中是一個定義模型的類，我們把模型MyModel定義為Chain的子類，即繼承Chain這個類，這和Pytorch中的nn.module類似。以后我們在模型定義時都可以通過Chain來構建具有潛在深層功能和鏈接層次的模型。

(2)?Link和Function

在Chainer中，神經網絡的每一層都可以認為是由兩種廣泛類型的函數之一組成即Link和Function。

其中Function是一個沒有可學習參數的函數，而LInk是包括參數的，我們也能把Link理解成一個賦予其參數的Function。

在我們使用它之前，我們首先需要導入相應的模塊，如下：

import?chainer.links?as?L import?chainer.functions?as?F

另外在平時使用時我們喜歡用L替代Link，用F代替Function。如L.Convolution2D和F.relu

(3)?__call__

對于__call__它的作用就是使我們的chain像一個函數一樣容易被調用。

03?模型訓練

數據加載和網絡定義好后，我們就可以進行模型訓練了，話不多說，我們直接上代碼。

model = L.Classifier(MyModel())if os.path.isfile('./dataset.pickle'):print("dataset.pickle is exist. loading...")with open('./dataset.pickle', mode='rb') as f:train, test = pickle.load(f)print("Loaded")else:datasets = dataset.Dataset("mouth")train, test = datasets.get_dataset()with open('./dataset.pickle', mode='wb') as f:pickle.dump((train, test), f)print("saving train and test...")optimizer = optimizers.MomentumSGD(lr=0.001, momentum=0.5)optimizer.setup(model)train_iter = iterators.SerialIterator(train, 64)test_iter = iterators.SerialIterator(test, 64, repeat=False, shuffle=True)updater = training.StandardUpdater(train_iter, optimizer, device=-1)trainer = training.Trainer(updater, (800, 'epoch'), out='{}_model_result'.format(MyModel.__class__.__name__))

在chainer中，模型訓練可以分為如下6個步驟，個人認為這6個步驟是非常好理解的。

Step-01-Dataset

第一步當然就是加載我們的數據集了，我們通常都是通過下面方法加載數據集：

train,?test?=?datasets.get_dataset()

Step-02-Iterator

chainer提供了一些Iterator，通常我們采用下面的方法來從數據集中獲取小批量的數據進行迭代。

train_iter?=?iterators.SerialIterator(train,?batchsize) test_iter?=?iterators.SerialIterator(test,?batchsize,?repeat=False,?shuffle=True)

Step-03-Model

在chainer中chainer.links.Classifier是一個簡單的分類器模型，盡管它里面有許多參數如predictor、lossfun和accfun，但我們只需賦予其一個參數那就是predictor，即你定義過的模型。

model?=?L.Classifier(MyModel())

Step-04-Optimizer

模型弄好后，接下來當然是優化了，在chainer.optimizers中有許多我們常見的優化器，部分優化器如下：

1、chainer.optimizers.AdaDelta2、chainer.optimizers.AdaGrad3、chainer.optimizers.AdaDelta??4、chainer.optimizers.AdaGrad????5、chainer.optimizers.Adam??6、chainer.optimizers.CorrectedMomentumSGD???.????7、chainer.optimizers.MomentumSGD???8、chainer.optimizers.NesterovAG??9、chainer.optimizers.RMSprop???10、chainer.optimizers.RMSpropGraves???...

Step-05-Updater

當我們想要訓練神經網絡時，我們必須運行多次更新參數，這在chainer中就是Updater所做的工作，在本例我們使用的是?training.StandardUpdater。

Step-06-Trainer

上面的工作做完之后我們需要做的就是訓練了。在chainer中，訓練模型采用的是?training.Trainer()。

04?可視化

trainer.extend(extensions.dump_graph("main/loss"))trainer.extend(extensions.Evaluator(test_iter, model, device=-1))trainer.extend(extensions.LogReport())trainer.extend(extensions.PrintReport( ['epoch', 'main/loss', 'validation/main/loss', 'main/accuracy', 'validation/main/accuracy']))trainer.extend(extensions.PlotReport(['main/loss', 'validation/main/loss'], x_key='epoch', file_name='loss.png'))trainer.extend(extensions.PlotReport(['main/accuracy', 'validation/main/accuracy'], x_key='epoch', file_name='accuracy.png'))trainer.extend(extensions.ProgressBar())

在chainer中可視化是非常方便的，我們常通過trainer.extend()來實現我們的可視化，其有下面幾種可視化的方式。

1、chainer.training.extensions.PrintReport????2、chainer.training.extensions.ProgressBar???3、chainer.training.extensions.LogReport????4、chainer.training.extensions.PlotReport???5、chainer.training.extensions.VariableStatisticsPlot??6、chainer.training.extensions.dump_graph????

以上就是利用chain來做一個圖像分類任務的一個小例子。完整代碼可以看配套的git項目，我們看看訓練中的記錄，如下：

總結

本文講解了如何使用chainer深度學習框架完成一個分類任務，盡管這個框架用的人不多，但這個框架使用起來還是比較方便的，您在用嗎？如果您在用，可以聯系我們一起交流下！

轉載文章請后臺聯系

侵權必究

本系列完整文章：

第一篇：【caffe速成】caffe圖像分類從模型自定義到測試

第二篇：【tensorflow速成】Tensorflow圖像分類從模型自定義到測試

第三篇：【pytorch速成】Pytorch圖像分類從模型自定義到測試

第四篇：【paddlepaddle速成】paddlepaddle圖像分類從模型自定義到測試

第五篇：【Keras速成】Keras圖像分類從模型自定義到測試

第六篇：【mxnet速成】mxnet圖像分類從模型自定義到測試

第七篇：【cntk速成】cntk圖像分類從模型自定義到測試

第八篇：【chainer速成】chainer圖像分類從模型自定義到測試

第九篇：【DL4J速成】Deeplearning4j圖像分類從模型自定義到測試

第十篇：【MatConvnet速成】MatConvnet圖像分類從模型自定義到測試

第十一篇：【Lasagne速成】Lasagne/Theano圖像分類從模型自定義到測試

第十二篇：【darknet速成】Darknet圖像分類從模型自定義到測試

感謝各位看官的耐心閱讀，不足之處希望多多指教。后續內容將會不定期奉上，歡迎大家關注有三公眾號 有三AI！

總結

以上是生活随笔為你收集整理的【chainer速成】chainer图像分类从模型自定义到测试的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【杂谈】如何学会看arxiv.org才能
下一篇：【AI初识境】深度学习模型评估，从图像分