【原】【chainer速成】chainer圖像分類從模型自定義到測試

有三AI 2020-11-27

展開全文

歡迎來到專欄《2小時玩轉(zhuǎn)開源框架系列》，這是我們第八篇，前面已經(jīng)說過了caffe，tensorflow，pytorch，mxnet，keras，paddlepaddle，cntk。

今天說chainer，本文所用到的數(shù)據(jù)，代碼請參考我們官方git

https://github.com/longpeng2008/LongPeng_ML_Course

作者&編輯 | 湯興旺

1 chainer是什么

chainer是一個基于python的深度學習框架，能夠輕松直觀地編寫復雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)。

當前大多數(shù)深度學習框架都基于“Define-and-Run”方案。也就是說，首先定義網(wǎng)絡(luò)，然后用戶定期向其提供小批量的訓練數(shù)據(jù)。由于網(wǎng)絡(luò)靜態(tài)定義的，因此所有的邏輯必須作為數(shù)據(jù)嵌入到網(wǎng)絡(luò)架構(gòu)中。

相反，chainer采用“Define-by-Run”方案，即通過實際的前向計算動態(tài)定義網(wǎng)絡(luò)。更確切地說，chainer存儲計算歷史而不是編程邏輯。這樣，Chainer不需要將條件和循環(huán)引入網(wǎng)絡(luò)定義。chainer的核心理念就是Define-by-Run。

2 chainer訓練準備

2.1 chainer安裝

chainer安裝很簡單，只需要在終端輸入下面命令即可安裝：

pip install chainer

2.2 數(shù)據(jù)讀取

在chainer中讀取數(shù)據(jù)是非常簡單的。數(shù)據(jù)讀取部分的代碼如下：

import numpy as np

import os

from PIL import Image

import glob

from chainer.datasets import tuple_dataset

class Dataset():

def __init__(self, path, width=60, height=60):

channels = 3

path = glob.glob('./mouth/*')

pathsAndLabels = []

index = 0

for p in path:

print(p + "," + str(index))

pathsAndLabels.append(np.asarray([p, index]))

index = index + 1

allData = []

for pathAndLabel in pathsAndLabels:

path = pathAndLabel[0]

label = pathAndLabel[1]

imagelist = glob.glob(path + "/*")

for imgName in imagelist:

allData.append([imgName, label])

allData = np.random.permutation(allData)

imageData = []

labelData = []

下面解釋下在chainer中讀取數(shù)據(jù)的一些特色，完整代碼請移步github。

在chainer中我們通過chainer.datasets模塊來獲取數(shù)據(jù)集，其最基本的數(shù)據(jù)集就是一個數(shù)組，平時最常見的NumPy和CuPy數(shù)組都可以直接用作數(shù)據(jù)集。在本實例中我們采用的是元組數(shù)據(jù)集即TupleDataset()來獲取數(shù)據(jù)。

2.3 網(wǎng)絡(luò)定義

它的網(wǎng)絡(luò)定義和pytorch基本上是相似的，如下：

class MyModel(Chain):

def __init__(self):

super(MyModel, self).__init__()

with self.init_scope():

self.conv1 = L.Convolution2D(

in_channels=3, out_channels=12, ksize=3, stride=2)

self.bn1 = L.BatchNormalization(12)

self.conv2 = L.Convolution2D(

in_channels=12, out_channels=24, ksize=3, stride=2)

self.bn2 = L.BatchNormalization(24)

self.conv3 = L.Convolution2D(

in_channels=24, out_channels=48, ksize=3, stride=2)

self.bn3 = L.BatchNormalization(48)

self.fc1 = L.Linear(None, 1200)

self.fc2 = L.Linear(1200, 128)

self.fc3 = L.Linear(128, 2)

def __call__(self,x):

return self.forward(x)

def forward(self, x):

h1 = F.relu(self.conv1(x))

h2 = F.relu(self.conv2(h1))

h3 = F.relu(self.conv3(h2))

h4 = F.relu(self.fc1(h3))

h5 = F.relu(self.fc2(h4))

x = self.fc3(h5)

return (x)

上面的例子和之前說過的caffe、tensorflow、pytorch等框架采用的網(wǎng)絡(luò)結(jié)構(gòu)是一樣。這里不在贅述，我具體說下這個框架的特色。

(1) MyModel(Chain)

Chain在chainer中是一個定義模型的類，我們把模型MyModel定義為Chain的子類，即繼承Chain這個類，這和Pytorch中的nn.module類似。以后我們在模型定義時都可以通過Chain來構(gòu)建具有潛在深層功能和鏈接層次的模型。

(2) Link和Function

在Chainer中，神經(jīng)網(wǎng)絡(luò)的每一層都可以認為是由兩種廣泛類型的函數(shù)之一組成即Link和Function。

其中Function是一個沒有可學習參數(shù)的函數(shù)，而LInk是包括參數(shù)的，我們也能把Link理解成一個賦予其參數(shù)的Function。

在我們使用它之前，我們首先需要導入相應(yīng)的模塊，如下：

import chainer.links as L
import chainer.functions as F

另外在平時使用時我們喜歡用L替代Link，用F代替Function。如L.Convolution2D和F.relu

(3) __call__

對于__call__它的作用就是使我們的chain像一個函數(shù)一樣容易被調(diào)用。

3 模型訓練

數(shù)據(jù)加載和網(wǎng)絡(luò)定義好后，我們就可以進行模型訓練了，話不多說，我們直接上代碼。

model = L.Classifier(MyModel())

if os.path.isfile('./dataset.pickle'):

print("dataset.pickle is exist. loading...")

with open('./dataset.pickle', mode='rb') as f:

train, test = pickle.load(f)

print("Loaded")

else:

datasets = dataset.Dataset("mouth")

train, test = datasets.get_dataset()

with open('./dataset.pickle', mode='wb') as f:

pickle.dump((train, test), f)

print("saving train and test...")

optimizer = optimizers.MomentumSGD(lr=0.001, momentum=0.5)

optimizer.setup(model)

train_iter = iterators.SerialIterator(train, 64)

test_iter = iterators.SerialIterator(test, 64, repeat=False, shuffle=True)

updater = training.StandardUpdater(train_iter, optimizer, device=-1)

trainer = training.Trainer(updater, (800, 'epoch'), out='{}_model_result'.format(MyModel.__class__.__name__))

在chainer中，模型訓練可以分為如下6個步驟，個人認為這6個步驟是非常好理解的。

Step-01-Dataset

第一步當然就是加載我們的數(shù)據(jù)集了，我們通常都是通過下面方法加載數(shù)據(jù)集：

train, test = datasets.get_dataset()

Step-02-Iterator

chainer提供了一些Iterator，通常我們采用下面的方法來從數(shù)據(jù)集中獲取小批量的數(shù)據(jù)進行迭代。

train_iter = iterators.SerialIterator(train, batchsize)
test_iter = iterators.SerialIterator(test, batchsize, repeat=False, shuffle=True)

Step-03-Model

在chainer中chainer.links.Classifier是一個簡單的分類器模型，盡管它里面有許多參數(shù)如predictor、lossfun和accfun，但我們只需賦予其一個參數(shù)那就是predictor，即你定義過的模型。

model = L.Classifier(MyModel())

Step-04-Optimizer

模型弄好后，接下來當然是優(yōu)化了，在chainer.optimizers中有許多我們常見的優(yōu)化器，部分優(yōu)化器如下：

1、chainer.optimizers.AdaDelta

2、chainer.optimizers.AdaGrad

3、chainer.optimizers.AdaDelta

4、chainer.optimizers.AdaGrad

5、chainer.optimizers.Adam

6、chainer.optimizers.CorrectedMomentumSGD .

7、chainer.optimizers.MomentumSGD

8、chainer.optimizers.NesterovAG

9、chainer.optimizers.RMSprop

10、chainer.optimizers.RMSpropGraves

...

Step-05-Updater

當我們想要訓練神經(jīng)網(wǎng)絡(luò)時，我們必須運行多次更新參數(shù)，這在chainer中就是Updater所做的工作，在本例我們使用的是 training.StandardUpdater。

Step-06-Trainer

上面的工作做完之后我們需要做的就是訓練了。在chainer中，訓練模型采用的是 training.Trainer()。

4 可視化

trainer.extend(extensions.dump_graph("main/loss"))

trainer.extend(extensions.Evaluator(test_iter, model, device=-1))

trainer.extend(extensions.LogReport())

trainer.extend(extensions.PrintReport( ['epoch', 'main/loss', 'validation/main/loss', 'main/accuracy', 'validation/main/accuracy']))

trainer.extend(extensions.PlotReport(['main/loss', 'validation/main/loss'], x_key='epoch', file_name='loss.png'))

trainer.extend(extensions.PlotReport(['main/accuracy', 'validation/main/accuracy'], x_key='epoch', file_name='accuracy.png'))

trainer.extend(extensions.ProgressBar())

在chainer中可視化是非常方便的，我們常通過trainer.extend()來實現(xiàn)我們的可視化，其有下面幾種可視化的方式。

1、chainer.training.extensions.PrintReport

2、chainer.training.extensions.ProgressBar

3、chainer.training.extensions.LogReport

4、chainer.training.extensions.PlotReport

5、chainer.training.extensions.VariableStatisticsPlot

6、chainer.training.extensions.dump_graph

以上就是利用chain來做一個圖像分類任務(wù)的一個小例子。完整代碼可以看配套的git項目，我們看看訓練中的記錄，如下：

總結(jié)

本文講解了如何使用chainer深度學習框架完成一個分類任務(wù)，盡管這個框架用的人不多，但這個框架使用起來還是比較方便的，您在用嗎？如果您在用，可以聯(lián)系我們一起交流下！

轉(zhuǎn)載文章請后臺聯(lián)系

侵權(quán)必究

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：有三AI > 《待分類》

舉報/認領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

有三AI

關(guān)注對話

TA的最新館藏

【知識星球】大模型與AIGC+從零學AI+項目與人才招聘共3大知識星球成立，共建有三AI星球社區(qū)生態(tài)
【通知】《深度學習之模型優(yōu)化》代碼和數(shù)據(jù)已在Github開源，參考文獻請根據(jù)本文獲??！
【通知】2024年有三AI知識星球重新開放！重點新增大模型內(nèi)容每日更新
【一對一小組】2024年有三AI-CV中階-GAN組發(fā)布，如何循序漸進地學習好生成對抗網(wǎng)絡(luò)原理與應(yīng)用
【百家稷學】大語言模型核心算法原理與綜合實踐（北京信息科技大學實訓）
【技術(shù)綜述】深度學習模型結(jié)構(gòu)復雜、參數(shù)眾多，如何更直觀地深入理解你的模型？

喜歡該文的人也喜歡更多

熱門閱讀換一換

免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

【原】【chainer速成】chainer圖像分類從模型自定義到測試