ディープラーニングを使ってみる

(1)

1

ディープラーニングを使ってみる

(2)

演習のターゲット

ディープラーニングで「０」〜「９」の手書き数字を見分ける

2

• MNIST の手書き数字データセットを利用

• ２つのシンプルなモデルで精度比較

(3)

3

本日講義のゴール

ゼロから手書き数字識別モデルを構築し、ネットワークをカスタマイズ

3

1. プロジェクト作成

2. Affine を使ったシンプルなモデルを構築し、検証

3. CNN を使った少し高度なモデルを構築し、検証

4. CNN のネットワークをカスタマイズし、精度の向上を検討

– １つのモデルの精度検証に 30 分程度（実時間）必要になります．

– 実行計画を立て、精度が最高になるネットワークを見つけてください．

(4)

Neural Network Console クラウド版にサインイン

Chrome

ブラウザを起動し、

Neural Network Console

の

Web

からクラウドにサインイン。

1. “dl.sony.com/ja/”

にアクセス

2. “

サインイン

”

をクリック

演習

(5)

5

プロジェクト作成

Project

タブの

New Project

から新規プロジェクトを作成する。

セットアップデータセット準備

ネットワーク

作成学習評価構造自動探索推論

1. “Project”

をクリック

2. “New Project”

をクリック

演習

3.

半角英数字で任意のプロジェクト名を入力し

”OK”

をクリッ

ク

(6)

ネットワーク編集画面の確認

ネットワークの編集画面が表示されることを確認。

演習

(7)

7

データセットの連携演習

ネットワーク

1. “DATASET”

をクリック

2. “Not Set”

をクリック

3. “ mnist.mnist_training ”

^をマウ

スオーバーし、右側に表示されるアイコンをクリック

学習用データセットの設定。

(8)

データセットの連携演習

1. “Validation”

をクリック

2. “Not Set”

をクリック

3. “ mnist.mnist_test ”

^をマウス

オーバーし、右側に表示されるアイコンをクリック

評価用データセットの設定。

(9)

9

ネットワーク編集画面の表示

ネットワーク編集画面を表示。

演習

1. “EDIT”

をクリック

ネットワーク

(10)

ネットワーク作成

レイヤー選択パネルからネットワーク構造パネルにレイヤーをドラック＆ドロップする。

すでにあるレイヤーと連結し、ネットワークを構成する。

レイヤーパラメータパネルで各レイヤーの詳細を設定する。

レイヤー選択

レイヤー設定

ネットワーク構造

学習指示

ネットワーク統計量

１．レイヤーを選択

２．ネットワークを連結

クリック離す

データの次元を表現

28

24

16

演習補足資料

(11)

11

最小のモデル

０～９の手書き数字文字を分類するための分類モデルを作成する。

分類問題の例

Input

Categorycal CrossEntoropy

Softmax

^{確率に変換}

分類問題に対応した

Loss Function

Affine

^※

Output

^{のサイズに調整}

インプットは

28x28

の白黒画像のため、サイズを「

1,28,28

」に変更

10

分類のため、サイズを

10

に設定

演習

ネットワーク

(12)

学習回数の設定

学習の繰り返し回数を設定する。

1. Max Epoch

を

“10”

に変更

演習

※変更しないと100に設定されているため、計算が１時間以上かかることがあります．

(13)

13

学習の実行

2.“Run”

をクリック

1.“EDIT”

をクリック

ネットワーク

演習

3.

学習結果が表示されることを確認

学習の実行を行い、結果が表示されることを確認。

(14)

レイヤー説明： Affine

入力層の全ての値を用いた線形変換を行うレイヤーである。

Output

のサイズを任意に指定でき、レイヤーのサイズを自在に調整できる。

Output

の各セルは

Input

の全ての値が入力値として利用される。

𝒚 = 𝑾𝒙 + 𝒃

1

次元

→1

次元の例

2

次元

→2

次元の例

Input Output

演習補足資料

全結合層

(15)

15

レイヤー説明： Softmax

入力層のそれぞれの値を各セルの確率に変換するレイヤーである。

出力層の各セルの値を

0

～

1

に、セルの総和を

1

にすることが可能である。

分類問題でのネットワークの最後に使用する。

1.0 -1.5

2.0 1.3 -1.7 -0.1 2.9

0 0.6 2.8

0.05 0.00 0.14 0.07 0.00 0.02 0.35 0.02 0.04 0.31

Softmax 𝑝 ! = 𝑒 " !

∑ # 𝑒 " "

入力層出力層

…

いろいろと変換

ネットワーク

演習補足資料

$

!

𝑝 ! = ∑ ! 𝑒 "

^!

∑ # 𝑒 "

^"

= 1

𝑝 !

𝑥 !

^{Softmax関数}

確率に変換

総和が１

(16)

レイヤー説明： Loss Function （分類問題の場合）

予測値と真値との誤差で、ネットワークの性能の悪さを示す指数を出力するレイヤーである。

学習ではこれを小さくするようにパラメータをアップデートする。

Loss Function: 𝐿 = −log(𝑥 " )

CategoricalCrossEntropy

𝑥 " : 真のクラスの予測確率

CategoricalCrossEntropy F(x) = -log(x)

演習補足資料

𝐿

が⼤きい

è

予測が真のクラスから遠い

𝐿

が⼩さい

è

予測が真のクラスに近い

(17)

２値分類問題 多値分類問題 回帰問題 (連続値などの数値の予測)

最後の活性化関数

Sigmoid

⼊⼒値を0.0〜１.0（確率）にする

Softmax

⼊⼒値の合計が1.0となる0.0

~ 1.0（確率）にする

（使⽤しない）

ロス関数

BinaryCrossEntropy

出⼒と正解が全体としてどれくらい離れているかを計算

出⼒と正解カテゴリーが全体としてどれくらい離れているかを計算

SquareError

出⼒と正解の値の差の２乗（２乗誤差）を計算

代表的なネットワークの例

課題に合わせて最後の活性化関数とロス関数を設定する

ネットワークの最後の活性化関数とロス関数演習補足資料

(18)

評価の実行

学習結果が表示されている画面で、再度

”Run”

をクリックし評価を実行。

演習

1.“Run”

をクリック

2.

評価結果が表示されることを確認

3.

混同行列

(19)

19

分類問題の例

Input

Softmax

^{確率に変換}

Loss Function

Affine

^※

Output

CNN の実装

ネットワークを変更し試行錯誤を実施。

画像分類で用いられることが多い

Convolutional Neural Network (CNN)

を実装する。

ここに

CNN

のセットを実装

ネットワーク

演習

(20)

よく利用されるレイヤーの組み合わせ

ネットワークを作成する際は、レイヤーを組み合わせたセットを最小単位として考えることが多い。

Convolution

のセットの例

全結合

活性化関数

Affine

のセットの例

•

活性化関数は

tanh

など他を使う場合もある

•

活性化関数は

tanh

• Pooling

層は

SumPooling

など他を使う場合もある畳み込み

ダウンサンプリング活性化関数

演習補足資料

(21)

21

レイヤー説明： Convolution

入力データを一定サイズごと順番に線形変換を行うレイヤーである。

画像の局所的な特徴を抽出可能である。

In pu t

Output

※１枚の

layer

に対しては同じ変換

Output

の枚数

(OutMaps)

カーネルの移動量

(Stride)

𝑦 = 1

!,$

𝑤 !$ 𝑥 !$ + 𝑏

ネットワーク

演習補足資料

3x3

1

Padding

(1,1)

w11 w12 w13

w21 w22 w23

w31 w32 w33

各カーネルに重みをかけて和をとる

局所的なニューロンの⼊⼒を元に出⼒ニューロンの値を求める

畳み込み層

変換する⼊⼒

(カーネル)のサイズ (KernelShape)

(22)

レイヤー説明： Pooling

入力データを一定サイズごとに順に変換するレイヤーである。

カーネルのサイズと移動量をそろえて、画像サイズを圧縮することが一般的である。

Input

Output

Layer

^変換内容

MaxPooling

カーネルの中の最大値を取得

AveragePooling

カーネルの中の平均値を取得

SumPooling

カーネルの中の総和を取得

カーネルのサイズ

(KernelShape)

(Stride)

Pooling

層の種類

演習補足資料

0 1 1 5 2 8 2 3 3 1 2 4 9 2 1 1

8 5 9 4

MaxPoolingの例

(23)

23

レイヤー説明： Activate (ReLU, Tanh)

インプットの各セルに対して、非線形変換

※

を行うレイヤーである。

ネットワークの途中に、この

Activate Function

を入れることが精度を出すためには必須である。

挿入する場所は

Convolution

層や

Pooling

層の後に挿入することが一般的である。

f(x 00 ) f(x 01 )

Tanh ReLU

※非線形変換とは

Affine

や

Convolution

とは異なり、１次関数で表すことができない変換

f(x)=max(0, x) f(x)=tanh(x)

Input Output

x 00 x 01

ネットワーク

演習補足資料

(24)

CNN の実装

Convolution

層と

Affine-ReLU

層の組み合わせと

Convolution

のパラメータ

(OutMaps, KernelShape)

及び、

Affine

のサイズを変更し、試行錯誤することができる。

• Convolution

層の数

• Convolution

のパラメータ

(OutMaps, KernelShape)

• Affine-ReLU

層の数

• Affine

のサイズ

演習

各ユニットをクリックすると左下に設定されているパラメタが表⽰されます。

(25)

25

ネットワークの試行錯誤による精度向上

精度向上をするための戦略を決める

・・・・・・・・・

１層２層

・・・

１層２層

・・・

• パラメタは以下の５種類

層数

1. Convolution

層

(CMR

のセット

)

の数

2. Affine-ReLU

層

(AR

のセット

)

の数

各

Convolution

^{のパラメタ}

3. OutMaps

^初期値

: 16

4. KernelShape

^初期値

:(3,3)

各

Affine

^のサイズ

5. OutShape

^初期値

: 100

• 例えば …

–

（

CMR:1~3

層

) x (AR:1,3,5,7,9

層

) à 15

通り

à 5

人で

1

人３通り

※「構造⾃動探索」は時間がかかり、ネットワーク構造⾃体を探索するので、今回は⽤いない．

(26)

参考資料

(27)

27

ネットワーク作成

レイヤー選択パネルからネットワーク構造パネルにレイヤーをドラック＆ドロップする。

すでにあるレイヤーと連結し、ネットワークを構成する。

レイヤーパラメータパネルで各レイヤーの詳細を設定する。

レイヤー選択

レイヤー設定

ネットワーク構造

学習指示

ネットワーク統計量

１．レイヤーを選択

２．ネットワークを連結３．詳細設定

クリック離す

データの次元を表現

28

24

16

演習補足資料

ネットワーク

(28)

ネットワークを形成するレイヤー

約

100

種類のレイヤーが実装されており、これらを組み合わせてネットワークを作成する。

IO Activation Math Logical Others

Input Tanh Sum LogicalAnd BatchNormalization

Loss Sigmoid Mean LogicalOr Dropout

SquaredError Abs Prod LogicalXor Concatenate

HuberLoss ReLU Max Equal Reshape

BinaryCrossEntropy CReLU Min NotEqual Broadcast

SigmidCrossEntropy PReLU Log GreaterEqual Flip

CategoricalCrossEntropy ELU Exp Greater Shit

SoftmaxCrossEntropy CELU Sign LessEqual Transpose

KLMultinomial Softmax Arithmetic(Scalar) Less Slice

Parameter LoopControl AddScalar LogicalAndScalar Stack

Parameter RepeatStart MulScalar LogicalOrScalar VATNoise

WorkingMemory RepeatEnd RSubScalar LogicalXorScalar Unlink

Basic ReccurentInput RDivScalar EqualScalar Identity

Affine ReccurentOutput PowScalar NotEqualScalar Comment

Convolution Delay RPowScalar GreaterEqualScalar Others(Pre Process)

Deconvolution Binary MaximumScalar GreaterScalar OneHot

Embed BinaryConnectAffine MinimumScalar LessEqualScalar RandomCrop

Pooling BinaryConnectConvolution Arthmetic(2 Inputs) LessScalar RandomFlip

MaxPooling BinaryWeightAffine Add2 LogicalNot RandomShift

AveragePooling BonaryWightConvolution Sub2 Validation MeanSubtraction

SumPooling BinaryTanh Mul2 BinaryError ImageAugmentation

Unpooling BinarySigmoid Div2 TopNError

Unit Pow2

LSTM Maximum2

Minimum2

演習補足資料

(29)

29

レイヤーの組み合わせ方

Input

から始まって、

Loss Function(

ネットワークの精度を評価する層

)

で終える。

Loss Function

とその直前のレイヤーは問題設定によって適宜修正する必要がある。

それ以前の部分に関しては、問題設定によらず使いまわすことが可能である。

Input

Loss Function

Affine Convolution MaxPooling

ReLU

適宜並べ替えて配置

一般的な配置方法分類問題の例

Input

Softmax

^{確率に変換}

Loss Function

回帰問題の例

SquaredError HuberLoss

※

Output

のサイズに調整

ネットワーク部分評価

Input

Loss Function Affine Affine

^※

Output

演習補足資料

ネットワーク

(30)

よく利用されるレイヤーの組み合わせ

ネットワークを作成する際は、レイヤーを組み合わせたセットを最小単位として考えることが多い。

Convolution

のセットの例

全結合

活性化関数

Affine

のセットの例

•

活性化関数は

tanh

•

活性化関数は

tanh

• Pooling

層は

SumPooling

など他を使う場合もある畳み込み

ダウンサンプリング活性化関数

演習補足資料

(31)

31

ネットワークを形成するレイヤー

約

100

種類のレイヤーが実装されており、これらを組み合わせてネットワークを作成する。

代表的なレイヤー（青枠で囲った部分）を次頁以降で説明する。

IO Activation Math Logical Others

Input Tanh Sum LogicalAnd BatchNormalization

Loss Sigmoid Mean LogicalOr Dropout

SquaredError Abs Prod LogicalXor Concatenate

HuberLoss ReLU Max Equal Reshape

BinaryCrossEntropy CReLU Min NotEqual Broadcast

SigmidCrossEntropy PReLU Log GreaterEqual Flip

CategoricalCrossEntropy ELU Exp Greater Shit

SoftmaxCrossEntropy CELU Sign LessEqual Transpose

KLMultinomial Softmax Arithmetic(Scalar) Less Slice

Parameter LoopControl AddScalar LogicalAndScalar Stack

Parameter RepeatStart MulScalar LogicalOrScalar VATNoise

WorkingMemory RepeatEnd RSubScalar LogicalXorScalar Unlink

Basic ReccurentInput RDivScalar EqualScalar Identity

Affine ReccurentOutput PowScalar NotEqualScalar Comment

Convolution Delay RPowScalar GreaterEqualScalar Others(Pre Process)

Deconvolution Binary MaximumScalar GreaterScalar OneHot

Embed BinaryConnectAffine MinimumScalar LessEqualScalar RandomCrop

Pooling BinaryConnectConvolution Arthmetic(2 Inputs) LessScalar RandomFlip

MaxPooling BinaryWeightAffine Add2 LogicalNot RandomShift

AveragePooling BonaryWightConvolution Sub2 Validation MeanSubtraction

SumPooling BinaryTanh Mul2 BinaryError ImageAugmentation

Unpooling BinarySigmoid Div2 TopNError

Unit Pow2

LSTM Maximum2

Minimum2

演習補足資料

ネットワーク

(32)

レイヤー説明： Input

ネットワーク全体の入力層にあたるレイヤーである。

パラメータとして入力データのサイズを入力する必要がある。

指定したデータサイズと入力データのサイズが合わない場合、学習時にエラーが発生する。

データサイズの例表データ

ID

性別年齢居住地収入・・・購入

頻度

00001

男性

20

代東京

700

万高

00002

男性

30

代埼玉

600

万低

00003

女性

20

代東京

300

万中

00004

女性

10

代東京

NA

中

個人属性情報

100

カラム予測値

入力サイズ：

100

白黒画像

入力サイズ：

(1, 28, 28)

28

28 RGB

画像

入力サイズ：

(3, 256, 128)

256

128

演習補足資料

(33)

33

レイヤー説明： Affine

入力層の全ての値を用いた線形変換を行うレイヤーである。

Output

のサイズを任意に指定でき、レイヤーのサイズを自在に調整できる。

Output

の各セルは

Input

の全ての値が入力値として利用される。

𝒚 = 𝑾𝒙 + 𝒃

1

次元

→1

次元の例

2

次元

→2

次元の例

Input Output

ネットワーク

演習補足資料

出⼒ニューロンは全ての⼊⼒ニューロンの信号を受け取る

全結合層

(34)

レイヤー説明： Convolution

入力データを一定サイズごと順番に線形変換を行うレイヤーである。

画像の局所的な特徴を抽出可能である。

Input Output

※１枚の

layer

に対しては同じ変換

Output

の枚数

(OutMaps)

変換する⼊⼒

(カーネル)のサイズ (KernelShape)

カーネルの移動量

(Stride) 𝑦 = 1

!,$

𝑤 !$ 𝑥 !$ + 𝑏

演習補足資料

3x3

1

Padding

(1,1) 局所的なニューロンの⼊⼒を元に

出⼒ニューロンの値を求める

畳み込み層

(35)

35

レイヤー説明： Pooling

入力データを一定サイズごとに順に変換するレイヤーである。

カーネルのサイズと移動量をそろえて、画像サイズを圧縮することが一般的である。

Input

Output

Layer

^変換内容

MaxPooling

カーネルの中の最大値を取得

AveragePooling

カーネルの中の平均値を取得

SumPooling

カーネルの中の総和を取得

カーネルのサイズ

(KernelShape)

(Stride)

Pooling

層の種類

ネットワーク

演習補足資料

0 1 1 5 2 8 2 3 3 1 2 4 9 2 1 1

8 5

9 4

MaxPoolingの例

(36)

レイヤー説明： Activate (ReLU, Tanh)

インプットの各セルに対して、非線形変換

※

を行うレイヤーである。

ネットワークの途中に、この

Activate Function

を入れることが精度を出すためには必須である。

挿入する場所は

Convolution

層や

Pooling

層の後に挿入することが一般的である。

f(x 00 ) f(x 01 )

Tanh ReLU

f(x)=max(0, x) f(x)=tanh(x)

Input Output

x 00 x 01

演習補足資料

(37)

37

レイヤー説明： Softmax

入力層のそれぞれの値を各セルの確率に変換するレイヤーである。

出力層の各セルの値を

0

～

1

に、セルの総和を

1

にすることが可能である。

分類問題でのネットワークの最後に使用する。

1.0 -1.5

2.0 1.3 -1.7 -0.1 2.9

0 0.6 2.8

0.05 0.00 0.14 0.07 0.00 0.02 0.35 0.02 0.04 0.31

Softmax

𝑝 ! = 𝑒 " !

∑ # 𝑒 " "

入力層出力層

…

ネットワーク

演習補足資料

$

!

𝑝 ! = ∑ ! 𝑒 "

^!

∑ # 𝑒 "

^"

= 1

𝑝 !

𝑥 !

^{Softmax関数}

確率に変換

総和が１

(38)

レイヤー説明： Loss Function

予測値と真値との誤差で、ネットワークの性能の悪さを示す指数を出力するレイヤーである。

学習ではこれを小さくするようにパラメータをアップデートする。

𝐿 = 𝑥 − 𝑦 !

𝐿 = * 𝑥 − 𝑦 ! , 𝑥 − 𝑦 < 𝑑 𝛿 2 𝑥 − 𝑦 − 𝛿 , 𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒 𝐿 = −log(𝑥 " )

回帰問題の場合分類問題の場合

CategoricalCrossEntropy

𝑥 " :

真のクラスの予測確率

SquaredError HuberLoss

𝑥 :

予測値、

𝑦:

真の値

F(x) = -log(x) SquaredError

HuberLoss SquaredError

に比べて、

HuberLoss

のほうが外れ値に敏感でない

𝑥:

予測値、

𝑦:

真の値

演習補足資料

(39)

39

レイヤー説明： Dropout

確率

p

で各セルの値をゼロにする変換を行うレイヤーである。

特定のネットワークの学習を阻害でき、過学習に対して有効である。

学習時にのみ作用し、推論時には作用しない。

Dropout

層入力層出力層

Dropout

なし

Dropout

あり

確率的にネットワークを寸断する構造の概要

ネットワーク

(40)

レイヤー説明： BatchNormalization

入力層の値をバッチサイズごとに平均を

0

、標準偏差を

1

に規格化するレイヤーである。

ネットワークの学習プロセスを全体的に安定化させ、学習速度を高めることに寄与する。

𝜇 = 1

𝑀 1

!

𝑥 ! 𝜎 = 1

𝑀 1

!

𝑥 ! − 𝜇 <

8𝑥 ! = 𝑥 ! − 𝜇 𝜎 < + 𝜖 𝑦 = 𝛾 8𝑥 ! + 𝛽

ネットワーク

y 00 y 01

Input Output

x 00 x 01

(41)

41

レイヤー説明： Sigmoid

入力層の値を

0

～

1

に変換するレイヤーである。

確率値の回帰問題でのネットワークの最後に使用される。

Sigmoid

入力値出力値

…

-∞

～

∞ 0

～

1

𝑓(𝑥) = 1

1 + 𝑒 *+"

ネットワーク

(42)

ネットワーク構造の例（ LeNet5 ）

代表的なネットワークについても、レイヤーを組み合わせたセットで構成されている。

28×28

8×8×16 4×4×16 24×24×6

12×12×6

入力

出力

1 x 28 x 28 6 x 24 x 24 6 x 12 x 12 16 x 8 x 8 16 x 4 x 4 120

convolution maxpooling tanh convolution maxpooling tanh affine tanh

6 x 12 x 12 16 x 4 x 4

affine softmax

120 10 10

120 10 Convolution

Convolution

Affine +tanh

Affine +softmax Maxpooling

(sub sampling) + tanh

ネットワーク

Maxpooling

(sub sampling)

+ tanh

(43)

43

学習の実行

(44)

学習の実行

EDIT

ページで学習に使用するインスタンスを選択し、

Run

ボタンで学習が実行される。進捗や

結果は

TRAINING

ページで確認できる。

学習実行の方法

TRAINING

ページの概要

学習曲線

（縦軸

:

誤差、横軸

:

学習世代）

コアエンジンのログ出力

演習補足資料

(45)

45

学習曲線の読み方

Training

と

Validation

の両データの

Error

が低いことがよいモデルであると言える。

Training

の

Error

は低いものの、

Validation

の

Error

が高い状況を過学習と呼び、モデルが

Training

に特化しすぎて、汎化性能（未知のデータへの精度が高いこと）を失っている状態である。

Epoch

数

誤差

Epoch

数

誤差

Training Data

(学習に使用したデータ) Validation Data

(学習に使用しないデータ)

よいモデルの学習結果悪いモデルの学習結果（過学習）

学習が進むにつれて誤差が小さくなる

Training

と

Validation

の差が大きい

演習補足資料

ネットワーク

(46)

学習パラメータの設定

Global Config

ページにおいて、学習世代数とバッチサイズを設定できる。

学習曲線が収束していないと判断した場合には学習世代数を増やす。

バッチサイズは小さすぎるとパラメータ更新が頻発し、学習が非効率になる。

バッチサイズは一般に分類問題なら分類クラス数以上にする。

バッチサイズ

１回のパラメータ更新に使うデータ数

学習世代数

全学習データを使った時点で

1

世代と数える

ミニバッチ１ミニバッチ２ミニバッチM

Loss

を計算

バッチサイズごとに分割

Training Dataset

１世代の学習の仕組み学習パラメータの設定

Loss

が小さくなるようにパラメータを更新

※各世代ごとにランダムにミニバッチを取り直す

演習補足資料

(47)

47

パラメータの更新方法（学習方法）

ニューラルネットワークでは、乱数で初期化したパラメータ

W

をミニバッチ勾配降下法

（

Mini-Batch Gradient Descent

）で最適化するのが一般的である。

Forward→Backward→Update

を繰り返し、パラメータ

W

を最適化していく。

入力x

出力y

0 1 2 3 4 5 6 7 8 9

… … … …

1.

学習データからミニバッチ（

256

個程度のデータ）を取得

2.

用意したデータを用いて

Forward

計算を行い、現在のパラ

メータ

W

による出力

y

とロス（最小化したい値）

E

を求める

3. Backward

計算を（ロス

E

の逆伝播）行い、パラメータ

W

の勾

配

ΔW

を求める

4. Update

を行う（求めた勾配

ΔW

を元に

W

を更新）

2. Forward

（入力から出力を計算）

ロスE

3. Backward

（パラメータの勾配を計算）

パラメータ

W

パラメータの勾配

ΔW w

E

δE δW

𝑊 $%& ← 𝑊 $ -𝜂Δ𝑊 $

0 1 2 3 4 5 6 7 8 9

正解

演習補足資料

ネットワーク

(48)

評価の実行

(49)

49

評価の実行

TRAINING

ページの

Run

ボタンをクリックすると

EVALUTION

ページに遷移し結果を表示する。

各データに対するモデルの予測結果や統計的な精度や指数、混同行列などを確認できる。

評価実行の方法表示可能なグラフの概要

ネットワーク

評価グラフ内容問題

Output

Result

各データの１つ１つの判定結果

Confusion Matrix Classification

Result Classification

Matrix Likelihood

Graph

分類

/

回帰データセット全体の統計的な指標と混同行列分類各データの判定確率上位３カテゴリの確率

カテゴリごとのモデルの判定傾向判定確率と正答率の傾向

分類分類分類

演習補足資料

(50)

評価の見方： Output Result

検証用データ

(Dataset

タブの

Validation

データ

)

の右側に

Deep Learning

の予測結果が追記される。

1

つ

1

つの検証用データに対し、

Deep Learning

がどのように判断したかを確認できる。

Output Result

ページのスナップショットとその見方

検証用データから転記

Deep Learning

の予測結果

クリックして選択ページを変更し全て

の結果を確認可能

追記カラム名について

•

出力をアポストロフィー付きで表記例

:

学習時に

x → y

であれば、

y’

を出力

•

分類問題の場合にはさらに

index

を用い、

各クラスの予想確率を出力

例

: 2

値分類の場合、

y’__0

と

y’__1

を出力

ラベル

”0”

のラベル

”1”

の

演習補足資料

(51)

51

評価の見方： Confusion Matrix

検証用データに対する統計的な評価指標と混同行列を表示する。

混同行列を用いて、全体の正答数や間違いやすいラベルの傾向などを確認できる。

クリックして選択

Confusion Matrix

モデル全体の評価指標

混同行列

正解がラベル

”1”

のものを

”5”

と予想し、間違えた数が

3

個

y’(Deep Learning

が予想したラベル

)

y (

データ内のラベル

)

対角の数は正答数を表す

ネットワーク

演習補足資料

(52)

評価の見方： Classification Result

各データごとに

Deep Learning

が確率が高いと予測した上位３つのラベルと確率を表示する。

第１候補の確率を昇順でソートすれば、

Deep Learning

が判定困難なデータを確認できる。

Classification Result

クリックして選択ソート結果の

リセット

列の

↑

をクリックでソートが可能

第１候補のラベルと確率検証用データから

転記

Deep Learning

の予測結果

第２候補のラベルと確率

第３候補のラベルと確率

演習補足資料

(53)

53

評価の見方： Classification Matrix (Recall)

ラベルごとに

Deep Learning

が間違えた上位３つの誤判定のラベルと数を表示する。

Recall

では、データセット内の正解ラベルを軸に誤判定結果の確認できる。

（

Recall

）ページのスナップショットとその見方

クリックして選択

Recall

を選択

セルをクリックすると

誤判定データの詳細にジャンプデータ内の

ラベル正解数間違いやすい上位

3

件のラベルと件数

ネットワーク

演習補足資料

(54)

評価の見方： Classification Matrix (Precision)

ラベルごとに

Deep Learning

が間違えた上位３つの誤判定のラベルと数を表示する。

Precision

では、

Deep Learning

が判定したラベルを軸に誤判定結果の確認できる。

（

Precision

を選択

Deep Learning

が

判定したラベル正解数間違いやすい上位

3

件のラベルと件数

演習補足資料

(55)

55

plot

•

横軸：判定ラベルの予測確率（

0

～

1

）

•

縦軸：判定数（件）

normalized

•

横軸：判定ラベルの予測確率（

0

～

1

）

•

縦軸：正誤割合（％）

評価の見方： Likelihood Graph (Softmax)

スコアや確率ごとの判定結果により、各ラベルをどの程度分離できているかを確認できる。

Softmax

を用いた分類問題の場合には、判定ラベルの予測確率とその正答の対応を表示する。

（

Softmax

判定ラベルの予測確率が

1/(

ラベルの数

)

以下になることがないので、左側は表示がない

ネットワーク

演習補足資料

(56)

サンプルデータセットについて

(57)

57

手書き数字の分類

0

～

9

の手書き数字の画像データを分類するデータセットです。

機械学習の画像分類で一般的なデータセットで、アメリカ国勢調査局が収集した手書き文字データから数字を抽出したものです。

データセットの例

0

28ピクセル

入力出力

1

● ● ●

(58)

データセットの名称

Neural Network Console(

以下

NNC)

では

MNIST

に関して

6

つのデータセットを準備しています。

mnist.small_mnist_4or9

は

0

～

9

の数字のうち、

4

と

9

だけを抽出したデータセットです。

簡単に画像分類を体験したい場合には、こちらのデータセットをご利用ください。

学習用と検証用はデータの重複なく分割をしたセットになります。

#

^{データセット名称} ^説明

1 mnist.mnist_training MNIST

の学習用データセット

2 mnist.mnist_test MNIST

の検証用データセット

3 mnist.small_mnist_4or9_training MNIST

の

4

と

9

の２つにデータを減らした際の学習用データセット

4 mnist.small_mnist_4or9_test MNIST

の

4

と

9

の２つにデータを減らした際の検証用データセット

(59)

59

グーチョキパーの分類

じゃんけんのグー・チョキ・パーの手と、手がない状態の

4

つを分類するデータセットです。

Neural Network Console(

以下

NNC)

上では

sample.image.hand-sign

の名称で準備しております。

学習用

(training)

、検証用

(test)

には異なるデータがそれぞれ含まれています。。

0:

グー

28

ピクセル

出力

28

ピクセル

1:

チョキ

2:

パー

3:

手がない状態入力

(60)

ファッション画像の分類

ズボンやブーツ等の衣類の白黒画像を

10

種類に分類するデータセットです。

以下

NNC)

上では

fashion_mnist

学習用

(training)

、検証用

(test)

には異なるデータがそれぞれ含まれています。

データセットの例

0: T-shirt/top

28ピクセル

入力出力

1: Touser

・・・・・・

T-shirt/top

Trouser

Dress

Pullover

Coat

Sandal

Shirt

Sneaker

Bag

Ankle boot

(61)

61

印字数字の分類

印刷された

0

～

9

の数字とそれ以外を分類するデータセットです。

メーターの読み取り自動化のユースケースを想定して作られたものになります。

Neural Network Console(

以下

NNC)

上では

image_classification.digits.training

学習用

(training)

、検証用

(test)

には異なるデータがそれぞれ含まれています。

・・・

0: 0

の画像

28

ピクセル

出力

28

ピクセル

1: 1

の画像

10:

それ以外入力

・・・

(62)

植物と食べ物の分類

植物と食べ物の画像を分類するデータセットです。

以下

NNC)

上では

flower_food

学習用

(training)

、検証用

(test)

には異なるデータがそれぞれ含まれています。。

0: 植物

32ピクセル

入力出力

1: 食べ物

(63)

63

一般的な画像の分類 (10 分類のデータセット )

約

8000

万枚の画像データから

6

万枚を抽出し、飛行機、鳥、犬などの

10

種類の画像を分類したデータセットで、機械学習のベンチマークによく用いられるもの

(CIFAR-10)

です。

以下

NNC)

上では

CIFAR10.cifar10

として準備しております。

学習用

(training)

、検証用

(test)

はデータの重複がないように分割したデータセットになります。。

データセットの例

出典: Learning Multiple Layers of Features from Tiny Images, Alex Krizhevsky, 2009.

0: airplane

32ピクセル

入力出力

1: automobile

・・・・・・

(64)

一般的な画像の分類 (100 分類のデータセット )

前頁と同様の形式で、画像の分類数を

100

種類にしたデータセット

(CIFAR-100)

です。

NNC

上では

CIFAR100.cifar100

として準備しております。

学習用

(training)

、検証用

(test)

はデータの重複がないように分割したデータセットになります。

# ラベル

0 apple

1 aquarium fish 2 baby

3 bear 4 beaver 5 bed 6 bee 7 beetle 8 bicycle 9 bottle 10 bowl 11 boy 12 bridge 13 bus 14 butterfly 15 camel 16 can 17 castle 18 caterpillar

# ラベル

20 chair

21 chimpanzee 22 clock 23 cloud 24 cockroach 25 couch 26 crab 27 crocodile 28 cup 29 dinosaur 30 dolphin 31 elephant 32 flatfish 33 forest 34 fox 35 girl 36 hamster 37 house 38 kangaroo

# ラベル

40 lamp

41 lawn mower 42 leopard 43 lion 44 lizard 45 lobster 46 man 47 maple tree 48 motorcycle 49 mountain 50 mouse 51 mushroom 52 oak tree 53 orange 54 orchid 55 otter 56 palm tree 57 pear

58 pickup truck

# ラベル

60 plain 61 plate 62 poppy 63 porcupine 64 possum 65 rabbit 66 raccoon 67 ray 68 road 69 rocket 70 rose 71 sea 72 seal 73 shark 74 shrew 75 skunk 76 skyscraper 77 snail 78 snake

# ラベル

80 squirrel 81 streetcar 82 sunflower 83 sweet pepper 84 table

85 tank 86 telephone 87 television 88 tiger 89 tractor 90 train 91 trout 92 tulip 93 turtle 94 wardrobe 95 whale 96 willow tree 97 wolf 98 woman

CIFAR-100

のラベル一覧

(65)

65

データセットのアップロード

専用のアップローダからデータセットをアップロードする。

Neural Network Console

所定の

CSV

ファイルを指定することで、自動的に対応する画像などの

ファイルもアップロードされる。

1. “Dataset”

から

Upload Dataset

を選択

2.

アップローダをダウンロード

（

Windows / MacOS

）

3.

アップローダを用いてデータセット

CSV

ファイルとデータをアップロード

Upload Dataset

で表示されるトークンをアップローダに

Paste

し、アッ

プロードするデータセット

CSV

を指定して

Start

ボタンを押すことでアップロードを開始

ネットワーク

演習補足資料

(66)

アップロード用の CSV ファイルの準備

アップロード後に

Dataset

タブに表示される形式に沿って

CSV

ファイルを準備する必要がある。

画像や時系列データなどのファイルはローカルでの保存場所を指定する。

mnist.mnist_training.csv

x:image y:label

data/train/5/0001.jpg 5 data/train/0/0001.jpg 0 data/train/4/0001.jpg 4 data/train/1/0001.jpg 1

… …

準備する

CSV

ファイルの例データセット一覧へのアップロード後の例

CSV

のファイル名がデータ名になる

画像や時系列のファイルパス

演習補足資料

(67)

67

データセットの準備（画像データ）

入力

x

には画像ファイル名を指定

出力

y

には正解のカテゴリの

Index

を記述

1

行目＝ヘッダ変数名

[__

次元

Index][:

ラベル名

]

2

行目以降＝データ値

or

ファイル名

x

と

y

、

2

つの変数ヘッダ

データ

(2

行目以降

)

Neural Network

入力

x

画像

出力

y

カテゴリ

に対応したデータセットファイルは簡単なスクリプトで作成可能

画像認識機学習用データセットの例

Neural Network Console 所定の CSV ファイルフォーマットでデータセットを準備

※

は

2

バイト文字に対応していないため、

CSV

ファイル内やファイル名に漢字等を含まないようにする

演習補足資料

ネットワーク

(68)

ローカルディレクトリとの対応例

所定の

CSV

ファイルフォーマットは学習用と検証用に分ける。

分類用のラベルなどは事前に数値化しておく必要がある。

train.csv

test.csv

x y

data/train/dog/0001.jpg 0 data/train/dog/0002.jpg 0 data/train/dog/0003.jpg 0

data/train/cat/0001.jpg 1 data/train/cat/0002.jpg 1 data/train/cat/0003.jpg 1

……

x y

data/test/dog/0001.jpg 0 data/test/dog/0002.jpg 0 data/test/dog/0003.jpg 0

data/test/cat/0001.jpg 1 data/test/cat/0002.jpg 1 data/test/cat/0003.jpg 1

……

test.csv

画像分類の

CSV

ファイル作成の例

data train

0001 .jpg 0002

.jpg 0003 .jpg

^・・・

dog

0001

・・・

.jpg 0002

.jpg 0003 .jpg

・・・

cat

0001 .jpg 0002

.jpg 0003

・・・

.jpg

dog

0001 .jpg 0002

.jpg 0003 .jpg

test

cat

ラベルは事前に数値化

0: dog

、

1:cat

演習補足資料

ディープラーニングを使ってみる