第八章经典卷积神经网络v2

第八章：
经典卷积神经网络
学习目标狗熊会 | 深度学习入门
1 ． LeNet-5 的网络结构及其代码实现；
2 ． AlexNet 的网络结构及其代码实现；
3 ． VGG 的网络结构及其代码实现；
4 ． Batch Normalization 的原理与应用技巧；
5 ． Data Augmentation 的原理与应用技巧。
狗熊会｜聚数据英才，助产业振兴
PART 8.1
LeNet-5
8.1.1 LeNet-5 网络结构狗熊会 | 深度学习入门
 LeNet-5 介绍：
 由 Yann LeCun （杨立昆）于 1998 年提出的一种经典的卷积网络结构。
 第一个成功应用于数字识别问题的卷积神经网络。
 LeNet-5 网络结构：共 7 层
 输入层
 卷积层
 池化层
 卷积层
 池化层
 全连接层
 输出层
输入层： 32*32 的图片，输入层相当于需要 1024 个神经元
输入图片： 32*32
卷积核大小： 5*5
卷积核种类： 6
输出 featuremap 大小： 28*28 / （ 32-5+1 ） =28
神经元数量： 28*28*6
可训练参数：（ 5*5+1) * 6 （每个滤波器 5*5=25 个 unit 参数和一个 bias 参数，一共 6 个滤波器）
连接数：（ 5*5+1 ） *6*28*28=122304
详细说明：
对输入图像进行第一次卷积运算（使用 6 个大小为 5*5 的卷积核），得到 6 个 C1 特征图（ 6 个大小为 28*28 的 feature maps,
32-5+1=28 ）。卷积核的大小为 5*5 ，总共就有 6* （ 5*5+1 ） =156 个参数，其中 +1 是表示一个核有一个 bias 。对于卷积层
C1 ， C1 内的每个像素都与输入图像中的 5*5 个像素和 1 个 bias 有连接，所以总共有 156*28*28=122304 个连接（ connection ）。
1
有 122304 个连接，但是只需要学习 156 个参数，主要是通过权值共享实现的。 𝑛1
0
𝑛1
𝑛0
2 𝑛2
1
...
0
𝑛 ...
1024
1
𝑛28 ∗ 28 ∗6
6*5*5
输入： 28*28
采样区域： 2*2
采样方式： 4 个输入相加，乘以一个可训练参数，再加上一个可训练偏置，最后通过 sigmoid 函数
种类： 6
输出 featureMap 大小： 14*14 （ 28/2 ）
神经元数量： 14*14*6
连接数：（ 2*2+1 ） *6*14*14

S2 中每个特征图的大小是 C1 中特征图大小的 1/4 。
训练参数：对一张特征图进行上述池化操作需要的参数只有 2 个，总共需要 6x2=12 个参数
训练参数 6x2=12 个参数
20w1+b1 30w1+b1 6w2+b2 8w2+b2 xw6+b6 xxw6+b6
112w1+b1 37w1+b1 3w2+b2 4w2+b2 yw6+b6 yyw6+b6

C3 层：卷积层，卷积核 size=5*5 ，得到新的图片大小为 14-5+1=10 ； 16 个卷积
核；
最后得到特征图 10*10*16
其中纵轴代表的是 S2 池化层输出的 6 张特征图，横轴代表的是 C3 卷积层的 16 个卷积核。这张表按照列可以分为 4 组，

分别用不同颜色的方框框出来了。其中绿色部分代表的是 C3 层中的前 6 个卷积与 S2 层中的连续的 3 张特征图相连，
蓝色部分代表的是 C3 层中的 6 、 7 、 8 号卷积核与 S2 层中连续的 4 张特征图相连，红色部分代表的是 C3 层中的 9 、
10 、 11 、 12 、 13 、 14 号卷积核与 S2 层中不连续的 4 张特征图相连，黄色部分代表的是 C3 层中的最后一个卷积核
与 S2 层中所有特征图相连。
对于绿色部分， C3 中一个卷积核要对 3 张特征图进行卷积操作，一共有 6 个卷积核，故总共包含 (5x5x3+1)x6=456 个
参数，同理，蓝色和红色部分总共 (5x5x4+1)x9 = 909 个参数，黄色部分 (5x5x6+1)x1=151 个参数。总共
456+909+151=1516 个参数。总共包含 10x10x1516=151600 个连接。
输入： 10*10
采样区域： 2*2
采样方式： 4 个输入相加，乘以一个可训练参数 w ，再加上一个可训练偏置 b 。结

果通过 sigmoid
采样种类： 16
输出 featureMap 大小： 5*5/ （ 10/2 ）
神经元数量： 5*5*16=400
连接数： 16* （ 2*2+1 ） *5*5=2000
训练参数： 2*16 ；
详细说明： S4 是 pooling 层，窗口大小仍然是 2*2 ，共计 16 个 feature map ， C3 层

的 16 个 10x10 的图分别进行以 2x2 为单位的池化得到 16 个 5x5 的特征图。有
5x5x5x16=2000 个连接。连接的方式与 S2 层类似。
C5 层 - 卷积层
输入： S4 层的全部 16 个单元特征 map （与 s4 全相连）
卷积核大小： 5*5
卷积核种类： 120
输出 featureMap 大小： 1*1 （ 5-5+1 ）
连接： 120* （ 16*5*5+1 ） =48120
详细说明： C5 层是一个卷积层。由于 S4 层的 16 个图的大小为 5x5 ，与卷积核的大
小相同，所以卷积后形成的图的大小为 1x1 。这里形成 120 个卷积结果。每个都与上
一层的 16 个图相连。所以共有 (5x5x16+1)x120 = 48120 个参数，同样有 48120 个连接。
C5 层的网络结构如下：
......
K1 K2 K120
F6 层 - 全连接层
输入： c5 120 维向量
计算方式：计算输入向量和权重向量之间的点积，再加上一
个偏置，结果通过 sigmoid 函数输出。
可训练参数 :84*(120+1)=10164
详细说明： F6 层是全连接层。 F6 层有 84 个节点，对应于一个 7x12 的比特图， -

1 表示白色， 1 表示黑色，这样每个符号的比特图的黑白色就对应于一个编码。
该层的训练参数和连接数是 (120 + 1)x84=10164 。 ASCII 编码图如下
Output 层也是全连接层，共有 10 个节点，分别代表数字 0 到 9 ，且如果节点 i 的值
为 0 ，则网络识别的结果是数字 i 。采用的是径向基函数（ RBF ）的网络连接方式。
假设 x 是上一层的输入， y 是 RBF 的输出，则 RBF 输出的计算方式是
上式 w_ij 的值由 i 的比特图编码确定， i 从 0 到 9 ， j 取值从 0 到 7*12-1 。 RBF 输出

的值越接近于 0 ，则越接近于 i ，即越接近于 i 的 ASCII 编码图，表示当前网络输入的
识别结果是字符 i 。该层有 84x10=840 个参数和连接。
8.1.2 案例： LeNet-5 手写数字识狗熊会 | 深度学习入门
别
 MNIST 数据集展示： mnist.load_data() 加载数据集
 数据预处理输出：
(60000, 28,
 LeNet-5 代码实现
28)
 LeNet-5 编译运行
from Keras.datasets import mnist
(X0,Y0),(X1,Y1) =
mnist.load_data()
print(X0.shape)
from matplotlib import pyplot as
plt
plt.figure()
fig,ax = plt.subplots(2,5)
ax=ax.flatten()
for i in range(10):
Im=X0[Y0==i][0]
ax[i].imshow(Im)
plt.show();
8.1.2 案例： LeNet-5from
手写数字识
Keras.utils import 狗熊会 | 深度学习入门
别
np_utils
N0=X0.shape[0];N1=X1.shape[0]
 MNIST 数据集展示 print([N0,N1])
X0 =
 数据预处理 X0.reshape(N0,28,28,1)/255
X1 =
 LeNet-5 代码实现 X1.reshape(N1,28,28,1)/255
YY0 =
np_utils.to_categorical(Y0)
YY1 =
np_utils.to_categorical(Y1)
print(YY1)
输出：
[60000, 10000]
[[0 0 0 ... 1 0 0]
[0 0 1 ... 0 0 0]
[0 1 0 ... 0 0 0]
...
[0 0 0 ... 0 0 0]
[0 0 0 ... 0 0 0]
[0 0 0 ... 0 0 0]]
别
 MNIST 数据集展示
from Keras.layers import
 数据预处理 Conv2D,Dense,Flatten,Input,MaxPooling2D
 LeNet-5 代码实现 from Keras import Model
 LeNet-5 编译运行 input_layer = Input([28,28,1])

x = input_layer
x = Conv2D(6,[5,5],padding = "same", activation = 'relu')(x)
x = MaxPooling2D(pool_size = [2,2], strides = [2,2])(x)
x = Conv2D(16,[5,5],padding = "valid", activation = 'relu')(x)
x = MaxPooling2D(pool_size = [2,2], strides = [2,2])(x)
x = Flatten()(x)
x = Dense(120,activation = 'relu')(x)
x = Dense(10,activation = 'softmax')(x)
output_layer=x
model=Model(input_layer,output_layer)
model.summary()
别输出维度参数个数
 数据预处理输入层
 LeNet-5 代码实现卷积层
 模型结构展示 1
池化层
 LeNet-5 编译运行 1
卷积层
池化层2
2
拉直操作
全连接层 1
全连接层 2
全连接层 3
别
 数据预处理
 LeNet-5 代码实现
 通过 model.compile 实现
model.compile(loss='categorical_crossentropy', optimizer='adam',
metrics=['accuracy'])
model.fit(X0, YY0, epochs=10, batch_size=200, validation_data=[X1,YY1])
PART 8.2
AlexNet
8.2.1 AlexNet 网络结构狗熊会 | 深度学习入门
 AlexNet 介绍：
 ImageNet 竞赛冠军获得者 Hinton 和他的学生 Krizhevsky Alex 于 2012 年设计。
 ImageNet 竞赛中第一个使用卷积神经网络的参赛者。
 AlexNet 网络结构： 8 层
 卷积层
 池化层
 卷积层
 池化层
 卷积层
 卷积层
 卷积层
 池化层
 输出层：三个全连接层
8.2.2 AlexNet 创新点狗熊会 | 深度学习入门
 AlexNet 创新点：
 成功使用 ReLU 作为 CNN 的激活函数；
 使用 Dropout 随机忽略一部分神经元，避免模型过拟合；
 在 CNN 中使用重叠的最大值池化 ( 步长小于卷积核 ) ；
 提出局部响应归一化层（ Local Response Normalization ， LRN ），后逐渐被 BN （ Batch
Normalization ）代替；
 使用 CUDA 加速神经网络的训练，利用了 GPU 强大的计算能力；
 采用了数据增强（ Data Augmentation ）技术，达到增加样本量的目的。
 克服梯度消失的问题
 加快训练速度
Dropout ：指深度学习训练过程中，对于神经网络训练单元，按照一定的概率将其
从网络中移除，注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一
个 mini-batch 都在训练不同的网络
神经网络在开始的时候并为了获得更多的数据，微
不是那么聪明。比如，一小的改变：旋转（ flips ）、
个欠训练的神经网络会认移位（ translations ）、旋
转（ rotations ）等微小的
为这三个如下的网球是不
改变
同、独特的图片。
8.2.3 案例：中文字体识别——隶书和行楷狗熊会 | 深度学习入门
 数据准备
 二分类问题
 对数据的存储目录结构是有特殊要求
 构造数据生成器
 AlexNet 代码实现
 AlexNet 编译运行
 数据准备
 构造数据生成器：一种特有的数据读入方法。按照特定的目录结构和要求把相应少量的、多批次的数据读
入内存，做相应的数据分析。
 代价：时间的延长和效率的降低
 优点：有限的内存资源的支持下，处理非常大的数据
 代码： ImageDataGenerator()
 数据准备
from Keras.preprocessing.image import ImageDataGenerator
 数据生成器 IMSIZE=227
validation_generator = ImageDataGenerator(rescale=1./255).flow_from_directory(
 AlexNet 代码实现 './data_alex/ChineseStyle/test/',
target_size=(IMSIZE, IMSIZE),
 AlexNet 编译运行 batch_size=200,
class_mode='categorical')
train_generator = ImageDataGenerator(rescale=1./255).flow_from_directory(
'./data_alex/ChineseStyle/train',
batch_size=200,
from matplotlib import pyplot as plt

 数据准备
plt.figure()
 构造数据生成器 fig,ax = plt.subplots(2,5)
fig.set_figheight(7)
 输出图像 fig.set_figwidth(15)
 AlexNet 代码实现 ax=ax.flatten()
X,Y=next(validation_generator)
 AlexNet 编译运行 for i in range(10): ax[i].imshow(X[i,:,:,:])
from Keras.layers import Activation,Conv2D, BatchNormalization, Dense

 数据准备 from Keras.layers import Dropout, Flatten, Input, MaxPooling2D, ZeroPadding2D
from Keras import Model
IMSIZE = 227
 AlexNet 代码实现 input_layer = Input([IMSIZE,IMSIZE,3])
x = input_layer
 AlexNet 编译运行 x = Conv2D(96,[11,11],strides = [4,4], activation = 'relu')(x)
x = MaxPooling2D([3,3], strides = [2,2])(x)
x = Flatten()(x)
x = Dropout(0.5)(x)
x = Dropout(0.5)(x)
x = Dense(2,activation = 'softmax')(x)
output_layer=x
model.summary()
输出维度参数个数
 数据准备
 模型结构展示
Dropout 操作
 数据准备
from Keras.optimizers import Adam
model.compile(loss='categorical_crossentropy',optimizer=Adam(lr=0.001),metrics=['accuracy
'])
model.fit_generator(train_generator,epochs=20,validation_data=validation_generator)
PART 8.3
VGG
8.3.1 VGG 网络结构狗熊会 | 深度学习入门
 VGG 介绍
 牛津大学计算机视觉组和 DeepMind 公
司共同研发的一种深度卷积神经网络
 VGG 网络结构： 6 种
 从左到右深度越来越深
 加粗体表示新增的层
 所有网络结构都包含 5 组卷积操作，每组卷积
包含一定数量的卷积层——可以看作一个五阶
段的卷积特征提取。
 VGG16 网络结构： 5 组卷积组和 3 个全连接层

 输入层： 224×224×3 的彩色图像。
 第 1 组卷积层（ 2 次卷积）： Conv2D(3×3 ， 64), Stride(1), same, ReLU, Output:
224×224×64 。
 第 1 个池化层： MaxPooling2D(2×2), Stride(2), Output: 112×112×64 。
112×112×128 。
 第 2 个池化层： MaxPooling2D(2×2), Stride(2), Output: 。
56×56×256 。
28×28×512 。
 VGG16 网络结构： 5 组卷积组和 3 个全连接层
8.3.2 案例：加利福尼亚理工学院鸟类数据库分类狗熊会 | 深度学习入门
 数据准备与处理
 数据生成器生成训练集与测试集
 VGG16 代码实现 from Keras.preprocessing.image import ImageDataGenerator
 VGG16 编译运行 IMSIZE = 224
train_generator = ImageDataGenerator(
 VGG16 + BN 代码实现 rescale=1. / 255).flow_from_directory(
'./data_vgg/train',
batch_size=100,
validation_generator = ImageDataGenerator(
rescale=1. / 255).flow_from_directory(
'./data_vgg/test',
batch_size=100,
 数据准备与处理 plt.figure()
fig, ax = plt.subplots(2, 5)
fig.set_figheight(6)
 图像展示 fig.set_figwidth(15)
ax = ax.flatten()
 VGG16 代码实现 X, Y = next(validation_generator)
for i in range(10):
 VGG16 编译运行
ax[i].imshow(X[i, :, :, ])
 VGG16 + BN 代码实现
 VGG16 代码实现
 VGG16 结构展示
from Keras.optimizers import Adam

model_vgg16.compile(loss='categorical_crossentropy',optimizer=Adam(lr=0.001),
metrics=['accuracy'])
model_vgg16.fit_generator(train_generator,epochs=20,validation_data=validation_generat
or)
 为了提高分类的准确率，可以尝试在每一层进行 Batch Normalization 的操作
x = BatchNormalization(axis=3)
 代码示例： (x)
PART 8.4
Batch Normalization 的技巧
8.4.1 Batch Normalization 的核心思想狗熊会 | 深度学习入门
存在问题：感官系统失效了。
8.4.1 Batch Normalization 的核心思想狗熊会 | 深度学习入门
 Batch ：只使用训练集中的一小部分样本对模型权重进行一次反向传播的参数更新，这一小部分样本被称
作 batch ，也称之为批次。
 Batch Normalization 的核心思想：
8.4.2 带有 BN 的逻辑回归狗熊会 | 深度学习入门
 数据准备与展示
from keras.preprocessing.image import ImageDataGenerator
 猫狗图像分类数据
IMSIZE=128
 带有 BN 的逻辑回归模型 validation_generator =
ImageDataGenerator(rescale=1./255).flow_from_directory(
'./data_bn/CatDog/validation',
batch_size=200,
train_generator =
ImageDataGenerator(rescale=1./255).flow_from_directory(
'./data_bn/CatDog/train',
batch_size=200,
 猫狗图像分类数据
 展示图像
 带有 BN 的逻辑回归模型
from keras.layers import Flatten,Input,BatchNormalization,Dense

from keras import Model
input_layer=Input([IMSIZE,IMSIZE,3])
x=input_layer
x=BatchNormalization()(x)
x=Flatten()(x)
x=Dense(2,activation='softmax')(x)
output_layer=x
model1=Model(input_layer,output_layer)
model1.summary()
 带有 BN 的逻辑回归模型与拟合
from keras.optimizers import Adam

model1.compile(loss='categorical_crossentropy',optimizer=Adam(lr=0.01),metrics= ['accuracy'])
model1.fit_generator(train_generator,epochs=200,validation_data=validation_generator)
8.4.3 带有 BN 的宽模型狗熊会 | 深度学习入门
 宽模型用了很多个卷积核，即较深的卷积通道。
 具体代码和 8.4.2 章节的逻辑回归差不多，唯一的区别是增加了两行：
 卷积操作。使用 100 个大小为的卷积核进行 valid 卷积；
 池化操作，进行规格大小为的最大值池化。
8.4.4 带有 BN 的深度模型狗熊会 | 深度学习入门
 这个模型中，卷积核的个数减少，但是模型的层数增加。
 BN 总结：
 Batch Normalization 在很多情况下确实是帮助巨大的，但并不是对所有情况都有帮助。在什么情况
下 Batch Normalization 能够让结果变好，在什么情况下没有帮助是不清楚的，是值得我们思考和
研究的。
PART 8.5
Data Augmentation 的技巧
8.5 Data Augmentation 的技巧狗熊会 | 深度学习入门
 Data Augmentation 被翻译成“数据增强”，或者“数据增广”。

 它通过对数据施加各种变换来达到增加样本量的目的。
 数据增强是深度学习中除了 Batch Normalization 外另一个非常常用的技巧。
8.5.1 Data Augmentation 的核心思想狗熊会 | 深度学习入门
 人和计算机处理图像不同。原来的图像被
拉伸、变换或旋转，对计算机而言都是一
个全新的矩阵。
 计算机对图像数据用矩阵形式表达不充分。
 把一张图像变成矩阵的过程中，是有信息
损失的，而这些损失的信息很宝贵，有可
能帮助我们把模型做得更好。
8.5 狗熊会 | 深度学习入门
Flip Rotation Scaling
Croping translation GAN/Noise
8.5.2 案例：猫狗分类狗熊会 | 深度学习入门
 数据生成器生成测试集
 利用数据增强技术生成的训练集
 展示数据增强后的图像
 模型搭建
 模型的编译与拟合
from keras.preprocessing.image import ImageDataGenerator
IMSIZE=128
validation_generator = ImageDataGenerator(rescale=1./255).flow_from_directory(
'./data_bn/CatDog/validation',
batch_size=200,
 利用数据增强技术生成的训练集 train_generator = ImageDataGenerator(
rescale=1./255,
 shear_range 表示拉伸变换； shear_range=0.5,
rotation_range=30,
 rotation_range 用于定义图像左右旋转； zoom_range=0.2,
 zoom_range 用于定义图像放大或者缩小的比例； width_shift_range=0.2,
height_shift_range=0.2,
 width_shift_range 表示水平方向上平移的尺度； horizontal_flip=True).flow_from_directory(
'./data_bn/CatDog/train',
 height_shift_range 表示垂直方向上平移的尺度； target_size=(IMSIZE, IMSIZE),
 horizontal_flip=True 表示允许水平方向的翻转。 batch_size=200,
 模型搭建
 数据生成器生成测试集 plt.figure()
fig,ax = plt.subplots(2,5)
 利用数据增强技术生成的训练集 fig.set_figheight(6)
fig.set_figwidth(15)
 展示数据增强后的图像 ax=ax.flatten()
 模型搭建 X,Y=next(train_generator)
for i in range(10): ax[i].imshow(X[i,:,:,:])
 数据生成器生成测试集 IMSIZE=128
from keras.layers import BatchNormalization,Conv2D,Dense,Flatten,Input,
 利用数据增强技术生成的训练集 MaxPooling2D
from keras import Model
n_channel=100
 模型搭建 input_layer=Input([IMSIZE,IMSIZE,3])
x=input_layer
 模型的编译与拟合 x=BatchNormalization()(x)
for _ in range(7):
x=BatchNormalization()(x)
x=Conv2D(n_channel,[2,2],padding='same',activation='relu')(x)
x=MaxPooling2D([2,2])(x)
x=Flatten()(x)
x=Dense(2,activation='softmax')(x)
output_layer=x
model.summary()
 模型搭建
 模型搭建
from keras.optimizers import Adam

model.compile(loss='categorical_crossentropy',optimizer=Adam(lr=0.0001),metrics=['accuracy'])
model.fit_generator(train_generator,epochs=200,validation_data=validation_generator)
课后习题狗熊会 | 深度学习入门
 课后习题
 1 ．请给出不少于 3 个基于图像的分类问题，并简要描述出和。
 2 ． LeNet-5 虽然是一个非常经典的模型，但是不是意味着模型中的一些设定不能修改呢？比如卷积
核的数量、大小、层数等，请尝试修改，看看模型精度会有什么变化。
 3 ．本章介绍了 3 个经典的卷积神经网络的应用案例，请任选一个数据集，以一个逻辑回归模型作为
benchmark ，将其预测精度与其他 CNN 模型对比。
 4 ．本章学习了一些经典的 CNN 神经网络，尝试把原来的一些经典卷积神经网络使用 Batch
Normalization 改造，提高它的预测精度。有的经典神经网络已经考虑了 BN 技巧，那么那些没有考
虑到的，请读者尝试一下，看看效果是变好了，还是变差了。
 5 ．思考如果不做数据加强， 8.5.2 节的案例结果会怎么样？
THANK YOU 狗熊会

第八章 经典卷积神经网络v2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

第八章 经典卷积神经网络v2

Uploaded by

Copyright:

Available Formats

第八章：

连接数：（ 2*2+1 ） *6*14*14

训练参数 6x2=12 个参数

20w1+b1 30w1+b1 6w2+b2 8w2+b2 xw6+b6 xxw6+b6

112w1+b1 37w1+b1 3w2+b2 4w2+b2 yw6+b6 yyw6+b6

其中纵轴代表的是 S2 池化层输出的 6 张特征图，横轴代表的是 C3 卷积层的 16 个卷积核。这张表按照列可以分为 4 组，

采样方式： 4 个输入相加，乘以一个可训练参数 w ，再加上一个可训练偏置 b 。结

输出 featureMap 大小： 5*5/ （ 10/2 ）

连接数： 16* （ 2*2+1 ） *5*5=2000

详细说明： S4 是 pooling 层，窗口大小仍然是 2*2 ，共计 16 个 feature map ， C3 层

详细说明： F6 层是全连接层。 F6 层有 84 个节点，对应于一个 7x12 的比特图， -

上式 w_ij 的值由 i 的比特图编码确定， i 从 0 到 9 ， j 取值从 0 到 7*12-1 。 RBF 输出

 LeNet-5 编译运行 input_layer = Input([28,28,1])

from matplotlib import pyplot as plt

from Keras.layers import Activation,Conv2D, BatchNormalization, Dense

 VGG16 网络结构： 5 组卷积组和 3 个全连接层

 VGG16 网络结构： 5 组卷积组和 3 个全连接层

from matplotlib import pyplot as plt

from Keras.optimizers import Adam

 Batch Normalization 的核心思想：

from keras.layers import Flatten,Input,BatchNormalization,Dense

from keras.optimizers import Adam

 Data Augmentation 被翻译成“数据增强”，或者“数据增广”。

Flip Rotation Scaling

Croping translation GAN/Noise

from matplotlib import pyplot as plt

from keras.optimizers import Adam

You might also like

第八章经典卷积神经网络v2

第八章经典卷积神经网络v2

连接数：（ 22+1 ） 61414

连接数： 16* （ 22+1 ） 5*5=2000