一、说明

本文训练一个网络模型来进行服装分类，比如衣服是T恤还是夹克。这可以快速入门了解TensorFlow2.0怎么进行分类任务的。

二、步骤

1. 引入 tf.keras

from __future__ import absolute_import, division, print_function, unicode_literals

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

2. 导入MNIST时装数据集

Fashion MNIST 包含了10类、70000张灰度图。这个数据集被打造为图像识别任务的Hello World程序。
数据集地址：
https://github.com/zalandoresearch/fashion-mnist
下面图片是一些图片示例（28*28像素）：

fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

执行代码，程序会自动下载数据集。

加载的数据集返回4个NumPy数组：

train_images , train_labels 数组：模型数据训练集
test_images,test_labes 数组：模型测试集

图像是28*28的NumPy数组，像素值从0-255。标是整数，0-9，下面是含义：

LabelClass0T-shirt/top1Trouser2Pullover3Dress4Coat5Sandal6Shirt7Sneaker8Bag9Ankle boot

下面定义标注名称：

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

3. 分析数据

通过train_images.shape可以查看训练模型的数据格式，这里会显示它是60000张图片的训练集，每个图片28*28像素：

查看len(train_labels) 训练标注：

类似的，也可以查看测试集。

4. 预处理数据

训练前要先把数据预处理。这里可以先试着看一张图片：

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

结果：

可以看到像素值是0-255。下面将值转换到0-1。训练集和测试集必须采用同样的处理方法。

train_images = train_images / 255.0
test_images = test_images / 255.0

下面显示25张图片，看看图片转换的结果：

5. 重点来了，创建神经网络模型

过程： 1. 配置；2.编译

i. 建顺序层

模型的基本单位是层。使用keras会比传统手工更容易创建一个层：

model = keras.Sequential([
 keras.layers.Flatten(input_shape=(28, 28)),
 keras.layers.Dense(128, activation='relu'),
 keras.layers.Dense(10, activation='softmax')
])

第1个层：tf.keras.layers.Flatten，将图片从2维(2828像素)数组，转成一维数组(2828=784像素)。这个层只是把数据平面化。
下面是两个tf.keras.layers.Dense层，它们称为紧密连接或全连接、或神经层。1层有128个神经节点，第二个有10节点的softmax激活函数，它返回 10个可能性分值，这些分值总和是1.每个节点都表示当前图片属于哪种分类的分值。

2. 编译模型

编译要定义三个参数：

损失函数
优化器
评估指标：用来监视训练和测试的步骤。下面是使用accuracy。

model.compile(optimizer='adam',
 loss='sparse_categorical_crossentropy',
 metrics=['accuracy'])

3. 训练模型，3个步骤：

输入训练数据
模型学习图片和标注间的规律
测试集测试

开始训练：

model.fit(train_images, train_labels, epochs=10)

训练过程中会显示损失值、准确度。

4. 测试集测试，看看训练的准确度怎么样

test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)

print('nTest accuracy:', test_acc)

5. 预测

这里使用测试集试试预测效果：

predictions = model.predict(test_images)

输出是一个数组，表示属于10种分类的可能性值。使用argmax取最大置信度的值：看看和标注值可一致：

print('predict = %i; label=%i' % (np.argmax(predictions[0]),test_labels[0]))

三、完整程序：

from __future__ import absolute_import, division, print_function, unicode_literals

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

train_images = train_images / 255.0
test_images = test_images / 255.0

model = keras.Sequential([
 keras.layers.Flatten(input_shape=(28, 28)),
 keras.layers.Dense(128, activation='relu'),
 keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
 loss='sparse_categorical_crossentropy',
 metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=10)

test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)

print('nTest accuracy:', test_acc)
predictions = model.predict(test_images)
print('predict = %i; label=%i' % (np.argmax(predictions[0]),test_labels[0]))

留言

一、 说明

二、步骤

三、完整程序：

一、说明