當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Keras入门实战（1）：MNIST手写数字分类

發布時間：2023/12/10 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了 Keras入门实战（1）：MNIST手写数字分类小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1)首先我們加載Keras中的數據集

2）網絡架構

3）選擇編譯(compile參數)

4）準備圖像數據

5) 訓練模型

6）測試數據

前面的博客中已經介紹了如何在Ubuntu下安裝Keras深度學習框架。

現在我們使用 Keras 庫來學習手寫數字分類。

我們這里要解決的問題是：將手寫數字的灰度圖像（28 像素×28 像素）劃分到 10 個類別中（0~9）。我們將使用 MNIST 數據集，它是機器學習領域的一個經典數據集，其歷史幾乎和這個領域一樣長，而且已被人們深入研究。這個數據集包含 60 000 張訓練圖像和 10 000 張測試圖像，由美國國家標準與技術研究院（National Institute of Standards and Technology，即 MNIST 中的 NIST）在 20 世紀 80 年代收集得到。你可以將“解決”MNIST 問題看作深度學習的“Hello World”。下圖為MNIST圖像數字樣本：

1)首先我們加載Keras中的數據集

Keras已經包含了很多數據集，我們本例子中的數據集也包含在其中：

[1]

from keras.datasets import mnist(train_images, train_labels), (test_images, test_labels) = mnist.load_data() 這里要多下載幾次才可能下載成功，不需要翻墻。

我們來看一下訓練集數據：

[2]

train_images.shape (60000, 28, 28)

這里顯示的是我們有60000個訓練樣本，其中每個樣本是28X28像素的圖像。

[3]

train_labels array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

這是訓練集的標簽。

接下來的工作流程如下：

首先，將訓練數據（train_images 和 train_labels）輸入神經網絡；
其次，網絡學習將圖像和標簽關聯在一起；
最后，網絡對 test_images 生成預測，而我們將驗證這些預測與 test_labels 中的標簽是否匹配。

2）網絡架構

[4]

from keras import models from keras import layers?network = models.Sequential() network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,))) network.add(layers.Dense(10, activation='softmax'))

神經網絡的核心組件是層（layer），它是一種數據處理模塊，你可以將它看成數據過濾器。進去一些數據，出來的數據變得更加有用。具體來說，層從輸入數據中提取表示——我們期望這種表示有助于解決手頭的問題。大多數深度學習都是將簡單的層鏈接起來，從而實現漸進式的數據蒸餾（data distillation）。深度學習模型就像是數據處理的篩子，包含一系列越來越精細的數據過濾器（即層）。

本例中的網絡包含 2 個 Dense 層，它們是密集連接（也叫全連接）的神經層。第二層（也是最后一層）是一個 10 路 softmax 層，它將返回一個由 10 個概率值（總和為 1）組成的數組。每個概率值表示當前數字圖像屬于 10 個數字類別中某一個的概率。

3）選擇編譯(compile參數)

其中用到的主要有以下三個參數：

損失函數（loss function）：網絡如何衡量在訓練數據上的性能，即網絡如何朝著正確的方向前進。
優化器（optimizer）：基于訓練數據和損失函數來更新網絡的機制。
在訓練和測試過程中需要監控的指標（metric）：本例只關心精度，即正確分類的圖像所占的比例。

[5]

network.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])

4）準備圖像數據

在開始訓練之前，我們將對數據進行預處理，將其變換為網絡要求的形狀，并縮放到所有值都在 [0, 1] 區間。比如，之前訓練圖像保存在一個 uint8 類型的數組中，其形狀為 (60000, 28, 28)，取值區間為 [0, 255]。我們需要將其變換為一個 float32 數組，其形狀為 (60000, 28 * 28)，取值范圍為 0~1。

[6]

train_images = train_images.reshape((60000, 28 * 28)) train_images = train_images.astype('float32') / 255?test_images = test_images.reshape((10000, 28 * 28)) test_images = test_images.astype('float32') / 255

我們還需要對標簽進行分類編碼。

[7]

from keras.utils import to_categoricaltrain_labels = to_categorical(train_labels) test_labels = to_categorical(test_labels)

5)訓練模型

現在我們準備開始訓練網絡，在 Keras 中這一步是通過調用網絡的 fit 方法來完成。

[8]

network.fit(train_images, train_labels, epochs=5, batch_size=128)

訓練過程中會顯示兩個數字：一個是網絡在訓練數據上的損失（loss），另一個是網絡在訓練數據上的精度（acc）。現在我們來檢查一下模型在測試集上的性能。

6）測試數據

[9]

test_loss, test_acc = network.evaluate(test_images, test_labels) print('test_acc:', test_acc)

這樣一個簡單的全連接神經網絡模型，精度為97%。第一個例子到這里就結束了。你剛剛看到了如何構建和訓練一個神經網絡，用不到 20 行的 Python 代碼對手寫數字進行分類。接下來我們需要學習張量（輸入網絡的數據存儲對象）、張量運算（層的組成要素）和梯度下降（可以讓網絡從訓練樣本中進行學習）。

總結

以上是生活随笔為你收集整理的Keras入门实战（1）：MNIST手写数字分类的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：全球首富马斯克神秘失踪一周了
下一篇：小姐姐上手OPPO Reno8鸢尾紫新配