當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【机器学习】 - keras学习 - 图片生成器ImageDataGenerator

發布時間：2023/12/10 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了【机器学习】 - keras学习 - 图片生成器ImageDataGenerator 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

函數原型：

keras.preprocessing.image.ImageDataGenerator(featurewise_center=False,samplewise_center=False,featurewise_std_normalization=False,samplewise_std_normalization=False,zca_whitening=False,zca_epsilon=1e-6,rotation_range=0.,width_shift_range=0.,height_shift_range=0.,shear_range=0.,zoom_range=0.,channel_shift_range=0.,fill_mode='nearest',cval=0.,horizontal_flip=False,vertical_flip=False,rescale=None,preprocessing_function=None,data_format=K.image_data_format())

用以生成一個batch的圖像數據，支持實時數據提升。訓練時該函數會無限生成數據，直到達到規定的epoch次數為止。

參數

featurewise_center：布爾值，使輸入數據集去中心化（均值為0）, 按feature執行
samplewise_center：布爾值，使輸入數據的每個樣本均值為0
featurewise_std_normalization：布爾值，將輸入除以數據集的標準差以完成標準化, 按feature執行
samplewise_std_normalization：布爾值，將輸入的每個樣本除以其自身的標準差
zca_whitening：布爾值，對輸入數據施加ZCA白化
zca_epsilon: ZCA使用的eposilon，默認1e-6
rotation_range：整數，數據提升時圖片隨機轉動的角度
width_shift_range：浮點數，圖片寬度的某個比例，數據提升時圖片水平偏移的幅度
height_shift_range：浮點數，圖片高度的某個比例，數據提升時圖片豎直偏移的幅度
shear_range：浮點數，剪切強度（逆時針方向的剪切變換角度）
zoom_range：浮點數或形如[lower,upper]的列表，隨機縮放的幅度，若為浮點數，則相當于[lower,upper] = [1 - zoom_range, 1+zoom_range]
channel_shift_range：浮點數，隨機通道偏移的幅度
fill_mode：；‘constant’，‘nearest’，‘reflect’或‘wrap’之一，當進行變換時超出邊界的點將根據本參數給定的方法進行處理
cval：浮點數或整數，當fill_mode=constant時，指定要向超出邊界的點填充的值
horizontal_flip：布爾值，進行隨機水平翻轉
vertical_flip：布爾值，進行隨機豎直翻轉
rescale: 重放縮因子,默認為None. 如果為None或0則不進行放縮,否則會將該數值乘到數據上(在應用其他變換之前)
preprocessing_function: 將被應用于每個輸入的函數。該函數將在圖片縮放和數據提升之后運行。該函數接受一個參數，為一張圖片（秩為3的numpy array），并且輸出一個具有相同shape的numpy array
data_format：字符串，“channel_first”或“channel_last”之一，代表圖像的通道維的位置。該參數是Keras 1.x中的image_dim_ordering，“channel_last”對應原本的“tf”，“channel_first”對應原本的“th”。以128x128的RGB圖像為例，“channel_first”應將數據組織為（3,128,128），而“channel_last”應將數據組織為（128,128,3）。該參數的默認值是~/.keras/keras.json中設置的值，若從未設置過，則為“channel_last”

?

方法1

方法

fit(x, augment=False, rounds=1)：計算依賴于數據的變換所需要的統計信息(均值方差等),只有使用featurewise_center，featurewise_std_normalization或zca_whitening時需要此函數。
- X：numpy array，樣本數據，秩應為4.在黑白圖像的情況下channel軸的值為1，在彩色圖像情況下值為3
- augment：布爾值，確定是否使用隨即提升過的數據
- round：若設augment=True，確定要在數據上進行多少輪數據提升，默認值為1
- seed: 整數,隨機數種子
flow(self, X, y, batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png')：接收numpy數組和標簽為參數,生成經過數據提升或標準化后的batch數據,并在一個無限循環中不斷的返回batch數據
- x：樣本數據，秩應為4.在黑白圖像的情況下channel軸的值為1，在彩色圖像情況下值為3
- y：標簽
- batch_size：整數，默認32
- shuffle：布爾值，是否隨機打亂數據，默認為True
- save_to_dir：None或字符串，該參數能讓你將提升后的圖片保存起來，用以可視化
- save_prefix：字符串，保存提升后圖片時使用的前綴, 僅當設置了save_to_dir時生效
- save_format："png"或"jpeg"之一，指定保存圖片的數據格式,默認"jpeg"
- yields:形如(x,y)的tuple,x是代表圖像數據的numpy數組.y是代表標簽的numpy數組.該迭代器無限循環.
- seed: 整數,隨機數種子

flow_from_directory(directory): 以文件夾路徑為參數,生成經過數據提升/歸一化后的數據,在一個無限循環中無限產生batch數據
- directory: 目標文件夾路徑,對于每一個類,該文件夾都要包含一個子文件夾.子文件夾中任何JPG、PNG、BNP、PPM的圖片都會被生成器使用.詳情請查看此腳本
- target_size: 整數tuple,默認為(256, 256). 圖像將被resize成該尺寸
- color_mode: 顏色模式,為"grayscale","rgb"之一,默認為"rgb".代表這些圖片是否會被轉換為單通道或三通道的圖片.
- classes: 可選參數,為子文件夾的列表,如['dogs','cats']默認為None. 若未提供,則該類別列表將從directory下的子文件夾名稱/結構自動推斷。每一個子文件夾都會被認為是一個新的類。(類別的順序將按照字母表順序映射到標簽值)。通過屬性class_indices可獲得文件夾名與類的序號的對應字典。
- class_mode: "categorical", "binary", "sparse"或None之一. 默認為"categorical. 該參數決定了返回的標簽數組的形式, "categorical"會返回2D的one-hot編碼標簽,"binary"返回1D的二值標簽."sparse"返回1D的整數標簽,如果為None則不返回任何標簽, 生成器將僅僅生成batch數據, 這種情況在使用model.predict_generator()和model.evaluate_generator()等函數時會用到.
- batch_size: batch數據的大小,默認32
- shuffle: 是否打亂數據,默認為True
- seed: 可選參數,打亂數據和進行變換時的隨機數種子
- save_to_dir: None或字符串，該參數能讓你將提升后的圖片保存起來，用以可視化
- save_prefix：字符串，保存提升后圖片時使用的前綴, 僅當設置了save_to_dir時生效
- save_format："png"或"jpeg"之一，指定保存圖片的數據格式,默認"jpeg"
- flollow_links: 是否訪問子文件夾中的軟鏈接

?

https://keras-cn.readthedocs.io/en/latest/preprocessing/image/

總結

以上是生活随笔為你收集整理的【机器学习】 - keras学习 - 图片生成器ImageDataGenerator的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：保管者“喝醉睡马路”：日本一市含所有市民
下一篇：老王师徒企盼《欧比旺》第二季