python批量读取文件夹的图片并处理成模型输入格式
我們知道在訓練圖像模型時,需要從文件夾里讀取圖片。
這里演示下,怎樣從文件夾里批量讀取圖片,并處理成我們想要的
x,y 即特征和標簽。
輸入維度理解
以卷積神經網絡為例子。
我們知道卷積神經網絡conv2d輸入數據的形狀為(batch_size,height,width,depth),其中第一維表示圖像的batch大小,我們常設定為None,其他三個維表示圖像的各個屬性,即高度,寬度和深度。深度就是色彩通道的數量。例如,RGB圖像的深度為3,而灰度圖像的深度為1。
通俗理解。一張圖片。我們輸入的格式為(高,寬,通道)
即我們需要把圖片處理成相同的高寬。
以下面這個文件夾為例,圖片大小不一樣,有的12kB,有的不是,高寬肯定不一樣。
#python+opencv讀取文件圖片并處理
import os import numpy as np import cv2cat=[]#用于存儲x。 def ReFileName(dirPath):""":param dirPath: 文件夾路徑:return:"""# 對目錄下的文件進行遍歷for file in os.listdir(dirPath):# 判斷是否是文件if os.path.isfile(os.path.join(dirPath, file)) == True:c= os.path.basename(file)name = dirPath + '\\' + cimg = cv2.imread(name)img=cv2.resize(img,(100,100))#使尺寸大小一樣cat.append(img)dirPath = r"C:\Users\Shineion\Desktop\cat"#文件路徑 ReFileName(dirPath)#調用函數 cat=np.array(cat)#數據 print('輸入x.shape',cat.shape) biaoqian=[1 for i in range(len(cat))]#標簽處理 biaoqian=np.array(biaoqian)#標簽 print('輸入y.shape',biaoqian.shape)得到的是我們想要的x,y格式
.說明
注意:cv2.imread(name) 讀取的圖片絕對路徑name ,不能含有中文。中文報錯。
1.代碼里只讀取啦一種類別的圖片:貓,并將貓的標簽設置為數字1。
一般我們會將不同類別的圖片放在不同文件夾。讀取另外類型圖片就是重復上述步驟,并修改標簽數字。
2.如果是多種類型圖片放在同一個文件夾里,可以根據文件名來來選擇圖片,并存儲到不同數組(如代碼中的cat)。選擇文件名一般是根據正則。
正則鏈接:
python :re模塊基本用法
可能有幫助的鏈接:
python 批量修改圖片名(也可以用來批量修改文件名)
3.代碼里只讀取圖片,并未對圖片進行任何處理。如識別貓狗,肯定要消除背景 和顏色影響的。opencv里有很多方法,參考python3+opencv學習筆記匯總目錄(適合基礎入門學習)。
處理代碼直接加在 img=cv2.resize(img,(100,100))#使尺寸大小一樣 后面就可以。
不同任務處理方法不一樣。
4.其他類型的輸入數據格式。不一定都是(batch_size,height,width,depth)。
如一維輸入
自己最后改變數據維度就可以。
電氣專業(yè)的計算機小白,寫博文不容易。如果你覺得本文對你有用,請點個贊支持下。謝謝。
總結
以上是生活随笔為你收集整理的python批量读取文件夹的图片并处理成模型输入格式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: u盘里内容没有了怎么办 U盘数据突然丢失
- 下一篇: 为什么汽车不换机油的情况下每次滴一点新机