c++读取图片_Pytorch读取,加载图像数据(一)
Pytorch讀取,加載圖像數據(一)
在學習Pytorch的時候,先學會如何正確創建或者加載數據,至關重要。
有了數據,很多函數,操作的效果就變得很直觀。
本文主要用其他庫讀取圖像文件(學會這個,你就可以在之后的學習中,將一些效果直觀化)
更好的文章組織結構:
- Github
- 關注公眾號:tuduisuinian(土堆碎念),菜單底部可以獲取pytorch教程PDF文檔
零:準備
加載數據前,需要掌握正確的讀取路徑方法。很多教程中的例子,在講解的時候,沒有提供圖片,或者讀者不知道修改教程中的讀取路徑,打擊了熱情。
**建議:為了保證大家可以跟著教程一步一步練習,教程中會出現示例圖片,建議大家右鍵-另存為圖片,將圖片保存到 你運行程序的文件夾 中。**如下圖:
壹:數據集的準備
任務:我們用不同的方式讀取這兩張圖片(記得右鍵-另存為圖片,保存到程序所在位置,記得文件重命名為你喜歡的方式,我的重命名為002.jpg和003.jpg
將文件另存為后,同時新建一個python文件,我的效果如下:
接下來,我們就可以在load_images.py中,進行相關操作了。
貳:用其他庫讀取圖像文件
- 使用matplotlib庫進行圖像的讀取
matplotlib中的函數跟Matlab很像。
我們需要使用matplotlib.pyplot中的函數:
imread(文件地址):進行讀取圖像的操作(參數為讀取圖像文件的路徑)
imshow(數組):進行圖像的顯示操作(顯示圖像的數組)
show():顯示一個窗口,用于顯示圖像(很多時候,不顯示圖像的話,是忘記使用這個函數)
我們嘗試探討,圖像被讀取后的數據類型,大小形狀
import matplotlib.pyplot as pltimg = plt.imread('002.jpg')#圖片的高H為460,寬W為346,顏色通道C為3print(img.shape)print(img.dtype)print(type(img))plt.imshow(img)plt.show()復制代碼輸出為:
(460, 346, 3)uint8復制代碼結論:imread讀取的圖片為numpy.ndarry的數組,數組的大小排列為:高×寬×通道數,數組的數據類型是uint8,即每個數據的大小為[0,255]
如果不想手動進行多圖像的讀取,需要使用到Python的文件,路徑操作等。暫不介紹
手動添加的話,就是用[array1,array2]這種形式,將數組進行連接
import matplotlib.pyplot as pltimg1 = plt.imread('002.jpg')img2 = plt.imread('003.jpg')img = [img1, img2]for i in img: plt.imshow(i) plt.show()復制代碼- 使用cv2進行圖像的讀取
在cv2庫中,需要用到的函數有:
imread(文件地址):讀取地址處的文件圖像
imshow('窗口名稱', 圖像數組):將圖像數組顯示出來,但必須結合waitKey()使用,否則無法顯示圖像
waitKey(延遲時間):需要設置延遲時間,當延遲時間≤0時,窗口將會一直延遲,延遲無窮長時間,按下任一按鍵,可以繼續執行下面程序。當延遲時間>0,即窗口圖像會顯示對應毫秒后,自動消失。
import cv2img1 = cv2.imread('002.jpg')print(img1.shape)print(img1.dtype)print(type(img1))cv2.imshow('img', img1)cv2.waitKey(0)復制代碼輸出為:
(460, 346, 3)uint8復制代碼結論:imread讀取的圖片為numpy.ndarry的數組,數組的大小排列為:高×寬×通道數,數組的數據類型是uint8`,即每個數據的大小為[0,255]
Matplotlib與cv2對圖像的數據格式的處理是相似的,但是也是有區別的:
對于通道的讀取,cv2是按BGR的順序讀入,而matplotlib按RGB的順序讀入
- 使用PIL庫進行圖像處理
PIL全稱為Python Image Library。是給Python提供圖像處理相關的庫。
需要使用到的函數:
open(文件地址):打開文件,注意是打開,并沒有讀取。主要作用是保持檢查文件地址,同時保證文件是打開的狀態。當對圖像處理的時候,會自動加載。
show():使用系統自帶的圖像查看器,查看圖像
from PIL import Imageimg1 = Image.open('002.jpg')# 因為PIL有自己的數據結構,所以沒有shape,dtype屬性# print(img1.shape)# print(img1.dtype)print(type(img1))img1.show()復制代碼輸出為:
復制代碼我們可以使用numpy.array()函數,將PIL結構的數據轉換成numpy數組。
import matplotlib.pyplot as pltfrom PIL import Imageimport numpy as npimg1 = Image.open('002.jpg')img1 = np.array(img1)print(img1.shape)print(img1.dtype)plt.imshow(img1)plt.show()復制代碼輸出:
(460, 346, 3)uint8復制代碼可以看到,PIL轉換成numpy后,數據類型是uint8的。
叁:總結
主要介紹了使用matplotlib,cv2,PIL庫進行圖像文件的讀取
- matplotlib中的imread,imshow,show函數
- cv2中的imread,imshow,waitKey函數
- PIL中的open,show函數
總結
以上是生活随笔為你收集整理的c++读取图片_Pytorch读取,加载图像数据(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python中什么是算法_python自
- 下一篇: pytorch安装换源ubuntu_ub