當前位置：首頁 > 编程语言 > python >内容正文

python

python图像处理教程_Python基于Tensor FLow的图像处理操作详解

發布時間：2025/3/15 python 11 豆豆

生活随笔收集整理的這篇文章主要介紹了 python图像处理教程_Python基于Tensor FLow的图像处理操作详解小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文實例講述了Python基于Tensor FLow的圖像處理操作。分享給大家供大家參考，具體如下：

在對圖像進行深度學習時，有時可能圖片的數量不足，或者希望網絡進行更多的學習，這時可以對現有的圖片數據進行處理使其變成一張新的圖片，在此基礎上進行學習，從而提高網絡識別的準確率。

1、圖像解碼顯示

利用matplot庫可以方便簡潔地在jupyter內對圖片進行繪制與輸出，首先通過tf.gfile打開圖片文件，并利用函數tf.image.decode_jpeg將jpeg圖片解碼為三位矩陣，之后便可以通過matplot繪制與顯示圖片信息了

import matplotlib.pyplot as plt

import tensorflow as tf

import numpy as np

#讀取圖像文件

image_raw=tf.gfile.GFile('D:\Temp\MachineLearning\data\cat.jpeg','rb').read()

with tf.Session() as sess:

#對jpeg圖像解碼得到圖像的三位矩陣數據

image_data=tf.image.decode_jpeg(image_raw)

print(image_data.eval())

plt.imshow(image_data.eval())

plt.show()

可以看到打印的圖片三維矩陣信息和顯示的圖片：

????????????????????????????

2、圖像縮放

tensorflow還自帶了許多圖像處理函數，比如resize_image對圖片進行大小的縮放。其中第一個參數代表圖片數據源，第二個數組代表縮放后的大小，第三個method代表采用的縮放方法，默認0是雙線性插值法，1代表最近鄰插值法，2代表雙立方插值法，3代表像素區域插值法。

#對圖片大小進行縮放

image_resize=tf.image.resize_images(image_data,[500,500],method=0)

#tensorflow處理后的圖片是float32格式的，需要轉化為uint8才能正確輸出

image_resize=np.asarray(image_resize.eval(),dtype='uint8')

plt.imshow(image_resize)

plt.show()

3、圖像裁切

函數tf.image.resize_image_with_crop_or_pad可以在保證圖片原始比例的條件下對圖片進行裁切或填充。

函數tf.image.random_crop是隨機對圖片進行選取裁剪，而不是以中心。

#圖片裁剪

image_crop=tf.image.resize_image_with_crop_or_pad(image_data,500,500)

plt.imshow(image_crop.eval())

plt.show()

#隨機裁剪

img_random=tf.image.random_crop(image_data,[300,300,3])

plt.imshow(img_random.eval())

plt.show()

??????????????????????????????

resize_image_with_crop_or_pad第一個參數是圖片資源，后兩個參數是裁切后的圖片大小，當原始圖片大于目標值時將裁去兩邊多余部分，當圖片小于目標值時將用黑色填充，例如上圖左右被裁剪，上下用黑色填充。

random_crop第一個參數是圖片資源，第二個參數是一個三位張量，代表目標圖像大小。

4、圖像翻轉

通過函數實現圖片的上下、左右翻轉，在模型訓練時，可以將原本的樣本圖片進行反轉，作為新的特征值進行輸入供模型訓練。

#上下翻轉

img_down=tf.image.flip_up_down(image_data)

plt.imshow(img_down.eval())

plt.show()

#左右翻轉

img_left=tf.image.flip_left_right(image_data)

plt.imshow(img_left.eval())

plt.show()

5、調整對比度、明度、飽和度

通過tf.image.adjust_contrast可以對圖像對比度進行調整，當參數大于1代表加深，小于1代表減淡

tf.image.random_contrast可以在指定范圍內隨即調整對比度

類似的還有adjust_brightness、adjust_saturation、adjust_hue對明度、飽和度、色相進行調整

#加深對比度

img_deep=tf.image.adjust_contrast(image_data,2)

plt.imshow(img_deep.eval())

plt.show()

#降低對比度

img_fade=tf.image.adjust_contrast(image_data,0.5)

plt.imshow(img_fade.eval())

plt.show()

#隨機對比度

img_contrast=tf.image.random_contrast(image_data,0.5,2)

plt.imshow(img_contrast.eval())

plt.show()

6、對VGG網絡的輸入圖片進行處理

Vgg網絡訓練中傳入的圖片參數x_img是以batch_size為單位的四維數據，例如傳入20張32×32的3通道圖片，其數據為[20,32,32,3]。但是tensorflow的圖片處理函數只可以處理三維的單張圖片。因此需要首先通過split()函數將20張圖片拆分成單張[1,32,32,3]，再通過reshape()函數轉化為三維數據[32,32,3]，之后再調用圖片處理函數對圖片進行處理，將處理后的圖片恢復成四維，然后放在數組res_arr中，拼接成原來的一組20×32×32×3的數據。

# 將一批batch_size張圖片在第一維上切分為單張圖片

img_arr=tf.split(x_img,batch_size,axis=0)

res_arr=[]

# 遍歷每個圖片對其進行處理

for img in img_arr:

# 將單張四維的圖片[1,32,32,3]處理成三維[32,32,3]

img=tf.reshape(img,[32,32,3])

# 對單張圖片進行圖像增強

img_flip=tf.image.random_flip_left_right(img) # 翻轉圖片

img_bright=tf.image.random_brightness(img_flip,max_delta=63) # 隨機調整亮度

img_contrast=tf.image.random_contrast(img_bright,lower=0.2, upper=1.8) # 調整對比度

# 將增強后的圖片再變回原來的四維格式

img=tf.reshape(img_contrast,[1,32,32,3])

# 將每個處理后的圖片放在一個數組

res_arr.append(img)

# 將處理后的單個圖片重新拼接在一起

img_aug=tf.concat(res_arr,axis=0)

希望本文所述對大家Python程序設計有所幫助。

總結

以上是生活随笔為你收集整理的python图像处理教程_Python基于Tensor FLow的图像处理操作详解的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Adobe Reader 背景色修改
下一篇： eclipse lombok插件安装_你