當前位置：首頁 > 编程语言 > python >内容正文

python

Python计算机视觉：第一章图像处理基础

發布時間：2025/3/21 python 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python计算机视觉：第一章图像处理基础小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

第一章圖像處理基礎

1.1 PIL-Python圖像庫

1.1.1 對圖片進行格式轉換

1.1.2 創建縮略圖

1.1.3 拷貝并粘貼區域

1.1.4 調整尺寸及旋轉

1.2 Matplotlib庫

1.2.1 畫圖、描點和線

1.2.2 圖像輪廓和直方圖

1.2.4 交互注釋

1.3 NumPy庫

1.3.1 圖像數組表示

1.3.2 灰度變換

1.3-3 調整圖像尺寸

1.3.3 直方圖均衡化

1.3.4 圖像平均

1.3.5 對圖像進行主成分分析

1.3.6 Pickle模塊

1.4 SciPy模塊

1.4.1 圖像模糊

1.4.2 圖像差分

1.4.3 形態學-物體計數

1.4.4 有用的SciPy模塊

1.5 更高級的例子：圖像降噪

1.1 PIL-Python圖像庫

PIL (Python Imaging Library)圖像庫提供了很多常用的圖像處理及很多有用的圖像基本操作。PIL庫下載地址[www.pythonware.com/products/pil/]。下面演示原書P001-Fig1-1讀入一幅圖片的例子：

# -*- coding: utf-8 -*- from PIL import Image from pylab import *# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14) figure()pil_im = Image.open('../data/empire.jpg') gray() subplot(121) title(u'原圖',fontproperties=font) axis('off') imshow(pil_im)pil_im = Image.open('../data/empire.jpg').convert('L') subplot(122) title(u'灰度圖',fontproperties=font) axis('off') imshow(pil_im)show()

運行上面的代碼，可以得出原書P002-Fig1-1中的前兩幅圖片，如下：更多關于PIL的實例，可以參閱PIL在線文檔[www .pythonware.com/library/pil/handbook/index.htm./]。

1.1.1 對圖片進行格式轉換

利用save()方法，PIL可以將圖片保存問很多不同的圖像格式。下面演示原書P002中對圖片進行轉換的例子。

# -*- coding: utf-8 -*- from PCV.tools.imtools import get_imlist #導入原書的PCV模塊 from PIL import Image import os import picklefilelist = get_imlist('../data/convert_images_format_test/') #獲取convert_images_format_test文件夾下的圖片文件名(包括后綴名) imlist = file('../data/convert_images_format_test/imlist.txt','w') #將獲取的圖片文件列表保存到imlist.txt中 pickle.dump(filelist,imlist) #序列化 imlist.close()for infile in filelist:outfile = os.path.splitext(infile)[0] + ".png" #分離文件名與擴展名if infile != outfile:try:Image.open(infile).save(outfile)except IOError:print "cannot convert", infile

上面convertimagesformat_test文件夾是譯者放的測試圖片，共24幅圖像，如下圖示，測試圖片全部為.jpg格式的。譯者在源代碼中添加了部分代碼以便將獲取的圖像文件名列表保存下來，同時將原來的所有圖像轉化為.png格式的圖像。注意，在載入模塊時，載入了原書的PCV模塊，關于PCV模塊的安裝，詳見[PCV模塊的安裝]運行上面代碼，可以得到轉化格式后的圖像，運行結果為：

1.1.2 創建縮略圖

利用PIL可以很容易的創建縮略圖，設置縮略圖的大小，并用元組保存起來，調用thumnail()方法即可生成縮略圖。創建縮略圖的代碼見下面。

1.1.3 拷貝并粘貼區域

調用crop()方法即可從一幅圖像中進行區域拷貝，拷貝出區域后，可以對區域進行旋轉等變換。關于拷貝、旋轉粘貼的代碼見下面。

1.1.4 調整尺寸及旋轉

要對一幅圖像的尺寸進行調整，可以調用resize()方法，元組中放置的便是你要調整尺寸的大小。如果要對圖像進行旋轉變換的話，可以調用rotate()方法。

下面代碼顯示上面提到的所有的圖像處理操作，即原圖顯示、RGB圖像轉為灰度圖像、拷貝粘貼區域、生成縮略圖、調整圖像尺寸、圖像旋轉變換的實例代碼：

# -*- coding: utf-8 -*- from PIL import Image from pylab import *# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14) figure()# 顯示原圖 pil_im = Image.open('../data/empire.jpg') print pil_im.mode, pil_im.size, pil_im.format subplot(231) title(u'原圖', fontproperties=font) axis('off') imshow(pil_im)# 顯示灰度圖 pil_im = Image.open('../data/empire.jpg').convert('L') gray() subplot(232) title(u'灰度圖', fontproperties=font) axis('off') imshow(pil_im)#拷貝粘貼區域 pil_im = Image.open('../data/empire.jpg') box = (100,100,400,400) region = pil_im.crop(box) region = region.transpose(Image.ROTATE_180) pil_im.paste(region,box) subplot(233) title(u'拷貝粘貼區域', fontproperties=font) axis('off') imshow(pil_im)# 縮略圖 pil_im = Image.open('../data/empire.jpg') size = 128, 128 pil_im.thumbnail(size) print pil_im.size subplot(234) title(u'縮略圖', fontproperties=font) axis('off') imshow(pil_im) pil_im.save('../images/ch01/thumbnail.jpg') #保存縮略圖# 調整圖像尺寸 pil_im = Image.open('../data/empire.jpg') pil_im = pil_im.resize(size) print pil_im.size subplot(235) title(u'調整尺寸后的圖像', fontproperties=font) axis('off') imshow(pil_im)# 旋轉圖像45° pil_im = Image.open('../data/empire.jpg') pil_im = pil_im.rotate(45) subplot(236) title(u'旋轉45°后的圖像', fontproperties=font) axis('off') imshow(pil_im)show()

運行上面代碼，可得P002 Figure 1-1中出現的所有實例圖,結果如下：

1.2 Matplotlib庫

當在處理數學及繪圖或在圖像上描點、畫直線、曲線時，Matplotlib是一個很好的繪圖庫，它比PIL庫提供了更有力的特性。Matplotlib是開源的，可以在[matplotlib.sourceforge.net]上下載，并且它還提供了詳細的文檔及教程。這里，會展示一些我們在本書后面會用到的函數的一些實例。

1.2.1 畫圖、描點和線

雖然Matplotlib可以創建漂亮的條狀圖、餅圖、散點圖等，但是在很多計算機視覺應用場合，其實只用到了一些常用的命令。下面展示在一幅圖像上描一些點和畫一條直線的例子。

# -*- coding: utf-8 -*- from PIL import Image from pylab import *# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)im = array(Image.open('../data/empire.jpg')) figure()# 畫有坐標軸的 subplot(121) imshow(im) x = [100, 100, 400, 400] y = [200, 500, 200, 500] plot(x, y, 'r*') plot(x[:2], y[:2]) title(u'繪圖: "empire.jpg"', fontproperties=font)# 不顯示坐標軸 subplot(122) imshow(im) x = [100, 100, 400, 400] y = [200, 500, 200, 500] plot(x, y, 'r*') plot(x[:2], y[:2]) axis('off') #顯示坐標軸 title(u'繪圖: "empire.jpg"', fontproperties=font)show()

運行上面代碼，即可得原書P005中 Figure 1-2中左邊的結果。去掉上面代碼中坐標軸的注釋，即可得 Figure 1-2中右邊的結果。運行結果如下：

1.2.2 圖像輪廓和直方圖

下面我們看兩個特別的例子：圖像輪廓線和圖線等高線。在畫圖像輪廓前需要轉換為灰度圖像，因為輪廓需要獲取每個坐標[x,y]位置的像素值。下面是畫圖像輪廓和直方圖的代碼：

# -*- coding: utf-8 -*- from PIL import Image from pylab import *# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14) im = array(Image.open('../data/empire.jpg').convert('L')) # 打開圖像，并轉成灰度圖像figure() subplot(121) gray() contour(im, origin='image') axis('equal') axis('off') title(u'圖像輪廓', fontproperties=font)subplot(122) hist(im.flatten(), 128) title(u'圖像直方圖', fontproperties=font) plt.xlim([0,260]) plt.ylim([0,11000])show()

運行上面代碼，可以得到書中的圖1-3所示的結果:

1.2.4 交互注釋

有時，用戶需要和應用進行交互，比如在圖像中用點做標識，或者在一些訓練數據中進行注釋。PyLab提供了一個很簡潔好用的函數ginput(),它可以完成該任務，下面是一個演示交互注釋的簡短示例：

from PIL import Image from pylab import *im = array(Image.open('../data/empire.jpg')) imshow(im) print 'Please click 3 points' imshow(im) x = ginput(3) print 'You clicked:', xshow()

上面代碼先讀取empire.jpg圖像，顯示讀取的圖像，然后用ginput()交互注釋，這里設置的交互注釋數據點設置為3個，用戶在注釋后，會將注釋點的坐標打印出來。

1.3 NumPy庫

NumPy是Python一個流行的用于科學計算包。它包含了很多諸如矢量、矩陣、圖像等其他非常有用的對象和線性代數函數。在本書中幾乎所有的例子都用到了NumPy數組對象。NumPy可以在scipy.org/Download]下載，在線文檔包含了很多常見問題的答案。

1.3.1 圖像數組表示

在前面載入圖像的示例中，我們將圖像用array()函數轉為NumPy數組對象，但是并沒有提到它表示的含義。數組就像列表一樣，只不過它規定了數組中的所有元素必須是相同的類型。下面的例子用于說明圖像數組表示：

# -*- coding: utf-8 -*- from PIL import Image from pylab import *im = array(Image.open('../data/empire.jpg')) print im.shape, im.dtype im = array(Image.open('../data/empire.jpg').convert('L'),'f') print im.shape, im.dtype

運行上面代碼，會給出下面結果：

(800, 569, 3) uint8 (800, 569) float32

數組可以通過索引訪問和操作其中的元素。比如：value=im[i,j,k]。i,j是坐標，k是顏色通道。對于多個元素，可以用切片操作，如：

im[i,:] = im[j,:] # set the values of row i with values from row j im[:,i] = 100 # set all values in column i to 100 im[:100,:50].sum() # the sum of the values of the first 100 rows and 50 columns im[50:100,50:100] # rows 50-100, columns 50-100 (100th not included) im[i].mean() # average of row i im[:,-1] # last column im[-2,:] (or im[-2]) # second to last row

在使用數組時有很多操作和方式，我們會在后面介紹貫穿于本書所需要的操作。

1.3.2 灰度變換

在讀入圖像到NumPy數組后，就可以對它進行任何我們想要的操作了。對圖像進行灰度變換便是一個簡單的例子。這里給出一些進行灰度變換的例子：

# -*- coding: utf-8 -*- from PIL import Image from numpy import * from pylab import *im = array(Image.open('../data/empire.jpg').convert('L')) print int(im.min()), int(im.max())im2 = 255 - im # invert image print int(im2.min()), int(im2.max())im3 = (100.0/255) * im + 100 # clamp to interval 100...200 print int(im3.min()), int(im3.max())im4 = 255.0 * (im/255.0)**2 # squared print int(im4.min()), int(im4.max())figure() gray() subplot(1, 3, 1) imshow(im2) axis('off') title(r'$f(x)=255-x$')subplot(1, 3, 2) imshow(im3) axis('off') title(r'$f(x)=\frac{100}{255}x+100$')subplot(1, 3, 3) imshow(im4) axis('off') title(r'$f(x)=255(\frac{x}{255})^2$') show()

上面左邊灰度變換函數采用的是f(x)=255-x,中間采用的是f(x)=(100/255)x+100,右邊采用的是變換函數是f(x)=255(x/255)^2。運行上面代碼，可以得到P009 Fig1-5中的結果：正如上面代碼所示，你可以用通過下面命令檢查每幅圖像的最小值和最大值：

print int(im.min()), int(im.max())

如果你對每幅圖像用到了打印最小像素值和最大像素值，你會得到下面的輸出結果：

2 255 0 253 100 200 0 255

1.3-3 調整圖像尺寸

NumPy數組將成為我們對圖像及數據進行處理的最主要工具，但是調整矩陣大小并沒有一種簡單的方法。我們可以用PIL圖像對象轉換寫一個簡單的圖像尺寸調整函數：

def imresize(im,sz):""" Resize an image array using PIL. """pil_im = Image.fromarray(uint8(im))return array(pil_im.resize(sz))

上面定義的調整函數，在imtools.py中你可以找到它。

1.3.3 直方圖均衡化

一個極其有用的例子是灰度變換后進行直方圖均衡化。圖像均衡化作為預處理操作，在歸一化圖像強度時是一個很好的方式，并且通過直方圖均衡化可以增加圖像對比度。下面是對圖像直方圖進行均衡化處理的例子：

# -*- coding: utf-8 -*- from PIL import Image from pylab import * from PCV.tools import imtools# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)im = array(Image.open('../data/empire.jpg').convert('L')) # 打開圖像，并轉成灰度圖像 #im = array(Image.open('../data/AquaTermi_lowcontrast.JPG').convert('L')) im2, cdf = imtools.histeq(im)figure() subplot(2, 2, 1) axis('off') gray() title(u'原始圖像', fontproperties=font) imshow(im)subplot(2, 2, 2) axis('off') title(u'直方圖均衡化后的圖像', fontproperties=font) imshow(im2)subplot(2, 2, 3) axis('off') title(u'原始直方圖', fontproperties=font) #hist(im.flatten(), 128, cumulative=True, normed=True) hist(im.flatten(), 128, normed=True)subplot(2, 2, 4) axis('off') title(u'均衡化后的直方圖', fontproperties=font) #hist(im2.flatten(), 128, cumulative=True, normed=True) hist(im2.flatten(), 128, normed=True)show()

運行上面代碼，可以得到書中的結果：

1.3.4 圖像平均

對圖像取平均是一種圖像降噪的簡單方法，經常用于產生藝術效果。假設所有的圖像具有相同的尺寸，我們可以對圖像相同位置的像素相加取平均，下面是一個演示對圖像取平均的例子：

# -*- coding: utf-8 -*- from PCV.tools.imtools import get_imlist from PIL import Image from pylab import * from PCV.tools import imtools# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)filelist = get_imlist('../data/avg/') #獲取convert_images_format_test文件夾下的圖片文件名(包括后綴名) avg = imtools.compute_average(filelist)for impath in filelist:im1 = array(Image.open(impath))subplot(2, 2, filelist.index(impath)+1)imshow(im1)imNum=str(filelist.index(impath)+1)title(u'待平均圖像'+imNum, fontproperties=font)axis('off') subplot(2, 2, 4) imshow(avg) title(u'平均后的圖像', fontproperties=font) axis('off')show()

運行上面代碼，可得對3幅圖像平均后的效果，如下圖：

1.3.5 對圖像進行主成分分析

主成分分析是一項有用的降維技術。對于主成分分析的原理，這里不做具體介紹。下面我們在字體圖像上進行降維處理。文件fontimages.zip包含有字母"a"的縮略圖，共有2359個字體圖像，可以在[Images courtesy of Martin Solli]下載。下面代碼是顯示原書P14頁對字體圖像進行主成分分析的實例代碼：

# -*- coding: utf-8 -*- import pickle from PIL import Image from numpy import * from pylab import * from PCV.tools import imtools, pca# Uses sparse pca codepath. #imlist = imtools.get_imlist('../data/selectedfontimages/a_selected_thumbs')# 獲取圖像列表和他們的尺寸 imlist = imtools.get_imlist('../data/fontimages/a_thumbs') # fontimages.zip is part of the book data set im = array(Image.open(imlist[0])) # open one image to get the size m, n = im.shape[:2] # get the size of the images imnbr = len(imlist) # get the number of images print "The number of images is %d" % imnbr# Create matrix to store all flattened images immatrix = array([array(Image.open(imname)).flatten() for imname in imlist], 'f')# PCA降維 V, S, immean = pca.pca(immatrix)# 保存均值和主成分 #f = open('../ch01/font_pca_modes.pkl', 'wb') #pickle.dump(immean,f) #pickle.dump(V,f) #f.close()# Show the images (mean and 7 first modes) # This gives figure 1-8 (p15) in the book. figure() gray() subplot(2, 4, 1) axis('off') imshow(immean.reshape(m, n)) for i in range(7):subplot(2, 4, i+2)imshow(V[i].reshape(m, n))axis('off') show()

注意，這些圖像在拉成一維表示后，必須用reshape()函數將它重新轉換回來。運行上面代碼，可得原書P15 Figure1-8中的結果，即：

1.3.6 Pickle模塊

如果你想將結果保存下來，或者將數據保存下來以便后面使用，那么pickle模塊是非常有用的。Pickle模塊能夠獲取幾乎所有的Python對象，并將它轉換成字符串表示，該過程稱為封裝；從字符串表示重構對象的過程為拆封。下面用一個例子對其進行說明。正如你在上面注釋部分看到的一樣，假設我們想將前一節字體圖像的平均值和主成分保存起來，可以通過下面操作：

f = open('../data/fontimages/font_pca_modes.pkl', 'wb') pickle.dump(immean,f) pickle.dump(V,f) f.close()

上面在使用封裝操作前，需要導入pickle模塊。如果要載入保存的.pkl數據，可以通過load()方法，如下：

# load mean and principal components f = open('../data/fontimages/font_pca_modes.pkl', 'rb') immean = pickle.load(f) V = pickle.load(f) f.close()

使用with()方法在這里不介紹，具體的可以翻閱原書。關于pickle模塊的更多細節可以查閱在線文檔[[docs.python.org/library/pickle.html\]](http://docs.python.org/library/pickle.html)

1.4 SciPy模塊

SciPy是一個開源的數學工具包，它是建立在NumPy的基礎上的。它提供了很多有效的常規操作，包括數值綜合、最優化、統計、信號處理以及圖像處理。正如接下來所展示的，SciPy庫包含了很多有用的模塊。SciPy庫可以再[http://scipy.org/Download]下載。

1.4.1 圖像模糊

一個經典的并且十分有用的圖像卷積例子是對圖像進行高斯模糊。高斯模糊可以用于定義圖像尺度、計算興趣點以及很多其他的應用場合。下面是對圖像進行模糊顯示原書P017 Fig1-9的例子。

# -*- coding: utf-8 -*- from PIL import Image from pylab import * from scipy.ndimage import filters# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)#im = array(Image.open('board.jpeg')) im = array(Image.open('../data/empire.jpg').convert('L'))figure() gray() axis('off') subplot(1, 4, 1) axis('off') title(u'原圖', fontproperties=font) imshow(im)for bi, blur in enumerate([2, 5, 10]):im2 = zeros(im.shape)im2 = filters.gaussian_filter(im, blur)im2 = np.uint8(im2)imNum=str(blur)subplot(1, 4, 2 + bi)axis('off')title(u'標準差為'+imNum, fontproperties=font)imshow(im2)#如果是彩色圖像，則分別對三個通道進行模糊 #for bi, blur in enumerate([2, 5, 10]): # im2 = zeros(im.shape) # for i in range(3): # im2[:, :, i] = filters.gaussian_filter(im[:, :, i], blur) # im2 = np.uint8(im2) # subplot(1, 4, 2 + bi) # axis('off') # imshow(im2)show()

運行上面代碼，可得P017 Fig1-9中的結果：上面第一幅圖為待模糊圖像，第二幅用高斯標準差為2進行模糊，第三幅用高斯標準差為5進行模糊，最后一幅用高斯標準差為10進行模糊。關于該模塊的使用以及參數選擇的更多細節，可以參閱SciPy scipy.ndimage文檔[docs.scipy.org/doc/scipy/reference/ndimage.html]。

1.4.2 圖像差分

圖像強度的改變是一個重要的信息，被廣泛用以很多應用中，正如它貫穿于本書中。下面是對圖像進行差分顯示原書P019 Fig1-10的例子。

# -*- coding: utf-8 -*- from PIL import Image from pylab import * from scipy.ndimage import filters import numpy# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)im = array(Image.open('../data/empire.jpg').convert('L')) gray()subplot(1, 4, 1) axis('off') title(u'(a)原圖', fontproperties=font) imshow(im)# Sobel derivative filters imx = zeros(im.shape) filters.sobel(im, 1, imx) subplot(1, 4, 2) axis('off') title(u'(b)x方向差分', fontproperties=font) imshow(imx)imy = zeros(im.shape) filters.sobel(im, 0, imy) subplot(1, 4, 3) axis('off') title(u'(c)y方向差分', fontproperties=font) imshow(imy)#mag = numpy.sqrt(imx**2 + imy**2) mag = 255-numpy.sqrt(imx**2 + imy**2) subplot(1, 4, 4) title(u'(d)梯度幅度', fontproperties=font) axis('off') imshow(mag)show()

運行上面代碼，可得P019 Fig1-10中的運行結果：再看一個高斯差分的例子，運行下面代碼可得原書P020 Fig1-11頁對圖像進行高斯差分示例：

# -*- coding: utf-8 -*- from PIL import Image from pylab import * from scipy.ndimage import filters import numpy# 添加中文字體支持 #from matplotlib.font_manager import FontProperties #font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)def imx(im, sigma):imgx = zeros(im.shape)filters.gaussian_filter(im, sigma, (0, 1), imgx)return imgxdef imy(im, sigma):imgy = zeros(im.shape)filters.gaussian_filter(im, sigma, (1, 0), imgy)return imgydef mag(im, sigma):# there's also gaussian_gradient_magnitude()#mag = numpy.sqrt(imgx**2 + imgy**2)imgmag = 255 - numpy.sqrt(imgx ** 2 + imgy ** 2)return imgmagim = array(Image.open('../data/empire.jpg').convert('L')) figure() gray()sigma = [2, 5, 10]for i in sigma:subplot(3, 4, 4*(sigma.index(i))+1)axis('off')imshow(im)imgx=imx(im, i)subplot(3, 4, 4*(sigma.index(i))+2)axis('off')imshow(imgx)imgy=imy(im, i)subplot(3, 4, 4*(sigma.index(i))+3)axis('off')imshow(imgy)imgmag=mag(im, i)subplot(3, 4, 4*(sigma.index(i))+4)axis('off')imshow(imgmag)show()

注意運行的結果在擺放位置時與原書P020 Fig1-11結果稍微不同。上面代碼中，第一行標準差為2，列分別表示的是x、y和mag,第二行和第三行依次類推。

1.4.3 形態學-物體計數

形態學常用于二值圖像，不過它也可以用于灰度圖像。二值圖像像素只有兩種取值，通常是0和1。二值圖像通常是由一幅圖像進行二值化處理后的產生的，它可以用于用于對物體進行計數，或計算它們的大小。對形態學的介紹和較好的介紹是wiki[en.wikipedia.org/wiki/Mathematical_morphology]。

形態學操作包括在sci.ndimage模塊morphology中。下面我們看一個簡單地怎樣使用它們例子。

# -*- coding: utf-8 -*- from PIL import Image from numpy import * from scipy.ndimage import measurements, morphology from pylab import *""" This is the morphology counting objects example in Section 1.4. """# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)# load image and threshold to make sure it is binary figure() gray() im = array(Image.open('../data/houses.png').convert('L')) subplot(221) imshow(im) axis('off') title(u'原圖', fontproperties=font) im = (im < 128)labels, nbr_objects = measurements.label(im) print "Number of objects:", nbr_objects subplot(222) imshow(labels) axis('off') title(u'標記后的圖', fontproperties=font)# morphology - opening to separate objects better im_open = morphology.binary_opening(im, ones((9, 5)), iterations=2) subplot(223) imshow(im_open) axis('off') title(u'開運算后的圖像', fontproperties=font)labels_open, nbr_objects_open = measurements.label(im_open) print "Number of objects:", nbr_objects_open subplot(224) imshow(labels_open) axis('off') title(u'開運算后進行標記后的圖像', fontproperties=font)show()

運行上面代碼，可得原書P022 Fig1-12的結果：同時打印計數結果為：

Number of objects: 45 Number of objects: 48

更多關于形態學可以參閱scipy.ndimage在線文檔[docs.scipy.org/doc/scipy/reference/ndimage.html]。

1.4.4 有用的SciPy模塊

SciPy有一些用于輸入和輸出數據有用的模塊，其中兩個是io和misc。

讀寫.mat文件

如果你有一些數據存儲在Matlab .mat文件中，可以用scipy.io模塊讀取：

data = scipy.io.loadmat('test.mat')

如果要保存到.mat文件中的話，同樣也很容易，僅僅只需要創建一個字典，字典中即可保存你想保存的所有變量，然后用savemat()方法即可：

#創建字典 data = {} #將變量x保存在字典中 data['x'] = x scipy.io.savemat('test.mat',data)

更多關于scipy.io的信息可以參閱在線文檔[docs.scipy.org/doc/scipy/reference/io.html]。

保存數組為圖像

在scipy.misc模塊中，包含了imsave()函數，要保存數組為一幅圖像，可通過下面方式完成：

from scipy.misc import imsave imsave('test.jpg',im)

scipy.misc模塊中還包含了著名的"Lena"測試圖像：

lena = scipy.misc.lena()

上面得到的lena圖像是一幅512*512大小的灰度圖像。

1.5 更高級的例子：圖像降噪

我們以一個非常有用的例子結束本章。圖像降噪是一個在盡可能保持圖像細節和結構信息時去除噪聲的過程。我們采用Rudin-Osher-Fatemi de-noising(ROF)模型。圖像去噪可以應用于很多場合，它涵蓋了從你的度假照片使之更好看到衛星照片質量提高。

下面我們看一個圖像降噪的綜合實例：

# -*- coding: utf-8 -*- from pylab import * from numpy import * from numpy import random from scipy.ndimage import filters from scipy.misc import imsave from PCV.tools import rof""" This is the de-noising example using ROF in Section 1.5. """# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)# create synthetic image with noise im = zeros((500,500)) im[100:400,100:400] = 128 im[200:300,200:300] = 255 im = im + 30*random.standard_normal((500,500))U,T = rof.denoise(im,im) G = filters.gaussian_filter(im,10)# save the result #imsave('synth_original.pdf',im) #imsave('synth_rof.pdf',U) #imsave('synth_gaussian.pdf',G)# plot figure() gray()subplot(1,3,1) imshow(im) #axis('equal') axis('off') title(u'原噪聲圖像', fontproperties=font)subplot(1,3,2) imshow(G) #axis('equal') axis('off') title(u'高斯模糊后的圖像', fontproperties=font)subplot(1,3,3) imshow(U) #axis('equal') axis('off') title(u'ROF降噪后的圖像', fontproperties=font)show()

運行上面代碼，可得到原書P025 Fig1-13的結果，如下圖示：其中第一幅圖示原噪聲圖像，中間一幅圖示用標準差為10進行高斯模糊后的結果，最右邊一幅圖是用ROF降噪后的圖像。上面原噪聲圖像是模擬出來的圖像，現在我們在真實的圖像上進行測試：

# -*- coding: utf-8 -*- from PIL import Image from pylab import * from numpy import * from numpy import random from scipy.ndimage import filters from scipy.misc import imsave from PCV.tools import rof""" This is the de-noising example using ROF in Section 1.5. """# 添加中文字體支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)im = array(Image.open('../data/empire.jpg').convert('L'))U,T = rof.denoise(im,im) G = filters.gaussian_filter(im,10)# save the result #imsave('synth_original.pdf',im) #imsave('synth_rof.pdf',U) #imsave('synth_gaussian.pdf',G)# plot figure() gray()subplot(1,3,1) imshow(im) #axis('equal') axis('off') title(u'原噪聲圖像', fontproperties=font)subplot(1,3,2) imshow(G) #axis('equal') axis('off') title(u'高斯模糊后的圖像', fontproperties=font)subplot(1,3,3) imshow(U) #axis('equal') axis('off') title(u'ROF降噪后的圖像', fontproperties=font)show()

同樣，運行上面代碼，可得原書P026 Fig1-14的結果，結果如下：正如你所看到的，在去除噪聲的同時，ROF降噪能夠保持邊緣和圖像結構。

from:?http://yongyuan.name/pcvwithpython/chapter1.html

總結

以上是生活随笔為你收集整理的Python计算机视觉：第一章图像处理基础的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Python计算机视觉：安装
下一篇： Python计算机视觉：第二章图像局部

python

Python计算机视觉：第一章 图像处理基础

第一章 圖像處理基礎

1.1 PIL-Python圖像庫

1.1.1 對圖片進行格式轉換

1.1.2 創建縮略圖

1.1.3 拷貝并粘貼區域

1.1.4 調整尺寸及旋轉

1.2 Matplotlib庫

1.2.1 畫圖、描點和線

1.2.2 圖像輪廓和直方圖

1.2.4 交互注釋

1.3 NumPy庫

1.3.1 圖像數組表示

1.3.2 灰度變換

1.3-3 調整圖像尺寸

1.3.3 直方圖均衡化

1.3.4 圖像平均

1.3.5 對圖像進行主成分分析

1.3.6 Pickle模塊

1.4 SciPy模塊

1.4.1 圖像模糊

1.4.2 圖像差分

1.4.3 形態學-物體計數

1.4.4 有用的SciPy模塊

讀寫.mat文件

保存數組為圖像

1.5 更高級的例子：圖像降噪

總結

Python计算机视觉：第一章图像处理基础

第一章圖像處理基礎