python图像主色调(主颜色)提取,在hsv空间k均值迭代实现
完整項(xiàng)目代碼在:https://github.com/liuhuang31/simple_mainColor
?
本人新手一枚,所編寫的代碼基本盡量沒(méi)調(diào)用庫(kù)類,所以感覺(jué)代碼會(huì)很臃腫,連三級(jí)代碼都稱不上哈,這個(gè)主色調(diào)也是看了一天python后,現(xiàn)學(xué)現(xiàn)用的。可以微博關(guān)注@劉煌煌愛喝冬瓜茶 ? ? 一起交流學(xué)習(xí)!
?
python寫的(python2.7 和python3.+)都可以使用,需要安裝 PIL?matplotlib numpy等環(huán)境。
一、識(shí)別主色調(diào)步驟
非常具有參考價(jià)值的論文《一種新的MPEG-7主顏色提取算法》,我前面做的步驟基本是參考這篇文章的。
1、獲取圖像RGB
2、RGB轉(zhuǎn)化成HSV空間值
3、HSV空間下k均值迭代(初始點(diǎn)是根據(jù)圖像的像素范圍來(lái)random選擇初始點(diǎn)的數(shù)值)
4、顯示圖片(把聚類的hsv值轉(zhuǎn)化為RGB顯示出來(lái))
具體詳細(xì)的步驟看下上面的論文哈
二、代碼實(shí)現(xiàn)
1、hsvTRGB.py ?參考:http://outofmemory.cn/code-snippet/1002/Python-RGB-HSV-color-together-switch
import mathdef Hsv2Rgb(H, S, V):H /= 60.0 # sector 0 to 5i = math.floor(H)f = H - i # factorial part of hp = V * (1 - S)q = V * (1 - S * f)t = V * (1 - S * (1 - f))if i == 0:R = VG = tB = pelif i == 1:R = qG = VB = pelif i == 2:R = pG = VB = telif i == 3:R = pG = qB = Velif i == 4:R = tG = pB = Velse:R = VG = pB = qreturn R*255, G*255, B*2552、rgb2hsv.py
?
?
def rgb2hsv(r, g, b):r, g, b = r/255.0, g/255.0, b/255.0mx = max(r, g, b)mn = min(r, g, b)df = mx-mnif mx == mn:h = 0elif mx == r and g >= b:h = 60 * ((g - b) / df) + 0elif mx == r and g < b:h = 60 * ((g-b)/df) + 360elif mx == g:h = 60 * ((b-r)/df) + 120elif mx == b:h = 60 * ((r-g)/df) + 240if mx == 0:s = 0else:s = df/mxv = mxreturn h, s, vdef rgb2hsv2(R, G, B):mx = max(R, G, B)mn = min(R, G, B)if R == mx:H = (G-B) / (mx-mn)elif G == mx:H = 2 + (B-R) / (mx-mn)elif B == mx:H = 4 + (R-G) / (mx-mn)H = H * 60if H < 0:H = H + 360V = mxS = (mx - mn) / mxreturn H, S, V3、PrimaryColor.py
?
?
# coding=utf-8from PIL import Image import rgb2hsv import random as ran import hsvTRGB from pylab import *# 加載圖片,返回?cái)?shù)據(jù) def loadImage(path):im = Image.open(path) # Can be many different formats.pix = im.load() # 獲得圖像的像素width = im.size[0] # 獲得圖像的寬度height = im.size[1] # 獲得圖像的高度data = width, height, pix, im # 把這些width,height,pix,im這些值賦給data,后面KMeans方法里要用到這些值return data# hsv空間兩點(diǎn)間歐氏距離,選出距離最小的類 def distEclud(hsv, centroids, k):h, s, v = hsv # 獲取當(dāng)前像素的h,s,v值min = -1 # 用作判斷centroids[i]是否為第一個(gè)中心點(diǎn)# 逐個(gè)計(jì)算當(dāng)前hsv與各個(gè)類中心點(diǎn)的歐式距離,選出距離最小的類for i in range(k):h1, s1, v1 = centroids[i]minc = math.sqrt(math.pow(math.fabs(h - h1), 2) + math.pow(math.fabs(s - s1), 2) + math.pow(math.fabs(v - v1), 2))# minc = math.sqrt(math.pow(s*math.cos(h) - s1*math.cos(h1), 2) + math.pow(s*math.sin(h) - s1*math.sin(h1), 2) + \# + math.pow(v - v1, 2))/math.sqrt(5) # 歐氏距離計(jì)算公式# 用j表示當(dāng)前hsv值屬于第j個(gè)centroidsif (min == -1):min = mincj = 0continueif (minc < min):min = mincj = ireturn j# 隨機(jī)生成初始的質(zhì)心(ng的課說(shuō)的初始方式是隨機(jī)選K個(gè)點(diǎn)),選擇圖像中最小的值加上隨機(jī)值來(lái)生成 def getCent(dataSet, k):centroids = zeros((k, 3)) # 種子,k表示生成幾個(gè)初始中心點(diǎn),3表示hsv三個(gè)分量width, height, n = dataSet.shape # 獲得數(shù)據(jù)的長(zhǎng)寬# 循環(huán)獲得dataSet所有數(shù)據(jù)里面最小和最大的h,s,v值for i in range(width):for j in range(height):h, s, v = dataSet[i][j]if i == 0 and j == 0:maxh, maxs, maxv = minh, mins, minv = h, s, velif h > maxh:maxh = helif s > maxs:maxs = selif v > maxv:maxv = velif h < minh:minh = helif s < mins:mins = selif v < minv:minv = vrangeh = maxh - minh # 最大和最小h值之差ranges = maxs - minsrangev = maxv - minv# 生成k個(gè)初始點(diǎn),hsv各個(gè)分量的最小值加上range的隨機(jī)值for i in range(k):centroids[i] = minh + rangeh * ran.random(), mins + ranges * ran.random(), + \minv + rangev * ran.random()return centroids# 前一個(gè)centroids與當(dāng)前centroids的根號(hào)平方差 def getDist(preC, centroids):k, n = preC.shape # k表示centroids的k個(gè)中心點(diǎn)(類中心點(diǎn)),n表示例如centroid[0]當(dāng)中的三個(gè)hsv分量sum = 0.0 # 總距離for i in range(k):h, s, v = preC[i]h1, s1, v1 = centroids[i]distance = math.pow(math.fabs(h - h1), 2) + math.pow(math.fabs(s - s1), 2) + math.pow(math.fabs(v - v1), 2)sum += distancereturn math.sqrt(sum)# 中心點(diǎn)k均值迭代 def KMeans(k, data):width, height, pix, im = data # 獲得要處理圖像的各個(gè)數(shù)據(jù)dataSet = [[0 for col in range(height)] for row in range(width)] # 圖像數(shù)據(jù)轉(zhuǎn)化為hsv后的數(shù)據(jù)及其數(shù)據(jù)格式for x in range(width):for y in range(height):r, g, b = pix[x, y] # 獲取圖像rgb值hsv = h, s, v = rgb2hsv.rgb2hsv(r, g, b) # 把rgb值轉(zhuǎn)化為hsv值dataSet[x][y] = hsvdataSet = np.array(dataSet) # 把dataSet數(shù)據(jù)轉(zhuǎn)化為numpy的數(shù)組數(shù)據(jù),以便待會(huì)獲得初始點(diǎn)時(shí),更好處理數(shù)據(jù)centroids = getCent(dataSet, k) # 獲得k個(gè)初始中心點(diǎn)# 循環(huán)迭代直到前一個(gè)centroids與當(dāng)前centroids的根號(hào)距離滿足一定條件while 1:count = [0 for i in range(k)] # count用來(lái)統(tǒng)計(jì)各個(gè)中心類中的數(shù)據(jù)的個(gè)數(shù)myList = [[] for i in range(width * height)] # mylist用來(lái)存放各個(gè)中心類中的數(shù)據(jù)preC = centroids # preC保存前一個(gè)centroids的數(shù)據(jù)# 判斷各個(gè)像素屬于哪個(gè)中心類,然后把hsv值放到所屬類for x in range(width):for y in range(height):r, g, b = pix[x, y]hsv = h, s, v = rgb2hsv.rgb2hsv(r, g, b)i = distEclud(hsv, centroids, k) # 計(jì)算歐氏距離,獲得該像素,也就是hsv所屬中心類myList[i].append((h, s, v)) # 把hsv值加到所屬中心類count[i] += 1 # 相應(yīng)所屬類的個(gè)數(shù)增加# 一次所有點(diǎn)類別劃分后,重新計(jì)算中心點(diǎn)for i in range(k):size = len(myList[i]) # 各個(gè)類中的個(gè)數(shù)sumh = sums = sumv = 0.0if (size == 0):continueelse:for j in range(size):h, s, v = myList[i][j]sumh += hsums += ssumv += vcentroids[i] = sumh / size, sums / size, sumv / size # 取該類hsv分量的平均值print (centroids[0:k])norm = getDist(preC, centroids) # 獲得前一個(gè)centroids與當(dāng)前centroids的根號(hào)距離if norm < 0.1: # 距離小于0.1,則跳出循環(huán)breakreturn count, centroids # 返回count:各個(gè)中心點(diǎn)數(shù)據(jù)的個(gè)數(shù);centroids:最終迭代后的中心點(diǎn)def show(im, count, centroids, k, imgpath):# 顯示第一個(gè)子圖:各個(gè)中心類的個(gè)數(shù)mpl.rcParams['font.family'] = "SimHei" # 指定默認(rèn)字體,才能顯示中文字體ax1 = plt.subplot(221) # 把figure分成2X2的4個(gè)子圖,ax1為第一個(gè)子圖index = np.arange(k)bar_width = 0.35opacity = 0.4plt.bar(index + bar_width / 2, count, bar_width, alpha=opacity, color='g', label='Num')plt.xlabel('Centroids') # 設(shè)置橫坐標(biāo)plt.ylabel('Sum_Number') # 設(shè)置縱坐標(biāo)plt.title(u'points num of centroids') # 設(shè)置標(biāo)題plt.xticks(index + bar_width, ('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I')) # 設(shè)置橫坐標(biāo)各個(gè)類plt.legend() # 設(shè)置plt.tight_layout()ax2 = plt.subplot(222)img = Image.open(imgpath)x = k # x坐標(biāo) 通過(guò)對(duì)txt里的行數(shù)進(jìn)行整數(shù)分解# 冒泡算法從大到小排序for i in range(k):max = count[i]m = ifor j in range(i, k):if count[j] > max:max = count[j]m = jif i != m:midcount = count[i]count[i] = count[m]count[m] = midcountmid = centroids[i]centroids[i] = centroids[m]centroids[m] = midimg = Image.new('RGBA', img.size, (255, 255, 255))print("\n============ the image size ===============")print (img.size)if x > 8: # 取前8個(gè)中心類個(gè)數(shù)最大的顏色x = 8count_remove = 0 # 用語(yǔ)統(tǒng)計(jì),剔除中心類中,類聚集的數(shù)據(jù)數(shù)小于5%的sum_count = float(sum(count)) # sum_count為總的數(shù)據(jù)數(shù)個(gè)數(shù),也就是各個(gè)類聚集的總個(gè)數(shù)# 剔除中心類中,類聚集的數(shù)據(jù)數(shù)小于5%的for i in range(x):if count[x - i - 1] / sum_count < 0.05:count_remove += 1x = x - count_removeif x == 0:x = 1 # 確保有一個(gè)主顏色print("\n============ the points number of centroids ===============")print (count)# 圖片顯示的x y軸y = img.size[1] # y坐標(biāo) x*y = 行數(shù)w = int(img.size[0] / x)# 顯示前8個(gè)中心類個(gè)數(shù)最大的顏色for i in range(0, x):for j in range(i * w, (i + 1) * w):for k in range(0, y):rgb = centroids[i]img.putpixel((j, k), (int(rgb[0]), int(rgb[1]), int(rgb[2]))) # rgb轉(zhuǎn)化為像素plt.xlabel(u'color')plt.title(u'main color sort')plt.yticks()plt.imshow(img)plt.tight_layout()# 顯示原圖,也就是要處理的圖像plt.subplot(212)plt.title(u'origin image')plt.imshow(im)# 顯示整個(gè)figureplt.show()def main():imgpath = '/Users/liuhuang31/Desktop/test2.jpg'data = loadImage(imgpath) # Can be many different formats.選擇這種方式導(dǎo)入圖片k = 20 # 設(shè)置k均值初始點(diǎn)個(gè)數(shù)# 通過(guò)KMeans方法后返回的centroids,是k均值迭代后最終的中心點(diǎn), count是這k個(gè)中心(類)的所包含的個(gè)數(shù)count, centroids = KMeans(k, data)print("\n================== the centroids RGB =================")for i in range(k): # 因?yàn)橛衚個(gè)中心點(diǎn)h, s, v = centroids[i]r, g, b = hsvTRGB.Hsv2Rgb(h, s, v)centroids[i] = r, g, bprint (i, r, g, b)im = data[3] # im = Image.open(path),就是得到圖像對(duì)象show(im, count, centroids, k, imgpath) # 顯示圖像if __name__ == '__main__':main()?
??
?
三、前方高能,我要放圖了!!也就是實(shí)驗(yàn)結(jié)果
由于k個(gè)初始中心點(diǎn)是根據(jù)圖像的像素范圍來(lái)random選擇初始點(diǎn)的數(shù)值,所以每次運(yùn)行的結(jié)果會(huì)有小差異!
1、對(duì)于傳說(shuō)中的粉紅色(由于其特殊性,有些識(shí)別方法識(shí)別不出,可能原因是沒(méi)根據(jù)圖像的RGB來(lái)生成初始聚類中心,或者自己設(shè)定初始點(diǎn))
2、
(1)初始點(diǎn)k=10
(2)初始點(diǎn)k=20 (可以看到和選擇k=10還是有區(qū)別的哈)
3、這張圖識(shí)別的稍微不準(zhǔn),白色RGB(255,255,255)識(shí)別出來(lái)為RGB(239,226,225),藍(lán)色和黃色倒是識(shí)別得準(zhǔn)確
四、再次強(qiáng)調(diào)哈,由于我python是現(xiàn)學(xué)現(xiàn)做,對(duì)于數(shù)據(jù)結(jié)構(gòu)很多都不熟悉,所以轉(zhuǎn)換來(lái)轉(zhuǎn)換的,不過(guò)能自己寫的,我都沒(méi)調(diào)用庫(kù)類,對(duì)自己更有鍛煉,也挺適合我這樣的新手,還有對(duì)一些圖片識(shí)別稍微有誤差,現(xiàn)在還在調(diào)試中QAQ。還有圖像顯示的第二個(gè)主顏色排序子圖像代碼不是很好。。
五、參考資料列表(良好的習(xí)慣^-^)
1、Python中的Numpy入門教程:http://www.jb51.net/article/49397.htm
2、顏色空間RGB與HSV(HSL)的轉(zhuǎn)換:http://blog.csdn.net/jiangxinyu/article/details/8000999
3、python使用matplotlib繪解詳解:http://www.pythontab.com/html/2013/pythonhexinbiancheng_0123/161.html
4、Matplotlib 畫柱狀圖 ? (使用里面的方法來(lái)畫圖):?http://blog.csdn.net/wishchin/article/details/24906175
5、RGB值轉(zhuǎn)化圖片(python PIL) ??(使用里面的方法來(lái)畫圖) ?http://www.tuicool.com/articles/mYBN7ju
?
總結(jié)
以上是生活随笔為你收集整理的python图像主色调(主颜色)提取,在hsv空间k均值迭代实现的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 自制瘦腰减肥茶 一月减掉小肚子
- 下一篇: 「塔望咨询」×「皇品食品」2022上半年