當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

【CV】基于聚类的图像分割-Python

發(fā)布時(shí)間：2025/3/12 python 17 豆豆

生活随笔收集整理的這篇文章主要介紹了【CV】基于聚类的图像分割-Python 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

了解圖像分割

當(dāng)我們在做一個(gè)圖像分類任務(wù)時(shí)，首先我們會(huì)想從圖像中捕獲感興趣的區(qū)域，然后再將其輸入到模型中。讓我們嘗試一種稱為基于聚類的圖像分割技術(shù)，它會(huì)幫助我們在一定程度上提高模型性能，讓我們看看它是什么以及一些進(jìn)行聚類分割的示例代碼。

什么是圖像分割？

想象一下我們要過馬路，過馬路之前我們會(huì)做什么？

首先，我們會(huì)看道路兩旁，以確定接近的車輛等環(huán)境對象，然后我們會(huì)對接近的車輛的速度做出一些快速的估計(jì)，并決定何時(shí)以及如何過馬路。所有這些都發(fā)生在很短的時(shí)間內(nèi)，非常很的神奇。

我們的大腦捕捉道路兩側(cè)的圖像

它檢測道路上的車輛和其他物體==物體檢測

它還確定了它檢測到的每個(gè)對象的形狀 == 圖像分割

通過確定不同物體的形狀，我們的大腦能夠在同一張快照中檢測到多個(gè)物體，這是多么神奇啊。

讓我們進(jìn)一步了解，假設(shè)我們有我們的圖像分類模型，它能夠以 95% 上的準(zhǔn)確率對蘋果和橙子進(jìn)行分類。當(dāng)我們輸入一幅同時(shí)包含蘋果和橙子的圖像時(shí)，預(yù)測精度會(huì)下降。隨著圖像中對象數(shù)量的增加，分類模型的性能會(huì)下降，這就是目標(biāo)定位發(fā)揮作用的地方。

在我們檢測圖像中的對象并對其進(jìn)行分類之前，模型需要了解圖像中的內(nèi)容，這就是圖像分割的幫助所在。它為圖像中的對象創(chuàng)建一個(gè)像素級(jí)的蒙版，這有助于模型更精細(xì)地理解對象的形狀及其在圖像中的位置。

目標(biāo)檢測 VS 圖像分割?

分割的類型有哪些？

圖像分割大致分為兩大類。

語義分割

實(shí)例分割

檢測到的對象 — 語義段 — 實(shí)例段?

在第一張圖片中，我們可以看到檢測到的對象都是男性。在語義分割中，我們認(rèn)為所有這些像素都屬于一類，因此我們用一種顏色表示它們。另一方面，在實(shí)例分割中，這些像素屬于同一類，但我們用不同的顏色表示同一類的不同實(shí)例。

根據(jù)我們使用的分割方法，分割可以分為許多類別。

基于區(qū)域的分割
基于邊緣檢測的分割
基于聚類的分割
基于CNN的分割等。

接下來讓我們看一個(gè)基于聚類的分割示例。

什么是基聚類的分割？

聚類算法用于將彼此更相似的數(shù)據(jù)點(diǎn)從其他組數(shù)據(jù)點(diǎn)更緊密地分組。

現(xiàn)在我們想象一幅包含蘋果和橙子的圖像。蘋果中的大部分像素點(diǎn)應(yīng)該是紅色/綠色，這與橙色的像素值不同。如果我們能把這些點(diǎn)聚在一起，我們就能正確地區(qū)分每個(gè)物體，這就是基于聚類的分割的工作原理。現(xiàn)在讓我們看一些代碼示例。

from skimage.io import imread from skimage.color import rgb2gray import numpy as np import matplotlib.pyplot as plt %matplotlib inline from scipy import ndimage # Scaling the image pixels values within 0-1 img = imread('./apple-orange.jpg') / 255 plt.imshow(img) plt.title('Original') plt.show()

由于肉眼可見，圖像中有五個(gè)色段

蘋果的綠色部分

橙子的橙色部分

蘋果和橙子底部的灰色陰影

蘋果頂部和右側(cè)部分的亮黃色部分

白色背景

讓我們看看我們是否可以使用來自 scikit-learn 的 K 均值算法對它們進(jìn)行聚類

# For clustering the image using k-means, we first need to convert it into a 2-dimensional array image_2D = img.reshape(img.shape[0]*img.shape[1], img.shape[2]) # Use KMeans clustering algorithm from sklearn.cluster to cluster pixels in image from sklearn.cluster import KMeans # tweak the cluster size and see what happens to the Output kmeans = KMeans(n_clusters=5, random_state=0).fit(image_2D) clustered = kmeans.cluster_centers_[kmeans.labels_] # Reshape back the image from 2D to 3D image clustered_3D = clustered.reshape(img.shape[0], img.shape[1], img.shape[2]) plt.imshow(clustered_3D) plt.title('Clustered Image') plt.show()

效果非常好，我們能夠?qū)⑽鍌€(gè)部分組合在一起，這就是聚類分割的工作原理。目前有許多先進(jìn)的技術(shù)，例如 Mask R-CNN，可以進(jìn)行更細(xì)粒度的分割。

Github代碼連接：

https://github.com/Mathanraj-Sharma/sample-for-medium-article/blob/master/cluster-based-segmentation-skimage/cluster-based-segmentation.ipynb

往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機(jī)器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載黃海廣老師《機(jī)器學(xué)習(xí)課程》視頻課黃海廣老師《機(jī)器學(xué)習(xí)課程》711頁完整版課件

本站qq群554839127，加入微信群請掃碼：

總結(jié)

以上是生活随笔為你收集整理的【CV】基于聚类的图像分割-Python的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：图神经网络概述：Graph Neural
下一篇：同时运行多个logstash而kiban