01、python数据分析与机器学习实战——Python可视化库Seaborn
seaborn簡(jiǎn)介
Seaborn其實(shí)是在matplotlib的基礎(chǔ)上進(jìn)行了更高級(jí)的API封裝,從而使得作圖更加容易,在大多數(shù)情況下使用seaborn就能做出很具有吸引力的圖。
seaborn基礎(chǔ)
import seaborn as sns import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt1.seaborn的整體布局風(fēng)格設(shè)置
seaborn有五種風(fēng)格
whitegrid風(fēng)格:
dark風(fēng)格:
white風(fēng)格:
ticks風(fēng)格:
2.調(diào)色板
(1)、顏色很重要
(2)、color_palette()能傳入Matplotlib所支持的顏色
(3)、color_palette()不寫參數(shù)則默認(rèn)顏色
(4)、set_palette()設(shè)置所有圖的顏色
分類色板:
六個(gè)默認(rèn)的顏色循環(huán)主題
圓形畫板:
當(dāng)有六個(gè)以上的分類要區(qū)分時(shí),最簡(jiǎn)單的方法就是在一個(gè)圓形的顏色空間中畫出均勻間隔的顏色(這樣的色調(diào)會(huì)保持廣度和飽和度不變)。
這是大多數(shù)的當(dāng)需要使用比當(dāng)前默認(rèn)顏色循環(huán)中設(shè)置的顏色更多時(shí)的默認(rèn)方案。
最常用的方法是使用hls的顏色空間,這是RGB值的一個(gè)簡(jiǎn)單轉(zhuǎn)換。
hls_palette()函數(shù)來(lái)控制顏色的亮度和飽和
l —— 亮度 lightness
s —— 飽和 saturation
也可以成對(duì)設(shè)置顏色:
連續(xù)色板:
色彩隨數(shù)據(jù)變換,比如數(shù)據(jù)越來(lái)越重要?jiǎng)t顏色越來(lái)越深:
也可以翻轉(zhuǎn)過(guò)來(lái):
cubehelis_palette()調(diào)色板
色調(diào)線性變換
單變量分析繪圖
演示:特征的可視化
iris=sns.load_dataset("iris") sns.pairplot(iris)
在對(duì)角線上是單變量的直方圖,其他位置是兩個(gè)變量的散點(diǎn)圖。
多變量分析繪圖
引入數(shù)據(jù)集:
np.random.seed(sum(map(ord,"categorical"))) titanic=sns.load_dataset("titanic") tips=sns.load_dataset("tips") iris=sns.load_dataset("iris")sns.stripplot(x="day",y="total_bill",data=tips)plt.show()
重疊是很常見(jiàn)的現(xiàn)象,但是重疊影響了觀察數(shù)據(jù)的量。
浮動(dòng)一下:
如果想要讓數(shù)據(jù)完全均勻分開(kāi):
補(bǔ)充:
盒圖 IQR即統(tǒng)計(jì)學(xué)概念四分位距,第一/四分位與第三/四分位之間的距離
N=1.5IQR 如果一個(gè)值>Q3+N或<Q1-N,則為離群點(diǎn)
回歸分析繪圖
首先使用一個(gè)內(nèi)置的數(shù)據(jù)集:
sns.set(color_codes=True)np.random.seed(sum(map(ord,"regression")))tips=sns.load_dataset("tips")tips.head()
regpolt()和implot()都可以繪制回歸關(guān)系,推薦regpolt(),支持參數(shù)更多。
x=“total_bill”,y="tip"之間的回歸關(guān)系:
sns.regplot(x="total_bill",y="tip",data=tips)
x=“size”,y="tip"之間的回歸關(guān)系:
不過(guò)這好像并沒(méi)有什么鬼關(guān)系,我們可以加上一個(gè)小范圍的浮動(dòng)值:
內(nèi)容很多,慢慢消化,慢慢補(bǔ)充。
總結(jié)
以上是生活随笔為你收集整理的01、python数据分析与机器学习实战——Python可视化库Seaborn的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 01、python数据分析与机器学习实战
- 下一篇: Spreadsheet Tracking