Iris数据集可视化
- Fisher數(shù)據(jù)可視化
- 去掉Species特征中的’Iris-'字符
- Seaborn可視化
- palette調(diào)色板
- sns初始化,set()設(shè)置主題、調(diào)色板
- relplot
- hue
- 聯(lián)合分布 jointplot
- displot
- boxplot
- violinplot
- pairplot
Fisher數(shù)據(jù)可視化
import pandas as pd df_Iris = pd.read_csv('Iris1.csv') df_Iris.Species.value_counts()去掉Species特征中的’Iris-'字符
df_Iris['Species']= df_Iris.Species.apply(lambda x: x.split('-')[1]) df_Iris.Species.value_counts()Seaborn可視化
palette調(diào)色板
import numpy as np import matplotlib.pyplot as plt import seaborn as sns current_palette = sns.color_palette() print("current_palette") sns.palplot(current_palette) #其它顏色風(fēng)格 #風(fēng)格內(nèi)容:Accent,Blues,BrBG等等 print("Accent") sns.palplot(sns.color_palette('Accent',8)) #這里顏色風(fēng)格為Accent #顏色色塊個(gè)數(shù)為8個(gè) #風(fēng)格顏色轉(zhuǎn)換(不是所有顏色都可以反轉(zhuǎn)):Blues/Blues_r #分組顏色設(shè)置 -'Paried' print("Paired") sns.palplot(sns.color_palette('Paired', 16))sns初始化,set()設(shè)置主題、調(diào)色板
# styles = ["white", "dark", "whitegrid", "darkgrid", "ticks"] # palette : deep,muted, pastel, bright, dark, colorblind sns.set(style="dark", palette="colorblind", color_codes=True)relplot
relplot(kind=“l(fā)ine”|“scatter(默認(rèn))”)
#設(shè)置散點(diǎn)圖x軸與y軸以及data參數(shù) sns.relplot(x='SepalLengthCm', y='SepalWidthCm', data = df_Iris) plt.title('SepalLengthCm and SepalWidthCm data analysize') # kind='line' sns.relplot(x='SepalLengthCm', y='SepalWidthCm', kind="line",data = df_Iris) # 陰影部分為置信空間ci=None可控制hue
在某一維度,用不同的顏色區(qū)分出來
# 表示按照Species對(duì)數(shù)據(jù)進(jìn)行分類, 而style表示每個(gè)類別的標(biāo)簽系列格式不一致. sns.relplot(x='SepalLengthCm', y='SepalWidthCm', hue='Species', style='Species', data=df_Iris ) plt.title('SepalLengthCm and SepalWidthCm data by Species') #花瓣長度與寬度分布散點(diǎn)圖 sns.relplot(x='PetalLengthCm', y='PetalWidthCm', hue='Species', style='Species', data=df_Iris ) plt.title('PetalLengthCm and PetalWidthCm data by Species') #花萼長度與Id之間關(guān)系圖 sns.relplot(x="Id", y="SepalLengthCm",hue="Species", style="Species",kind="line", data=df_Iris) plt.title('SepalLengthCm and Id data analysize') #花萼寬度與Id之間關(guān)系圖 sns.relplot(x="Id", y="SepalWidthCm",hue="Species", style="Species",kind="line", data=df_Iris) plt.title('SepalWidthCm and Id data analysize') #花瓣長度與Id之間關(guān)系圖 sns.relplot(x="Id", y="PetalLengthCm",hue="Species", style="Species",kind="line", data=df_Iris) plt.title('PetalLengthCm and Id data analysize') #花瓣寬度與Id之間關(guān)系圖 sns.relplot(x="Id", y="PetalWidthCm",hue="Species", style="Species",kind="line", data=df_Iris) plt.title('PetalWidthCm and Id data analysize')聯(lián)合分布 jointplot
jointplot(x,y,data,color,s,edgecolor,linewidth,kind,space,size,ratio.marginal_kws)
sns.jointplot(x='SepalLengthCm', y='SepalWidthCm', data=df_Iris) sns.jointplot(x='PetalLengthCm', y='PetalWidthCm', data=df_Iris)displot
displot()集合了matplotlib的hist()與核函數(shù)估計(jì)kdeplot的功能,增加了rugplot分布觀測(cè)條顯示與利用scipy庫fit擬合參數(shù)分布的新穎用途
seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)
boxplot
箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖。它能顯示出一組數(shù)據(jù)的最大值、最小值、中位數(shù)及上下四分位數(shù)。因形狀如箱子而得名。
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)
violinplot
violinplot與boxplot扮演類似的角色,它顯示了定量數(shù)據(jù)在一個(gè)(或多個(gè))分類變量的多個(gè)層次上的分布,這些分布可以進(jìn)行比較。不像箱形圖中所有繪圖組件都對(duì)應(yīng)于實(shí)際數(shù)據(jù)點(diǎn),小提琴繪圖以基礎(chǔ)分布的核密度估計(jì)為特征。
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, bw=‘scott’, cut=2, scale=‘a(chǎn)rea’, scale_hue=True, gridsize=100, width=0.8, inner=‘box’, split=False, dodge=True, orient=None, linewidth=None, color=None, palette=None, saturation=0.75, ax=None, **kwargs)
pairplot
pairplot中pair是成對(duì)的意思,pairplot主要展現(xiàn)的是變量兩兩之間的關(guān)系(線性或非線性,有無較為明顯的相關(guān)關(guān)系),照例來總覽一下pairplot的API。
seaborm.pairplot(data,hue=None,hue_order=None,palette=None,vars=None,x_vars=None,
y_vars=None,kind=‘scattr’,diag_kind=‘hist’,markers=None,size=2.5,aspect=1,dropna=True,plot_ kws=None, diag. kws=None, grid. kws=None)
參考文獻(xiàn)
https://www.kaggle.com/uciml/iris#Iris.csv
https://www.cnblogs.com/star-zhao/p/9847082.html
https://blog.csdn.net/u013317445/article/details/88175366
https://blog.csdn.net/qq_42554007/article/details/82624418
http://seaborn.pydata.org/api.html
總結(jié)
以上是生活随笔為你收集整理的Iris数据集可视化的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 手撸双链表,图解
- 下一篇: AWE2020:黄金十年再踏征程,以科技