python boxplot pvalue_1.1.1数据质量分析Python boxplot,111,箱,线图
原理
1.箱線圖介紹
箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。
中位數:一組數據按順序排列,從小至大第50%位置的數值
上四分位數(Q1):一組數據按順序排列,從小至大第25%位置的數值
下四分位數(Q3):一組數據按順序排列,從小至大第75%位置的數值
四分位數和下四分位數之間的差值,即四分位數差(IQR,interquartile range)Q3-Q1
上限值:Q1-1.5×IQR(大于上四分位數1.5倍四分位數差的值)
下限值:Q3+1.5×IQR(小于下四分位數1.5倍四分位數差的值)
離群值(異常值):一組數據中超過上下限的真實值
這兩條線段為異常值截斷點,稱其為內限
在Q3+3IQR和Q1-3IQR處畫兩條線段,稱其為外限。
極端異常值,即超出四分位數差3倍距離的異常值,用實心點表示;
溫和異常值,即處于1.5倍-3倍四分位數差之間的異常值,用空心點表示。
2.代碼
boxplot函數的參數解讀
plt.boxplot(
x, // 指定要繪制箱線圖的數據
notch=None, // 是否是凹口的形式展現箱線圖,默認非凹口:False—非凹口—更好看
sym=None, // 指定異常點的形狀,默認為+號顯示,沒有懂什么意思???
vert=None, // 是否需要將箱線圖垂直擺放,默認垂直擺放,Ture—垂直擺放
whis=None, // 指定上下須與上下四分位的距離,默認為1.5*IQR, 指定其他距離???
positions=None, // 指定箱線圖的位置,默認為[0,1,2…];
widths=None, // 指定(中間箱子)箱線圖的寬度,默認為0.5;
patch_artist=None, // 是否填充箱體的顏色,True—填充
meanline=None, // 是否用線的形式表示均值,默認用點來表示:True—虛線,False—三角點
showmeans=None, // 是否顯示均值,默認不顯示:True—顯示,配合meanline使用
showcaps=None, // 是否顯示箱線圖頂端和末端的兩條線,默認顯示:False—不顯示
showbox=None, // 是否顯示箱線圖的箱體,默認顯示:True—顯示
showfliers=None, // 是否顯示異常值,默認顯示 :False—不顯示
boxprops=None, // 設置箱體的屬性,如邊框色,填充色等配合patch_artist使用
labels=None, // 為箱線圖添加標簽,類似于圖例的作用
flierprops=None, // 設置異常值的屬性,如異常點的形狀、大小、填充色等;
medianprops=None, // 設置中位數的屬性,如線的類型、粗細等;
meanprops=None, // 設置均值的屬性,如點的大小、顏色等;
capprops=None, // 設置箱線圖頂端和末端線條的屬性,如顏色、粗細等;
whiskerprops=None // 設置須的屬性,如顏色、粗細、線的類型等
)
示例
def programmer_1(file_name):
catering_sale = file_name
data = pd.read_excel(catering_sale, index_col=u'日期')
plt.figure(figsize=(15,5)) // 變量過多,設置大小
# 畫箱線圖
p = data.boxplot(return_type='dict')
programmer_1(r'D:\XXX\Python\python_data_analysis_and_mining_action-master\chapter3\data\catering_sale_all.xls')
總結
以上是生活随笔為你收集整理的python boxplot pvalue_1.1.1数据质量分析Python boxplot,111,箱,线图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: bool查询原理 es_吐血整理:一文看
- 下一篇: python venv windows7