python数据可视化是什么_Python数据分析:可视化
本文是《數(shù)據(jù)蛙三個(gè)月強(qiáng)化課》的第二篇總結(jié)教程,如果想要了解數(shù)據(jù)蛙社群,可以閱讀
對(duì)于我們數(shù)據(jù)分析師來(lái)說(shuō),不僅要自己明白數(shù)據(jù)背后的含義,而且還要給老板更直觀(guān)的展示數(shù)據(jù)的意義。所以,對(duì)于這項(xiàng)不可缺少的技能,讓我們來(lái)一起學(xué)習(xí)下吧。
零:準(zhǔn)備工作
畫(huà)圖之前,我們先導(dǎo)入包和生成數(shù)據(jù)集
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
np.random.seed(100)
df = pd.DataFrame(np.random.randint(-10, 10, (10, 3)),
index=pd.date_range("1/1/2000", periods=10), columns=list("ABC"))
df = df.cumsum()
df.head()
我們先看下所用的數(shù)據(jù)集
一:折線(xiàn)圖
折線(xiàn)圖是我們觀(guān)察趨勢(shì)常用的圖形,可以看出數(shù)據(jù)隨著某個(gè)變量的變化趨勢(shì),默認(rèn)情況下參數(shù) kind="line" 表示圖的類(lèi)型為折線(xiàn)圖。
這里默認(rèn)是把索引當(dāng)作了X軸,列作為了Y軸
二:柱狀圖
對(duì)于分類(lèi)數(shù)據(jù)這種離散數(shù)據(jù),需要查看數(shù)據(jù)是如何在各個(gè)類(lèi)別之間分布的,這時(shí)候就可以使用柱狀圖。我們?yōu)槊總€(gè)類(lèi)別畫(huà)出一個(gè)柱子。此時(shí),可以將參數(shù) kind 設(shè)置為 bar 。
這里還是以索引為X軸,列為Y軸。我們還可以改變顯示的軸
當(dāng)然我們還可以變成堆積柱狀圖
三:條形圖
條形圖就是將豎直的柱狀圖翻轉(zhuǎn)90度得到的圖形。與柱狀圖一樣,條形圖也可以有一組或多種多組數(shù)據(jù)。
水平條形圖在類(lèi)別名稱(chēng)很長(zhǎng)的時(shí)候非常方便,因?yàn)槲淖质菑淖蟮接視?shū)寫(xiě)的,與大多數(shù)用戶(hù)的閱讀順序一致,這使得我們的圖形容易閱讀。而柱狀圖在類(lèi)別名稱(chēng)很長(zhǎng)的時(shí)候是沒(méi)有辦法很好的展示的。
四:直方圖
直方圖是柱形圖的特殊形式,當(dāng)我們想要看數(shù)據(jù)集的分布情況時(shí),選擇直方圖。直方圖的變量劃分至不同的范圍,然后在不同的范圍中統(tǒng)計(jì)計(jì)數(shù)。在直方圖中,柱子之間的連續(xù)的,連續(xù)的柱子暗示數(shù)值上的連續(xù)。
五:箱線(xiàn)圖
箱線(xiàn)圖用來(lái)展示數(shù)據(jù)集的描述統(tǒng)計(jì)信息,也就是[四分位數(shù)],線(xiàn)的上下兩端表示某組數(shù)據(jù)的最大值和最小值。箱子的上下兩端表示這組數(shù)據(jù)中排在前25%位置和75%位置的數(shù)值。箱中間的橫線(xiàn)表示中位數(shù)。此時(shí)可以將參數(shù) kind 設(shè)置為 box。
六:散點(diǎn)圖
如果想要畫(huà)出散點(diǎn)圖,可以將參數(shù) kind 設(shè)置為 scatter,同時(shí)需要指定 x 和 y。通過(guò)散點(diǎn)圖可以探索變量之間的關(guān)系。
七:餅狀圖
餅圖是用面積表示一組數(shù)據(jù)的占比,此時(shí)可以將參數(shù) kind 設(shè)置為 pie。
image.png
我們剛開(kāi)始學(xué)習(xí)的同學(xué),最基本應(yīng)該明白什么數(shù)據(jù)應(yīng)該用什么圖形來(lái)展示,同學(xué)們來(lái)一起總結(jié)吧。
總結(jié)
以上是生活随笔為你收集整理的python数据可视化是什么_Python数据分析:可视化的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: java输出1-100之间的全部素数
- 下一篇: 匿名内部类----java