机器学习-数据科学库(第一天)
01.數(shù)據(jù)分析的介紹
什么是數(shù)據(jù)分析
數(shù)據(jù)分析是用適當(dāng)?shù)姆椒▽?duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,幫助人們作出判斷,以便采取適當(dāng)行動(dòng)。
數(shù)據(jù)分析流程
03.matplotlib的基礎(chǔ)繪圖
為什么要學(xué)習(xí)matplotlib
matplotlib基本要點(diǎn)
axis軸,指的是x或者y這種坐標(biāo)軸
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14.5,17,20,25,26,26,24,22,18,15]#繪圖 plt.plot(x,y) #顯示圖片 plt.show()04.matplotlib的基礎(chǔ)繪圖和調(diào)整x軸的刻度
調(diào)整x軸的刻度
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14.5,17,20,25,26,26,24,22,18,15] #設(shè)置圖片大小 plt.figure(figsize=(20,8),dpi=60) #繪圖 plt.plot(x,y) #設(shè)置x軸的刻度 plt.xticks(range(2,25)) _xtick_labels = [i/2 for i in range(4,49)] plt.xticks(_xtick_labels[::3]) #保存 plt.savefig(".t1.png") #顯示圖片 plt.show()05.matplotlib的繪制10點(diǎn)到12點(diǎn)的氣溫
繪制10點(diǎn)到12點(diǎn)的氣溫
那么問(wèn)題來(lái)了: ? ? ? ?
如果列表a表示10點(diǎn)到12點(diǎn)的每一分鐘的氣溫,如何繪制折線(xiàn)圖觀(guān)察每分鐘氣溫的變化情況? ?
?a= [random.randint(20,35) for i in range(120)]
from matplotlib import pyplot as plt import random x=range(0,120) y=[random.randint(20,35) for i in range(120)] #繪圖 plt.plot(x,y) #顯示圖片 plt.show()06.matplotlib設(shè)置顯示中文
matplotlib設(shè)置顯示中文
from matplotlib import pyplot as plt import random import matplotlib from matplotlib import font_managermy_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")x=range(0,120) y=[random.randint(20,35) for i in range(120)] plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y)_xtick_lables = ["10點(diǎn){}分".format(i) for i in range(60)] _xtick_lables += ["11點(diǎn){}分".format(i) for i in range(60)] plt.xticks(list(x)[::3],_xtick_lables[::3],rotation=45,fontproperties=my_font) #顯示圖片 plt.show()07.matplotlib的設(shè)置圖形信息
matplotlib的設(shè)置圖形信息
from matplotlib import pyplot as plt import random import matplotlib from matplotlib import font_managermy_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")x=range(0,120) y=[random.randint(20,35) for i in range(120)] plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y)_xtick_lables = ["10點(diǎn){}分".format(i) for i in range(60)] _xtick_lables += ["11點(diǎn){}分".format(i) for i in range(60)] plt.xticks(list(x)[::3],_xtick_lables[::3],rotation=45,fontproperties=my_font) plt.xlabel("時(shí)間",fontproperties=my_font) plt.ylabel("溫度 單位(攝氏度)",fontproperties=my_font) plt.title("10點(diǎn)到12點(diǎn)每分鐘的氣溫變化情況",fontproperties=my_font)#顯示圖片 plt.show()08.繪制多次圖形和不同圖形的差異介紹和總結(jié)
繪制多次圖形和不同圖形的差異介紹和總結(jié)
假設(shè)大家在30歲的時(shí)候,根據(jù)自己的實(shí)際情況,統(tǒng)計(jì)出來(lái)了從11歲到30歲每年交的女(男)朋友的數(shù)量如列表a,請(qǐng)繪制出該數(shù)據(jù)的折線(xiàn)圖,以便分析自己每年交女(男)朋友的數(shù)量走勢(shì)
a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
要求:? ? ?y軸表示個(gè)數(shù) ? ? x軸表示歲數(shù),比如11歲,12歲等
from matplotlib import pyplot as plt import matplotlib from matplotlib import font_managerx=range(11,31) y=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] my_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")#設(shè)置圖形大小 plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y) plt.grid(alpha=0.1)_xtick_lables=["{}歲".format(i) for i in x] plt.xticks(x,_xtick_lables,fontproperties=my_font)#顯示圖片 plt.show()假設(shè)大家在30歲的時(shí)候,根據(jù)自己的實(shí)際情況,統(tǒng)計(jì)出來(lái)了你和你同桌各自從11歲到30歲每年交的女(男)朋友的數(shù)量如列表a和b,請(qǐng)?jiān)谝粋€(gè)圖中繪制出該數(shù)據(jù)的折線(xiàn)圖,以便比較自己和同桌20年間的差異,同時(shí)分析每年交女(男)朋友的數(shù)量走勢(shì)
a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]
要求: ? ? y軸表示個(gè)數(shù) ? ? x軸表示歲數(shù),比如11歲,12歲等
from matplotlib import pyplot as plt import matplotlib from matplotlib import font_managerx=range(11,31) y_1=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] y_2=[1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1] my_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")#設(shè)置圖形大小 plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y_1) plt.plot(x,y_2) plt.grid(alpha=0.1)_xtick_lables=["{}歲".format(i) for i in x] plt.xticks(x,_xtick_lables,fontproperties=my_font)#顯示圖片 plt.show() from matplotlib import pyplot as plt import matplotlib from matplotlib import font_managerx=range(11,31) y_1=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] y_2=[1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1] my_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")#設(shè)置圖形大小 plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y_1,label="自己",color="orange",linestyle=":") plt.plot(x,y_2,label="同桌",color="c",linestyle="-.") plt.grid(alpha=0.5)_xtick_lables=["{}歲".format(i) for i in x] plt.xticks(x,_xtick_lables,fontproperties=my_font)#添加圖例 plt.legend(prop=my_font,loc="upper left") #顯示圖片 plt.show()matplotlib能夠繪制折線(xiàn)圖,散點(diǎn)圖,柱狀圖,直方圖,箱線(xiàn)圖,餅圖等
但是,我們需要知道不同的統(tǒng)計(jì)圖到底能夠表示出什么,以此來(lái)決定選擇哪種統(tǒng)計(jì)圖來(lái)更直觀(guān)的呈現(xiàn)我們的數(shù)據(jù)
對(duì)比常用統(tǒng)計(jì)圖
折線(xiàn)圖:以折線(xiàn)的上升或下降來(lái)表示統(tǒng)計(jì)數(shù)量的增減變化的統(tǒng)計(jì)圖
特點(diǎn):能夠顯示數(shù)據(jù)的變化趨勢(shì),反映事物的變化情況。(變化)
直方圖:由一系列高度不等的縱向條紋或線(xiàn)段表示數(shù)據(jù)分布的情況。
一般用橫軸表示數(shù)據(jù)范圍,縱軸表示分布情況。 特點(diǎn):繪制連續(xù)性的數(shù)據(jù),展示一組或者多組數(shù)據(jù)的分布狀況(統(tǒng)計(jì))
條形圖:排列在工作表的列或行中的數(shù)據(jù)可以繪制到條形圖中。
特點(diǎn):繪制連離散的數(shù)據(jù),能夠一眼看出各個(gè)數(shù)據(jù)的大小,比較數(shù)據(jù)之間的差別。(統(tǒng)計(jì))
散點(diǎn)圖:用兩組數(shù)據(jù)構(gòu)成多個(gè)坐標(biāo)點(diǎn),考察坐標(biāo)點(diǎn)的分布,判斷兩變量 之間是否存在某種關(guān)聯(lián)或總結(jié)坐標(biāo)點(diǎn)的分布模式。
特點(diǎn):判斷變量之間是否存在數(shù)量關(guān)聯(lián)趨勢(shì),展示離群點(diǎn)(分布規(guī)律)
總結(jié)
以上是生活随笔為你收集整理的机器学习-数据科学库(第一天)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Python数据结构与算法(第七天)
- 下一篇: 机器学习-数据科学库(第二天)