python生物数据分析_Python学生物统计-数据可视化-学习笔记5
5.1 作圖的重要性
在分析一個數據之前, 我們首先要對數據進行檢查, 在統計上看一下匯總統計, 比如最大值, 最小值, 中位數, 平均值, 方差, 標準差, 變異系數等等.直方圖, 看一下數據的分布情況
箱線圖, 看一下數據的分布, 有無異常值
所謂一圖勝千言.
python中的作圖工具
5.2 散點圖
# Import standard packages
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import scipy.stats as stats
import seaborn as sns
這里生成了500個隨機數, 使用plot進行作圖
# Generate the data
x = np.random.randn(500)
# Plot-command start ---------------------
plt.plot(x, '.')
# Plot-command end -----------------------
# Show plot
a2 = plt.show()
5.3 直方圖
a3 = plt.hist(x,bins=25)
5.4 箱線圖
a4 = plt.boxplot(x);
?
練習corn.csv
corn是R包agridat中的smith.corn.uniformity玉米數據, 我們來看一下如何對其可視化?
row col plot year yield
1 20 1 101 95 30.0
2 19 1 102 95 29.1
3 18 1 103 95 25.7
4 17 1 104 95 26.3
5 16 1 105 95 30.3
6 15 1 106 95 31.1
首先, 在R中將其保存為corn.csv, 保存到D盤根目錄(方便讀取)
library(agridat)
data(smith.corn.uniformity)
dat = smith.corn.uniformity
head(dat)
write.csv(dat,"d:/corn.csv",row.names = F)
用python讀取數據, 使用pandas包
import pandas as pd
corn = pd.read_csv("d:/corn.csv")
查看前六行
corn.head()
row col plot year yield 0 20 1 101 95 30.0 1 19 1 102 95 29.1 2 18 1 103 95 25.7 3 17 1 104 95 26.3 4 16 1 105 95 30.3
對產量yield作圖
import matplotlib.pyplot as plt
c1 = plt.plot(corn["yield"],".")
c2 = plt.hist(corn["yield"])
c3 = plt.boxplot(corn["yield"])
總結
以上是生活随笔為你收集整理的python生物数据分析_Python学生物统计-数据可视化-学习笔记5的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据库表名大小写_某教程学习笔记(一):
- 下一篇: appium java 点击事件_jav