《深入浅出数据分析》第九章——R语言
文章目錄
- 記錄第一次接觸R語言
- 一、R語言下載安裝
- 二、運行
- 三、補充
- 1.加載csv文件
- 2.hist函數
記錄第一次接觸R語言
《深入淺出數據分析》第九章講到R語言,在這記錄一下,就當給自己做的筆記。
一、R語言下載安裝
安裝地址:https://www.r-project.org/
安裝上沒有什么問題,就根據自己電腦,按著順序來就行了。
二、運行
第一次打開里面長這樣:
書中第九章是要用R繪制直方圖。
所以先加載數據 。
書中的數據地址已經變了,這里是新鏈接:https://resources.oreilly.com/examples/9780596153946
之后正式開始加載數據:
- 先把需要的數據下載
這個地方,書上說直接執行source(“xxx/hfda.R”)即可成功加載數據。但是我在網站上的那個加載不出來。下載到自己文件夾里面之后出來的也不是正常的表格。所以我就直接加載的表格。
https://resources.oreilly.com/examples/9780596153946/blob/master/hfda_ch09_employees.csv
如果有哪個大佬路過知道怎么回事,麻煩評論區踹我一下,蟹蟹蟹蟹。 - 加載文件
這個里面下載出來的是個csv文件。
語句如下:
- 繪制直方圖
執行語句:
最后圖片長這樣。
- sd() & summary()
執行語句:
sd(employees$received) // 求指定數據范圍的標準偏差 summary(employees$received) // 匯總
注意:圖片里面的1st Qu.和3rd Qu.分別代表第一分位數(下四分位數)和第三分位數(上四分位數)。
- 從大數據集中提取子集
執行語句:
employees$received[employees$year == 2007] // 在已提取出的employees$received中篩選year為2007的數據 employees$received[employees$gender == "F"] // 在已提取出的employees$received中篩選性別為F的數據三、補充
1.加載csv文件
引用大佬博客,先放在這方便以后尋找。感謝互聯網。
https://blog.csdn.net/zw0Pi8G5C1x/article/details/108191230
2.hist函數
上面有用到breaks參數。
這里補充幾個:
-
freq
邏輯值,默認值為TRUE , y軸顯示的是每個區間內的頻數,FALSE, 代表顯示的是頻率(= 頻數/ 總數) -
main
main=“標題”,居中顯示。 -
probably
probability : 邏輯值,和 freq 參數的作用正好相反,TRUE 代表頻率, FALSE 代表頻數 -
labels
顯示在每個柱子上方的標簽。 -
col
柱子的填充色 -
border
柱子的邊框的顏色,默認為black, 當border = NA 時, 代表沒有邊框
總結
以上是生活随笔為你收集整理的《深入浅出数据分析》第九章——R语言的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为应对欧盟新能效法规,三星将其 8K 电
- 下一篇: 知名保险箱品牌有哪些