當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《深入浅出数据分析》第九章——R语言

發布時間：2023/12/15 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了《深入浅出数据分析》第九章——R语言小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

記錄第一次接觸R語言
一、R語言下載安裝
二、運行
三、補充
- 1.加載csv文件
- 2.hist函數

記錄第一次接觸R語言

《深入淺出數據分析》第九章講到R語言，在這記錄一下，就當給自己做的筆記。

一、R語言下載安裝

安裝地址：https://www.r-project.org/

安裝上沒有什么問題，就根據自己電腦，按著順序來就行了。

二、運行

第一次打開里面長這樣：

書中第九章是要用R繪制直方圖。
所以先加載數據。
書中的數據地址已經變了，這里是新鏈接：https://resources.oreilly.com/examples/9780596153946

之后正式開始加載數據：

先把需要的數據下載
這個地方，書上說直接執行source(“xxx/hfda.R”)即可成功加載數據。但是我在網站上的那個加載不出來。下載到自己文件夾里面之后出來的也不是正常的表格。所以我就直接加載的表格。
https://resources.oreilly.com/examples/9780596153946/blob/master/hfda_ch09_employees.csv
如果有哪個大佬路過知道怎么回事，麻煩評論區踹我一下，蟹蟹蟹蟹。
加載文件
這個里面下載出來的是個csv文件。
語句如下：

employees<-read.table("路徑", sep=",", header=1) // 加載文件 employees$received // 查看該文件的received列

繪制直方圖
執行語句：

hist(employees$received, breaks=50) // 繪制直方圖 // breaks告訴R如何分組，它的數值代表小矩形的數量 break<-sep(0, 100, 2) // 表示范圍為0~100，每個小矩形寬度為2，此時break的值為50

最后圖片長這樣。

sd() & summary()

執行語句：

sd(employees$received) // 求指定數據范圍的標準偏差 summary(employees$received) // 匯總

注意：圖片里面的1st Qu.和3rd Qu.分別代表第一分位數（下四分位數）和第三分位數（上四分位數）。

從大數據集中提取子集

執行語句：

employees$received[employees$year == 2007] // 在已提取出的employees$received中篩選year為2007的數據 employees$received[employees$gender == "F"] // 在已提取出的employees$received中篩選性別為F的數據

三、補充

1.加載csv文件

引用大佬博客，先放在這方便以后尋找。感謝互聯網。
https://blog.csdn.net/zw0Pi8G5C1x/article/details/108191230

2.hist函數

上面有用到breaks參數。
這里補充幾個：

freq
邏輯值，默認值為TRUE , y軸顯示的是每個區間內的頻數，FALSE, 代表顯示的是頻率（= 頻數/ 總數）
main
main=“標題”，居中顯示。
probably
probability : 邏輯值，和 freq 參數的作用正好相反，TRUE 代表頻率， FALSE 代表頻數
labels
顯示在每個柱子上方的標簽。
col
柱子的填充色
border
柱子的邊框的顏色，默認為black, 當border = NA 時，代表沒有邊框

總結

以上是生活随笔為你收集整理的《深入浅出数据分析》第九章——R语言的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：为应对欧盟新能效法规，三星将其 8K 电
下一篇：知名保险箱品牌有哪些