《深入浅出数据分析》第十章第十一章
生活随笔
收集整理的這篇文章主要介紹了
《深入浅出数据分析》第十章第十一章
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄
- R語言
- 一、散點圖
- 二、補充
R語言
從上一章開始,就都涉及到R語言的內容了,在這記錄一下,就當給自己做的筆記。
一、散點圖
這次要繪制的是散點圖,并且求出它的回歸方程。
這個圖主要是比較職員期望的加薪幅度和實際的加薪幅度,并且依據數據建立回歸模型,用來分析加薪幅度,以便獲取大幅度的加薪。
最后圖片長這樣。
r用來量度變量的相關性。r的范圍為-1~1,0表示無相關性,1和-1則表示這兩個變量完全相關。
每當R創建一個線性模型,R就會在記憶庫里創建一個對象,這個對象有一長串屬性,其中包括回歸方程的系數。知道了系數就能寫出回歸方程咯。
這里出現均方根誤差(又稱機會誤差或σ),這是第十一章的內容。
在使用回歸方程進行預測的時候,難免會出現誤差,我們可以用均方根誤差來定量表示殘差分布,即表現出觀察結果相對于回歸線的平均偏移量。
也可以直接通過代碼語句直接查看均方根誤差的值。
summary(myLm)$sigma從上面的散點圖可以看出來,左側的數據誤差很小,二右側的數據誤差較大。所以直接計算出來的回歸方程的誤差就會較大。因此為了減小誤差,我們選擇分割數據,將左側和右側的數據分割開,分別計算各自的回歸曲線及均方根誤差。
這里就直接展示拆分后對比了。
二、補充
- lm函數
lm函數用于擬合回歸模型,是擬合回歸模型里面最基本的函數。
格式如下:
formula指要擬合的數據模型;
data指用于擬合的數據。
之后返回的對象中包含該擬合模型的信息。
- plot()
總結
以上是生活随笔為你收集整理的《深入浅出数据分析》第十章第十一章的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 知名保险箱品牌有哪些
- 下一篇: 进pe不显示固态硬盘怎么办(华硕主板认不