R语言数据可视化 ggplot2基础3 添加几何对象
R語言數據可視化 ggplot2基礎3 添加幾何對象 數據的統計變換
- 添加幾何對象
- 數據的統計變換
添加幾何對象
上一講我們介紹的是如何創建散點圖,這一講我們介紹如何創建其他類型的圖,以及怎么創建有多個幾何對象的圖。同樣用用tidyverse自帶的數據mpg舉例,
ggplot2::mpg
在這個數據中,我們比較關注displ與hwy這兩個變量,displ表示引擎尺寸(升),hwy表示高速路上的燃油效率(英里/加侖)。為了展示這兩個變量之間的關系,我們可以嘗試畫一條平滑曲線,平滑方法用LOESS
ggplot(data = mpg)+geom_smooth(method = "loess",mapping = aes(x = displ, y = hwy),formula = "y~x")當然平滑方法是可以換的,比如我們可以用線性平滑,
ggplot(data = mpg)+geom_smooth(method = "lm",mapping = aes(x = displ, y = hwy),formula = "y~x")
我們可以把趨勢線作為一個新的圖層,與上一講畫的散點圖的圖層重疊起來,也就是把趨勢線貼到原始數據上:
Layered Grammar(默認的smooth方法是LOESS)
ggplot()+layer(data = mpg, mapping = aes(x = displ, y = hwy),geom = "point" ,stat = "identity",position="identity")+layer(data = mpg,mapping = aes(x = displ, y = hwy),geom = "smooth" ,stat = "smooth",position="identity")+scale_y_continuous()+scale_x_continuous()+coord_cartesian()兩個圖層的Layered Grammar也可以有做一些簡化(趨勢線周圍的灰色區域是95%置信區間):
ggplot(data = mpg)+geom_point(mapping = aes(x = displ, y = hwy))+geom_smooth(method = "loess",mapping = aes(x = displ, y = hwy),formula = "y~x")
但是即使是上面那三行代碼仍然不是minimal code,因為數據與aesthetics mapping是一樣的,再加上loess是smooth的默認方法,所以上面的三行代碼可以進一步簡化為一行
Minimal Code:
ggplot(data = mpg,mapping = aes(x = displ, y = hwy))+geom_point()+geom_smooth()如果要添加其他功能,比如按顏色展示不同的車型,可以直接在minimal code上添加語句即可
ggplot(data = mpg,mapping = aes(x = displ, y = hwy))+geom_point(mapping = aes(color = class))+geom_smooth()數據的統計變換
這部分我們用diamonds這個數據集舉例。
ggplot2::diamonds
如果我們要展示鉆石不同檔次切工的頻數,可以用直方圖來表示:
畫這個直方圖的Minimal Code是:
ggplot(data=diamonds)+geom_bar(mapping = aes(x = cut))這里用到的創建直方圖幾何對象的函數是geom_bar,對于這種統計圖像的創建,我們對函數之下發生的具體的事情也是很感興趣的,
geom_bar函數使用data=diamonds作為輸入,我們指定了mapping = aes(x = cut),也就是基于diamonds數據集,計算每一種cut的數目,這個功能是由stat_count函數提供的,這一步就是data transformation,在形成的圖像的時候,就是基于data transformation的結果作圖。如果用Layered Grammar省略掉scale與coord代碼如下:
雖然Minimal Code在工程中顯得更有效率,但Layered Grammar更有助于我們在學習中理解ggplot2作圖的邏輯。
我們也可以用頻率直方圖來展示:
ggplot(data=diamonds)+geom_bar(mapping = aes(x = cut,y =..prop..,group = 1))總結
以上是生活随笔為你收集整理的R语言数据可视化 ggplot2基础3 添加几何对象的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计 专题0
- 下一篇: R语言数据可视化 ggplot2基础4