R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程
生活随笔
收集整理的這篇文章主要介紹了
R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 數據分析的開端,Tidyverse?
tidyverse 是一個清晰的 R 包集合,在數據操作、探索和可視化領域提供統一的數據科學解決方案,這些解決方案具有共同的設計理念。它是由 RStudio 背后的首席科學家 Hadley Wickham 創建的。tidyverse 中的 R 包旨在提高統計學家和數據科學家的工作效率。包引導他們完成工作流程,促進溝通并產生可重復的工作產品。tidyverse 本質上側重于使工作流成為可能的工具的互聯。在數據科學項目中采用 tidyverse有很多優勢。它提供一致的功能、工作流覆蓋范圍、數據科學教育、數據科學工具開發的簡化路徑以及提高生產力的潛力。
它的主要目標之一是幫助任何需要分析數據的人高效地工作。如下圖所示,tidyverse可以幫助你實現:
數據導入/導出
數據清洗處理
批量建模
數據/模型結果可視化
生成(可交互)的分析報告. (eg. pdf, word, ppt)
本文主要討論前兩個目標及數據的創建導入導出,以及數據清洗處理。
-
tidyverse核心:管道操作 %>%
進行數據分析前先導入必要的包和數據:
1library(tidyverse) 2library(rio) 3data("german", package = "rchallenge")首先查看你的數據集:
總結
以上是生活随笔為你收集整理的R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数学建模】MATLAB应用实战系列(八
- 下一篇: 【在CSDN创作2021年度总结】202