数据描述与可视化
標準化
注:均值的意義不是很大,容易受到特別大或特別小的數的嚴重影響。使得得出的結果沒有代表性,不夠準確
Data Description
χ2的測試
下象棋與不下象棋的人數之比為1:4,下圖紅色代表假設下象棋與喜歡科幻小說不相關,這時相應的人數之比也應該是1:4
數據的可視化(Data Visualization)
高維數據的處理——Box Plots
高維數據的處理——Parallel Coordinates
文獻的可視化——CiteSpace
Gephi
Gephi是一款開源免費跨平臺基于JVM的復雜網絡分析軟件, 其主要用于各種網絡和復雜系統,動態和分層圖的交互可視化與探測開源工具。可用作:探索性數據分析,鏈接分析,社交網絡分析,生物網絡分析等。
gephi是一款信息數據可視化利器。
注:r=0 說明X和Y線性不相關,但不一定不相關。
箱形圖(Box Plots)
箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。在各種領域也經常被使用,常見于品質管理。它主要用于反映原始數據分布的特征,還可以進行多組數據分布特征的比較。箱線圖的繪制方法是:先找出一組數據的最大值、最小值、中位數和兩個四分位數;然后, 連接兩個四分位數畫出箱子;再將最大值和最小值與箱子相連接,中位數在箱子中間。
作用:能提供有關數據位置和分散情況的關鍵信息,尤其在比較不同的母體數據時更可表現其差異。
? ? ? ? ? 顯示數據的離散的分布情況效果不錯
兩個可視化軟件的名字:CiteSpace、Gephi
總結
- 上一篇: 类别不平衡问题 —— 各种评估指标
- 下一篇: 安全如何入门