动手学数据分析(四)- 数据可视化
1 初心
本系列筆記用于記錄自己第一次參加Datawhale的組隊學習。自己馬上開啟研究生學習生涯,因此熟練掌握數據分析這一重要技能對未來的學習能夠提供很大的幫助,Datawhale團隊在項目初衷里說數據分析是一個要從一堆數字中看到真相的過程。學會操作數據只是數據分析的一半功力,剩下的另一半要用我們的大腦,多多思考,多多總結,更要多動手,實打實的的敲代碼。所以也希望在學習這門課時,多去推理,多去問問為什么;多多練習,確保理論實踐結合起來,在課程結束的時候一定會有大收獲。
因此希望自己再接下來的11天里面能夠實事求是、腳踏實地完成各項任務,提高自己的硬實力。
特別喜歡一句話:也許不負光陰就是最好的努力,而努力就是最好的自己。
學習內容: 回顧學習完第一章,我們對泰坦尼克號數據有了基本的了解,也學到了一些基本的統計方法,第二章中我們學習了數據的清理和重構,使得數據更加的易于理解;今天我們要學習的是第二章第三節:數據可視化,主要給大家介紹一下Python數據可視化庫Matplotlib,在本章學習中,你也許會覺得數據很有趣。在打比賽的過程中,數據可視化可以讓我們更好的看到每一個關鍵步驟的結果如何,可以用來優化方案,是一個很有用的技巧。
2 數據可視化
開始之前導入numpy、pandas包和數據
%matplotlib inline import numpy as np import pandas as pd import matplotlib.pyplot as plt導入result.csv這個文件
text = pd.read_csv(r'result.csv') text.head()可視化展示泰坦尼克號數據集中男女中生存人數分布情況(用柱狀圖試試)。
sex = text.groupby('Sex')['Survived'].sum() sex.plot.bar() plt.title('survived_count') plt.show()
可視化展示泰坦尼克號數據集中男女中生存人與死亡人數的比例圖(用柱狀圖試試)
可視化展示泰坦尼克號數據集中不同票價的人生存和死亡人數分布情況。(用折線圖試試)(橫軸是不同票價,縱軸是存活人數)
排序后繪折線圖
排序前繪折線圖
可視化展示泰坦尼克號數據集中不同倉位等級的人生存和死亡人員的分布情況。(用柱狀圖試試)
可視化展示泰坦尼克號數據集中不同年齡的人生存與死亡人數分布情況。(不限表達方式)
可視化展示泰坦尼克號數據集中不同倉位等級的人年齡分布情況。(用折線圖試試)
總結
以上是生活随笔為你收集整理的动手学数据分析(四)- 数据可视化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python卸载/重装遇到的问题(以管理
- 下一篇: 联通云的七大“场景云”,能让用户实现云计