python足球数据分析_我用Python对科比NBA生涯进行了一个数据分析
我是一個NBA的球迷,一直很喜歡科比的球風和“曼巴精神”,于是想寫一篇文章看一下他的整個NBA生涯的數據情況是怎樣的,這應該是一件有趣的事情。
使用工具:Ipython notebook
用到的庫:Pandas,Matplotlib
1.數據來源
本次用到的數據來源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以選擇多種形式,我選的是CSV格式,方便后面的數據分析,看看數據長什么樣呢
2.導入數據
1).數據集是一個下載好的csv文件( csv是數據分析金牌御用文件格式),我們把數據導入到pandas之后,初步分析一下
>>
(20, 30) #數據集是一個20行30列的大表格,正好是20年的數據
看一些數據的基本統計分析信息:
20年平均得分是24.2分,相當厲害,最高得分是35.4,最低7.6,那我們繼續橫向探索數據
2).接下來就可以繼續分析了,一般來說,我們經常關注的是球員的得分,籃板,助攻,搶斷和蓋帽的能力,所以我們可以從這5個方面來分析,先來看一下科比的得分的基本情況
>>
常規賽總得分: 33633.3
常規賽場均得分: 24.9875928678
3).這里的總分會有偏差(實際總分是33643)
因為是根據每賽季的場均得分和場次得來的,所以數據會有出入,科比的得分巔峰是哪個賽季呢 ? 場均得分又是多少?只需兩行代碼就解決問題:
max_point=data.PTS.max()print(data[data.PTS==max_point])
>>
3).科比的巔峰賽季
科比的巔峰是在05-06賽季,27歲的時候,場均35.4分,要知道場均能上30分就已經很了不起了,果然是巔峰科比,進攻火力太猛了,那我們接著看一下上30分的有哪些賽季
print(data.loc[data.PTS>=30])
>>
30分以上的賽季有02-03,05-06和06-07
4).看一下這20年來各項的最強科比的數據
>>
assistants 6.3
blocks 1.0
point 35.4
rebounds 6.9
steals 2.2
dtype: float64
3.可視化數據
1).為了更好的展現數據的魅力,我們用matplotlib畫個圖看看吧
x軸用20年(1997-2016)的年份
y軸是每個賽季的得分情況
用數據可視化可以非常清晰的看出,96-97剛起步的時候,進步非常快,幾乎是火箭般的快速上升,然后30分左右徘徊了3-4年。突然爆發了,黃金賽季在06-07人生頂峰35分,而2014開始慢慢走向低谷,哪到底發生了什么了呢
2).其他的籃板,助攻,搶斷和蓋帽都可以仿照得分的方式來分析,表中分別對應TRB,AST,STL,BLK,看一下大致情況就好
籃板
助攻
結合前面的數據,我們發現從2013年開始從得分王,開始慢慢的轉為助攻王,助攻的得分明顯上升甚至達到職業生涯的頂峰,猜想也許是因為體能或者傷痛的原因,轉為助攻
有開發者發布了一個網站以對 Python 2.7 的“退休”進行倒計時。
可以看到 Python 2.7 預計將于兩年后退休。
該開發者表示,由于官方尚未放出準確的日期,所以預計 Python 2.7 于 2020 年 4 月 12 日退休,這是到時 PyCon 的舉辦時間。
Python 2,感謝您多年以來的忠誠服務。
Python 3,現在到你登場了。
Python 2.7 是 2.x 系列的最后一個版本,它的繼承者 Python 3.0 在 2008 年 12 月發布,但不兼容 2.x 系列,3.0 的許多特性和語法向后移植到了 2.6 和 2.7。2.7 的支持時間將最少為 10 年,2020 年前會一直提供 bug 修正。
如何轉換到 Python 3?
如果你主要的代碼仍然基于 Python 2,這是完全可以理解的。PyPI 的大部分流行軟件包現在都可以在 Python 2 和 Python 3 上運行,而且每天都會增加更多。為了簡化轉換, 官方移植指南提供了在 Python 3 中運行 Python 2 代碼的建議。
結論:
上面這個小例子非常適合小白入門數據分析,綜合了很多知識,非常不錯,大家若有什么問題,歡迎留言討論.
總結
以上是生活随笔為你收集整理的python足球数据分析_我用Python对科比NBA生涯进行了一个数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用Elasticsearch代替数据库存
- 下一篇: FF14 Anamnesis 使用教程