python大数据书籍推荐-大数据入门书籍推荐《Python 大数据基础》
本書系統地講解了大數據處理相關的過程,并通過Python程序的例子講解了如何使用Python語言對數據進行采集、存儲、分析及可視化。本書的章節設計以目標為導向,首先介紹大數據處理各個環節要做什么事情,然后講解如何使用Python達到對應的目標。
本書有配套的課件、代碼和課后練習題答案,有需要的讀者可登錄出版社網站,免費下載。書中給出的例子和數據文件都保存在source目錄下對應章節的子目錄下。
目錄
第1章 大數據基礎1
1.1 什么是大數據1
1.2 大數據處理涉及哪些方面3
1.3 為什么用Python解決大數據的問題5
1.4 關于編程的注意事項7
練習題7
第2章 Python環境的準備8
2.1 Python環境的準備8
2.1.1 Python8
2.1.2 Anaconda10
2.2 集成開發環境12
2.2.1 PyCharm12
2.2.2 Spyder15
2.2.3 IPython和Jupyter18
2.3 包的管理和維護19
2.3.1 pip20
2.3.2 conda和Anaconda22
2.4 大數據處理常用的擴展包26
2.4.1 NumPy26
2.4.2 Pandas26
2.4.3 Matplotlib27
2.4.4 SciPy27
2.4.5 scikit-learn28
練習題28
第3章 大數據獲取29
3.1 如何獲取數據29
3.2 HTML的基礎知識30
3.2.1 HTML頁面的獲取與顯示30
3.2.2 單次請求與響應32
3.2.3 HTML網頁內容和結構34
3.3 HTML頁面的解析36
3.3.1 使用正則表達式提取信息36
3.3.2 使用XPath提取信息44
3.3.3 使用BeautifulSoup提取信息47
3.4 頁面的獲取59
3.4.1 使用urllib60
3.4.2 使用requests庫獲取網頁67
3.4.3 使用selenium獲取網頁74
3.4.4 網頁抓取面臨的問題79
3.5 Python爬蟲框架Scrapy82
練習題87
第4章 大數據存儲90
4.1 文件存儲91
4.1.1 CSV92
4.1.2 XML97
4.1.3 JSON103
4.1.4 Excel108
4.2 數據庫存儲110
4.2.1 關系型數據庫通用流程110
4.2.2 SQLite關系型數據庫113
4.2.3 MySQL關系型數據庫118
4.2.4 NoSQL數據庫125
練習題129
第5章 大數據的數學基礎132
5.1 基本的數據結構和運算132
5.1.1 數組對象的創建與屬性132
5.1.2 數組對象的元素級運算138
5.2 矩陣運算141
5.2.1 數組的合并、拆分及切片141
5.2.2 矩陣的乘積與線性代數144
5.3 統計與概率計算150
5.4 隨機數生成153
練習題157
第6章 數據預處理158
6.1 數據清洗158
6.1.1 缺失值處理158
6.1.2 噪聲數據處理163
6.1.3 數據錯誤發現與修復167
6.2 數據集成167
6.3 數據轉換176
6.3.1 z-score規范化177
6.3.2 最大最小規范化182
6.3.3 屬性轉換184
6.4 數據歸約186
練習題187
第7章 數據挖掘與分析189
7.1 模型選擇與驗證189
7.1.1 模型選擇189
7.1.2 模型驗證190
7.2 分類算法192
7.2.1 分類學習的性能評估193
7.2.2 邏輯回歸197
7.2.3 支持向量機201
7.2.4 樸素貝葉斯204
7.2.5 決策樹207
7.2.6 實例分析211
7.3 回歸預測215
7.3.1 回歸學習的性能評估215
7.3.2 線性回歸216
7.3.3 支持向量機(回歸)217
7.3.4 等式回歸218
7.3.5 決策樹(回歸)218
7.3.6 實例分析219
7.4 聚類分析222
7.4.1 基于距離的聚類223
7.4.2 基于密度的聚類算法225
7.4.3 基于層次的聚類算法227
7.4.4 聚類的性能評價228
7.4.5 實例分析231
7.5 主成分分析232
練習題232
第8章 大數據可視化235
8.1 數據可視化基礎235
8.2 使用Matplotlib繪圖239
8.2.1 準備環境239
8.2.2 圖表相關的術語240
8.3 使用Matplotlib繪制常見圖表242
8.3.1 散點圖242
8.3.2 折線圖246
8.3.3 條形圖248
8.3.4 直方圖252
8.3.5 面積圖253
8.3.6 餅圖254
8.3.7 箱形圖256
8.4 進階功能258
8.4.1 子圖258
8.4.2 中文顯示262
8.4.3 組合圖形與標注264
8.5 如何畫出更好的圖267
總結
以上是生活随笔為你收集整理的python大数据书籍推荐-大数据入门书籍推荐《Python 大数据基础》的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Firefox扩展开发
- 下一篇: 游戏服务器运维需要注意,网络游戏服务器维