python数据科学实践指南_《Python数据科学实践指南》——导读-阿里云开发者社区...
前 言
為什么要寫這本書
我接觸大數(shù)據(jù)技術(shù)的時間算是比較早的,四五年前當(dāng)大數(shù)據(jù)這個詞火遍互聯(lián)網(wǎng)的時候,我就已經(jīng)在實驗室里學(xué)習(xí)編程及算法的知識。那個時候我一心想要做學(xué)術(shù),每天閱讀大量的英文文獻(xiàn),主要興趣更多的是在機器人和人工智能上。研究生畢業(yè)時我本來想實現(xiàn)早先的愿望,繼續(xù)攻讀博士學(xué)位,不過思來想去覺得不應(yīng)該錯過大數(shù)據(jù)這個機會,所以毅然決定投入大數(shù)據(jù)行業(yè)中。
在工作之初,市面上已經(jīng)存在一些介紹大數(shù)據(jù)相關(guān)技術(shù)的權(quán)威著作,其中很多還是很底層的或特定領(lǐng)域的專著。但即使是我這種自詡為“學(xué)院派”的人看這些書,頭腦也會經(jīng)常開小差。而大數(shù)據(jù)相關(guān)的技術(shù)又特別龐雜,包括計算框架、網(wǎng)絡(luò)爬蟲、機器學(xué)習(xí)算法、編程語言、數(shù)據(jù)庫、文本分析、數(shù)據(jù)流水線的架構(gòu),甚至還包括前端可視化等眾多方面,只有對它們都有涉獵,才能更好地勝任相關(guān)的工作。所以我讀過很多的相關(guān)圖書,這確實為我以后的工作打下了堅實的基礎(chǔ),不過隨著工作內(nèi)容的增加,以及新同事的到來,更多的問題相繼涌現(xiàn)。首當(dāng)其沖的就是,并不是每個人都有足夠的基礎(chǔ)來閱讀這些專業(yè)著作,而且每個人的情況各不相同,有的是編程基礎(chǔ)差,有的是數(shù)學(xué)基礎(chǔ)差,有的是英語基礎(chǔ)差,這也導(dǎo)致我的這套學(xué)習(xí)方法難以推廣開來。所以我想寫一本關(guān)于大數(shù)據(jù)技術(shù)的手冊,其目的并不是為讀者講明白所有技術(shù)背后的原理,而是告訴讀者某項技術(shù)可以用于哪些工作中,哪些工作需要哪些工具。
讀完這本手冊,可以幫助讀者建立一個相對完整的大數(shù)據(jù)生態(tài)的概念,其中所講的每一個工具都值得讀者進(jìn)行更深入的研究(你也可以像我一樣,對其中的兩三項進(jìn)行非常深入的研究),也許在研究過程中,你會成為該領(lǐng)域的專家。如果現(xiàn)在正在看這本書的你是一位技術(shù)決策者,那么我希望本書的介紹能幫助你下定決心使用其中的某項技術(shù),比如寫作全書的Python語言就是一門非常好的數(shù)據(jù)處理語言,它能快速編碼,且具有強大的字符串處理能力,擁有大量成熟的大數(shù)據(jù)類庫,這些都使Python成為數(shù)據(jù)科學(xué)領(lǐng)域無可爭議的No. 1語言;或許你的團(tuán)隊可以僅用Python編寫大規(guī)模分布式爬蟲程序(雖然本書介紹的是單機的簡化版)就能大幅度地提升工作的效率。Scrapy可能是爬蟲領(lǐng)域最有名的框架了,你也可以像我一樣實現(xiàn)屬于你自己的版本。當(dāng)然這本書也是一本Python入門書,所以讀者無須擔(dān)心閱讀門檻,你可以從零基礎(chǔ)開始學(xué)習(xí),并體驗整個學(xué)習(xí)過程所帶來的愉悅。
目 錄
[第0章 發(fā)現(xiàn)、出發(fā)
0.1 何謂數(shù)據(jù)科學(xué) ](https://yq.aliyun.com/articles/119372/)
0.1.1 海量的數(shù)據(jù)與科學(xué)的方法
0.1.2 數(shù)據(jù)科學(xué)并不是新概念
0.1.3 數(shù)據(jù)科學(xué)是一個系統(tǒng)工程
0.2 如何成為數(shù)據(jù)科學(xué)家
0.3 為什么是Python
0.4 一個簡單的例子
[第1章 Python介紹
1.1 Python的版本之爭 ](https://yq.aliyun.com/articles/119389/)
1.2 Python解釋器
1.2.1 Mac OS X系統(tǒng)
1.2.2 Linux系統(tǒng)
1.2.3 Windows系統(tǒng)
1.3 第一段Python程序
1.4 使用Python shell調(diào)試程序
[第2章 Python基礎(chǔ)知識
2.1 應(yīng)當(dāng)掌握的基礎(chǔ)知識 ](https://yq.aliyun.com/articles/119418/)
2.1.1 基礎(chǔ)數(shù)據(jù)類型
2.1.2 變量和賦值
2.1.3 操作符及表達(dá)式
2.1.4 文本編輯器
2.2 字符串
2.3 獲取鍵盤輸入
2.4 流程控制
2.4.1 條件判斷
2.4.2 循環(huán)
2.4.3 縮進(jìn)、空白和注釋
總結(jié)
以上是生活随笔為你收集整理的python数据科学实践指南_《Python数据科学实践指南》——导读-阿里云开发者社区...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 乱序图片 极验_极验验证吴渊:传统图片验
- 下一篇: git gui怎么拉取项目代码_Git可