打造机器学习工具箱
打造機器學習工具箱
Scipy是一款方便,易于使用,專為科學和工程設計的python工具包,它包括統計,優化,整合,線性代數模塊,傅里葉變換,信號和圖像處理,常微分方程求解器等到。
SciPy安裝
- 使用Pip
pip install -user scipy
安裝的時候強烈建議一次安裝相關庫
pip install --user numpy scipy matplotlib jupyter pandas sympy nose - 使用apt-get
sudo apt-get install python-numpy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose - 更多參照官網
http://www.scipy.org
NLTK簡介
NLTK是一個開源的項目,包括:pytho模塊,數據集和教程,用于NLP的研究和開發。
NLTK由Steven Bird 和 Edward Loper在賓夕法尼亞大學計算機和信息科學系開發。
NLTK包括圖形演示和示例數據,其提供的教程解釋了工具包支持的語言處理任務背后的基本概念。
NLTK的安裝
pip install -U nltk
- 更多安裝方式見https://github.com/nltk/nltk/wiki/Installing-Third-Party-Software
分詞用法
Scikit-Learn(入門庫,樸素貝葉斯,隨機森林,在神經網絡無法很好的實現)
- Scitkit-Learn是基于python的機器學習模塊,基于BSD開源許可證,這個項目最早由在2007年發起的,目前也是由社區志愿者進行維護。
- Scikit-Learn的官方網站上可以找到相關的Scikit-Learn的資源,模塊下載,文檔,例程等等。
- Scikit-Learn的基本功能主要被分為六個部分,分類,回歸,聚類,數據降維,模型選擇,數據預處理,具體可以參考官方網站上的文檔。
Scikit-Learn安裝方法
- 使用pip pip install -U scikit-learn
- 使用conda conda install scikit-learn
- 更多內容參考http://scikit-learn.org/
TensorFlow
Tensor張量Flow數據流
- TensorFlow是一個采用數據流圖,用于數值計算的開源軟件庫,節點在圖中表示數學操作,圖中的線則表示在節點間相互聯系的多維數據數組,即張量。
- 它靈活的架構讓你可以在多種平臺上展開計算,例如臺式計算機中的一個或多個CPU(或GPU),服務器,移動設備等等。
- TensorFlow最初由Google大腦小組(隸屬于Google機器智能研究機構)的研究員和工程師們開發出來,用于機器學習和深度神經網絡方面的研究,但這個系統的通用性使其也可廣泛用于其他計算領域。
TensorFlowde的特點
高度的靈活性,真正的可移植性,將科研和產品聯系在一起,自動求微分,多語言支持,性能最優化
TensorFlowde安裝方法
- 僅使用CPU的版本
pip install https://storage.googlepis.com/tensorflow/linux/cpu/tensorflow-flow-0.5.0-cp27-none-linux_x86_64.whl - 開啟GPU支持的版本(安裝該版本的前提是已經安裝好了CUDA sdk)
pip install https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.5.0-cp27-none-linux_x86_64.whl
基于virtualenv的安裝方法
首先,安裝所有必備的工具:
LINUX上: sudo apt-get install python-pip python-dev python-virtualenv
mac上: sudo easy_install pip #如果還沒有安裝pip
sudo pip install --upgrade virtualenv
轉載于:https://www.cnblogs.com/whatiwhere/p/8997998.html
總結
- 上一篇: 固定div的位置——不随窗口大小改变为改
- 下一篇: 20165301第十周课下补做