这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
本文是根據Stefan Kojouharov發表在Medium上的文章整理而成的一份人工智能、神經網絡、機器學習、深度學習和大數據方面的速查表。為了便于查找與使用,本文對每個主題進行了分類,希望可以對各位的工作有所幫助。
注意!這可能是相關領域最全的的一份速查表,文末還列出了各種算法的復雜度統計。
神經網絡
圖 1:神經網絡速查表神經網絡圖
圖 2:神經網絡結構圖速查表 圖 3a:神經網絡相關概念速查表(上) 圖 3b:神經網絡相關概念速查表(下)機器學習概覽
圖 4:機器學習速查表機器學習:Scikit-learn 算法
如果在你的項目中出現了一些未知問題,那么這份機器學習速查表可以幫助你快速地找到出問題的那部分。下面這個流程圖可以幫助你快速的瀏覽文檔并快速導航,這可以幫助你更深入的理解問題的原因,同時為你提供對應的解決方案。
圖 5:機器學習速查表Scikit-Learn
Scikit-learn(原scikits.learn) 是基于Python的一款免費機器學習庫。它涵蓋了很多分類、回歸以及聚類算法,包括支持向量機、隨機森林、梯度加速、k-means聚類以及DBSGAN聚類算法。該庫可以與Python的科學計算庫Numpy以及SciPy互操作。
圖 6:Scikit-Learn 速查表機器學習:算法速查表
這份來自微軟Azure的機器學習速查表可以幫助你在解決方案的預分析過程中快速選擇合適的機器學習算法。使用這份速查表時,你可以根據自己的目的和數據特征快速地選擇對應的算法。
圖 7:機器學習速查表Python的數據科學相關功能
圖 8:Python數據科學速查表 圖 9:大數據速查表TensorFlow
2017年5月,Google發布了第二代TPU(張量計算單元),同時在谷歌計算引擎上提供了TPU集群。第二代TPU提供了高達每秒180萬億次的浮點數運算能力,由64個TPU組成的集群可以提供每秒1.15億億次的浮點數運算能力。
圖 10:TensoFlow速查表Keras
2017年,Google的TensorFlow團隊決定在TensorFlow的核心庫中添加Keras支持。Ghollet解釋說,Keras是按接口來設計的,而不是一個端到端的機器學習框架。它代表著更高級、更直觀的使用方式,這使得配置神經網絡變得更為簡單,用戶不需要再去了解復雜的后端科學計算庫。
圖 11:Keras速查表Numpy
Numpy 旨在作為Python的CPython參考實現,它是一個非優化的字節碼解釋器。針對這個Python版本編寫的一些數學算法通常比相同代碼的編譯版本慢一些。Numpy通過提供多維數組和函數,以及在數組上的高效運算符來解決運算緩慢的問題,這需要需要重寫一些代碼,主要是使用NumPy的一些內循環。
圖 12:Numpy速查表Pandas
“Pandas” 這個名稱來源于術語 “面板數據”, 這是多維結構化數據集的一個計量經濟學術語。
圖 13:Pandas速查表數據清洗
“數據清洗”正逐漸滲入流行文化。在2017年的電影《金剛:骷髏島》中,由Marc Evan Jackson扮演的角色Steve Woodward就是一位數據清洗師。
圖 14:數據清洗速查表 圖 15:Pandas數據清洗速查表使用dplyr和tidyr進行數據清洗
圖 16a:基于dplyr和tidyr的數據清洗速查表 圖 16b:基于dplyr和tidyr的數據清洗速查表Scipy
Scipy是基于Numpy數組對象的一個科學計算庫,它是NumPy全家桶(包括Matplotlib、Pandas、SymPy等工具包)的一部分,也是科學計算庫的一個擴展集。這個Numpy全家桶與其他應用程序(如MATLAB、GNU Octave和Scilab)有很多共同的用戶。NumPy全家桶有時也被稱為SciPy全家桶。
圖 17:Scipy速查表Matplotlib
Matplotlib是一個面向Python編程語言及其數學計算庫NumPy的繪圖工具庫。Matplotlib提供了面向對象的API,它使用通用的GUI工具包(例如Tkinter、wxPython、Qt或者GTK+)。雖然也有基于狀態機的程序接口“pylab“(像OpenGL),其設計與MATLAB非常相似,但是大家卻不提倡使用它。SciPy使用了matplotlib。
pyplot是matplotlib中的一個模塊,提供類似MATLAB的接口。按照設計,Matplotlib可以跟MATLAB一樣使用,你可以在Python中使用它,并且是免費的。
圖 18:Matplotlib速查表數據可視化
圖 19:數據可視化速查表 圖 20:ggplot速查表PySpark
圖 21:Pyspark速查表Big-O(時間復雜度)
圖 22:Big-O 算法速查表 圖 23:Big-O算法復雜度表 圖 24:不同數據結構實現算法的時間復雜度 圖 25:不同的數組排序算法時間復雜度關于作者
Stefan是Chatbot’s Life的創始人,這是一家聊天機器人媒體和咨詢公司。到目前為止,Chatbot’s Life每月的瀏覽量超過了150k,成了在線學習Bots\u0026amp;AI的優質資源。同時,Chatbot’s Life還為多家頂級機器人企業提供咨詢工作,例如Swelly、Instavest、OutBrain和NearGrop。
查看英文原文:Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning \u0026amp; Big Data
總結
以上是生活随笔為你收集整理的这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: re:Invent 大会第一天,看看AW
- 下一篇: 爬虫学习日记(一)