关于大数据与机器学习,小白和牛人之间15个典型问答精华整理上篇
問:不同的語言在數據處理以及算法計算過程中性能的差別是否很大?
答:就目前的經驗來看,使用C或者C++的效率確實要比PYTHON高一些,但是沒有差到一個數量級的差別。PYTHON程序的維護成本比C或C++感覺還是要略低一些,在生產中可以考慮用硬件數量進行彌補。
問:請問入門機器學習需要哪些基礎知識呢?
答:如果想走得遠,微積分、概率,這些肯定是跑不了的。 然后就可以是各種聚類分類算法,這部分還是比較好理解的,甚至沒有微積分的知識也基本不影響理解。 最后是深度學習的部分,這部分說實話其實還是挺有難度的。
問:算法模型是自己建造,還是有專家開源
答: 開源的工具能解決很多問題,算法一般不用調整。但是不排除你在優化的時候根據自己的需求做修改。
這里有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、 爬蟲、數據分析、數據可視化、機器學習等。 小編這里推薦加小編的python學習群:895,817, 687問:目前機器學習進行到了哪個階段? 對于軟件功能的自動化測試,是否可以讓機器人自己學習需求,根據設計文檔來進行測試? 答:理論上確實是可行的。 不過對設計文檔進行特征化的過程恐怕是個非常不確定的過程。 問題一、設計文檔的標準化問題是不是做到位了?問題二、有多少樣本來供訓練?
訓練是一個監督學習的過程,要把“文檔”和“對應的測試行為”這樣的關聯告訴學習引擎才可以。
問:數學基礎對后面的學習很重要么?我是個高數很渣的java程序員
答:數學基礎對后面還是比較重要的,很多書籍里講解算法都有數學公式推導,至少需要能看懂公式是什么意思
問:在學習前是否要復習下微積分、概率論知識?
答:邊學技術邊復習數學知識就行,遇到問題再去學習,不用刻意先復習一遍。
問:我做了5年的Web開發?,F在就職的公司不大,數據量也才百萬級。我想知道您對數據分析的理解和如何正確利用數據分析得到的結果。我想在大數據方向有所發展,希望能在學習路線上給點建議。
答:大數據的真實含義不是數據量大,而是具有豐富的數據維度。數據的價值不在于多在于能夠挖掘出有價值的信息從而消除不確定性,降低試錯成本。
很大一部分的數據分析是有試探性的,日常的工作中更多的是做指標漲跌的關聯分析,分析好這些已經能為公司解決很多問題了。
其它方面的應用其實不一定在每個公司里都有機會去做,比如推薦系統(典型的機器學習應用場景),如果你的數據維度不足夠支撐,或者業務形態不是面向大眾的,那很可能無法成行。
學習路線你可以看一下這篇文章:https://my.oschina.net/ijj/blog/878119
總結
以上是生活随笔為你收集整理的关于大数据与机器学习,小白和牛人之间15个典型问答精华整理上篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 经典4大Python面试题!初级者,你所
- 下一篇: selenium+python面试题目总