阿里一面被刷经历
今天去參加了阿里的數據挖掘工程師面試,很遺憾,一面被刷了,在此總結一下得失。
首先,一面的面試官很nice,聊得挺好的。
面的數據挖掘崗位,沒有問編程語言的問題,主要是問了我做的兩個項目,一個hadoop和一個多標記的。
針對項目里的一些問題問了一下,并且深入的 基礎知識,這部分達的不好;
最后讓我寫一個Sql查詢,是查詢一個商家店里購買記錄表,查找復購人數量,具體應該是用到group by,因為我sql不是很熟,沒寫出來。
接著又將這個表擴大,用Map/reduce實現上面的查找,問如何對數據進行分片。首先如果按商家分,但是淘寶的商家很多,而且有的商家交易記錄很少,有的交易記錄很大;
后來又說均分,問題是會數據破壞,例如一個商家的數據可能會被分到不同的map里;最后在提示下可以選擇通過用戶ID來分片,因為用戶在一個月的交易數量不會太多,也比較平均。
總結一下:
1.數據挖掘的基礎不是很好,因為我算轉行到數挖的,而且直接做了多標記,基礎的算法理解的不夠透徹。阿里對基礎的要求很高,最好將公式推導并理解;
2.sql方面不是很熟,阿里的數據挖掘對前期的數據處理很關注,基本使用sql去分析一下數據的結構,很重要;
3.阿里的算法并不太高大上,像多標記這種算法在實際中應用很少,更多的是二類、多類分類,線性回歸、邏輯回歸、SVM、決策樹、隨機森林這些算法需要深入理解,并且會實現。
4.需要一定的數學功底和英文的閱讀能力;
5.map/reduce思想最好了解一下,阿里的算法基本都是在ODPS上并行的;
6.對編程語言要求不高,會java/python或其他都行
總結
- 上一篇: Win10 This app can't
- 下一篇: 编译原理 —— 知识结构导图