【算法】算法秋招个人总结
首先簡單介紹一下我自己的情況,本人將要畢業于某不知名的985統計學碩,算是笨鳥先飛從2020年12月就開始投簡歷準備實習,最后也有幸收到了騰訊ieg增長平臺部的算法offer,之后開始了長達4個月的實習,雖然沒能轉正但是還是感謝我的mentor和一起實習的小伙伴們讓我學到了很多收獲了很多,再然后就開始了我漫長的秋招之旅。截止到現在拿到了阿里、網易、華為等一些廠的offer,最后接了騰訊天美的算法offer結束了整個秋招。在這簡單做一下實習和秋招的一些總結希望能幫上要準備春招和23屆的同學。
01
前期準備
PROJECT REPORT
前期準備就是一些老生常談的內容,包括但不僅限于機器學習的相關知識、推薦算法的相關知識以及數據結構的相關知識等。這些知識屬于算法同學的一個基本功,需要有一個長期的積累的過程,這里我給大家稍微總結一下我在學習這些知識的時候所用到的一些資源。
機器學習相關
面試期間主要看的兩本書一個是周志華的《機器學習》以及李航的《統計學習方法》這兩本書基本把機器學習的一些常用的算法都講了一遍。學習過程中最好把里面的每一個算法相應的數學公式都給認認真真的推導一遍,涉及到的算法細節要弄清楚,因為面試中面試官很可能會對這些細節進行提問。初學者也可以看看course里Andrew Ng的機器學習課程,相信這也是很多人入門機器學習時候必看的入門課程吧。
https://www.coursera.org/learn/machine-learningAndrew Ng機器學習課程
https://www.coursera.org/specializations/machine-learning
http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial
https://www.edx.org/course/artificial-intelligence-ai
https://www.youtube.com/watch?v=jr0zdqhBxBY
http://blog.fukuball.com/lin-xuan-tian-jiao-shou-ji-qi-xue-xi-ji-fa-machine-learning-techniques-di-1-jiang-xue-xi-bi-ji/
推薦系統相關
這里推薦學習項亮的《推薦系統實踐》以及王喆的《深度學習推薦系統》,這兩本書簡要的介紹了推薦系統的構成與發展,里面涉及到的像協同過濾、Wide & deep和DIN等常見的推薦算法都需要熟練掌握,包括模型的基本結構優勢劣勢應用場景等,跟上面提到的原因一樣這些都將是你面試時的必考內容之一。
https://github.com/km1994/RS_paper_study
https://github.com/km1994/GCN_study
https://github.com/km1994/RES-Interview-Notes
數據結構相關
算法面試的最后一環通常都會給你出幾道算法題限時20分鐘左右讓你寫出來,因此數據結構也會是必考內容之一,本人復習的時候主要使用的兩本書一個是《劍指offer》和《代碼隨想錄》,另外還有刷題網站Leetcode和CodeTop這些都能幫你快速上手數據結構??赡艹鯇W者剛開始刷會比較痛苦,但是當你熟練掌握一些基本算法后能感受到刷題速度的明顯提升。
https://leetcode-cn.com/
https://codetop.cc/home
當然光知道知識點還不夠,還需要一些實踐經驗對知識進行補充,能有效提升自己對知識細節的掌握程度,這些經驗可以來自于學校老師給到的項目,也可以通過去公司實習來獲得,如果兩個都沒有也可以考慮參加一些算法類競賽。我本人就屬于后者,之中大大小小參加了十來個這樣的算法類比賽,也取得了一些還不錯的成績,也因為這些成績摸到了大廠的門檻。這里給到一些競賽的baseline供大家學習。
競賽
2021新網銀行金融科技挑戰賽 Baseline
全網首發! 2021 CCF 愛奇藝劇本角色情感識別賽道 baseline
科大訊飛中文成語填空挑戰賽 top1 baseline
結構化比賽: 如何在比賽初期建立一個穩健的 baseline
基于用戶畫像的商品推薦挑戰賽--baseline0.5
練習賽
預測分析·用戶貸款違約預測:
https://www.heywhale.com/home/activity/detail/615ff7bdc270e400182b249e/content
情感分析·推特文本情感分類:
https://www.heywhale.com/home/activity/detail/611cbe90ba12a0001753d1e9
視頻評分預測挑戰賽:
https://www.heywhale.com/home/competition/61a08b7ef2ce6b001732f9c9
02
面試中
PROJECT REPORT
一般一場面試由以下幾個部分組成:自我介紹-項目介紹-技術提問-數據結構與算法題,接下來我將簡單講解一下這幾個階段的一些細節。
1.自我介紹
一個常規的面試通常會在面試一開始讓面試者做一個簡單的自我介紹,時間要求上通常為3到5分鐘,一般不會超過10分鐘,內容上需要簡單的將自己的個人履歷介紹清楚,包括自己的個人信息、教育經歷和自己最近做過什么事等。介紹的過程中需要把握“重點突出”原則,即對于自己熟悉的或者最近在做的事情重點展開來說,而對于自己接觸過但是不熟悉或者時間比較久有所遺忘的事情則可以一筆帶過。
2.項目介紹
簡單的自我介紹結束,面試官通常會讓面試者對自己簡歷上提到的一兩個項目進行展開的介紹,面試官也會根據你的項目介紹來判斷你對項目的熟悉程度以及思考的深度,因此提前準備好尤為重要。面試的過程中,面試者應該將每一個項目按照一定的邏輯敘述出來,當然在算法的項目中最重要的就是數據、特征、模型、效果,按照這個框架把項目講清楚,讓面試官聽懂,這樣接下來的面試也會更流暢一些。這里有個點需要注意的是自己講出來的東西一定要做到比面試官更懂,那些含糊不清的就不要搬進來了,否則遲早會露餡。
3.技術提問
項目介紹結束,面試官會根據你項目中提到的知識點進行提問,所以自己簡歷上寫了那些知識點一定要做到了如指掌,你的簡歷就是面試時候的考試大綱。這里我給大家簡單列舉幾個在我面試過程中經常問到的一些問題,僅供大家參考。
XGBoost為什么使用泰勒二階展開
XGBoost如何處理不平衡數據
比較LR和GBDT,說說什么情景下GBDT不如LR
XGBoost如何評價特征的重要性
XGBoost為什么對缺失值不敏感?相比普通的GBDT,XGBoost怎么處理缺失值?
XGBoost的正則化是如何實現的?
XGBoost和LightGBM的區別
請介紹下常見的幾種集成學習框架:boosting/bagging/stacking
推導一下邏輯回歸的損失函數,并解釋其含義。
在廣告LR模型中,為什么要做特征組合?
為什么 LR 模型要使用 sigmoid 函數,背后的數學原理是什么?為什么不用其他函數?
機器學習中,有哪些特征選擇的工程方法?
廣告點擊率模型中,LR, GBDT+LR, FM, DNN等模型的優點和缺點?實際效果如何?
DIN論文中使用了GAUC作為評價指標,它的好處是什么?
DIEN引入序列信息的動機是什么?
請繪制DIEN各層的結構?興趣抽取層和興趣進化層。
如何理解Wide&Deep模型的Memorization?
Wide&Deep中的Memorization存在哪些缺點?
Wide&Deep模型的創新和優勢是什么?
ESMM是如何解決樣本選擇偏差問題的?
ESMM是如何解決數據稀疏問題的?
ESMM的結構基于“乘”的關系設計而不是基于除的原因是什么?
PLE模型的創新和優勢是什么?
4.算法題
面試的最后就是幾道算法題讓你現場進行coding,題目均來自于Leetcode,所以面試前的刷題就尤為重要。這里同樣列舉幾個我自己在面試中常常遇到的一些算法題。
反轉鏈表
三數之和
手撕快速排序
買賣股票的最佳時機
?二叉樹的層序遍歷
編輯距離
03
面試后
PROJECT REPORT
無論面試失敗與否,每一輪面試結束都需要對整個面試進行復盤,去想想面試中答不出或者答不好的問題的答案是什么,因為相比于面試中緊張的環境面試后輕松的氛圍較利于我們去冷靜思考自身在面試中存在的問題,也能幫助我們在下一次面試中把握機會。
END
往期精彩回顧適合初學者入門人工智能的路線及資料下載中國大學慕課《機器學習》(黃海廣主講)機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載本站qq群955171419,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【算法】算法秋招个人总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 腾讯视频视频下载_如何下载腾讯视频
- 下一篇: 最新!中国内地大学 ESI 排名出炉:3