【算法】我面了N+算法岗候选人,这样的给了SSP
在前幾年我參加秋招的時候,當時幾乎所有大廠的ssp,還有幾家大廠的人才計劃。被好幾家cto/svp/技術委員會主席面試過?,F在也從被面,成長為面試別人。2022校招我參與篩了近百分份簡歷,面了N多同學,作為算法從業人員+面試官,就有了不一樣的視角。
從面試官的角度,給大家講點面試經驗。這是刷面經看不到的東西!
我個人主要是5方面,基礎扎實,知識深度,知識廣度,業務理解,溝通表達對候選人進行考察。
至于問不問leetcode,放在文章結尾了。
聽起來比較玄乎,我們舉一個具體的例子。
案例:小A畢業于北京985高校碩士,是在某資訊APP實習過的同學,手里已經有大廠SSP offer了。他簡歷上寫了一個文本分類的項目。由某APP存在圖文類目錯誤,漏添等,使用人工標注數據,構造了Bert的100多類的文本分類模型,建設新聞類目智能化分類能力,通過模型調優,上線準確率85%。
針對基礎知識方面,
1.講下Bert的基本結構?
2.self-attention的公式是啥?
3.Bert 的預訓練任務是怎樣的?
4.模型的評估指標是啥?
5.模型指標具體的計算細節是啥?
點評:這部分不會問太多,主要是為了確認候選人的在機器學習,深度學習,編程和數據結構等基本知識掌握情況。
針對知識深度方面,
1.Bert之前大家都在用什么方法解決文本分類問題。
2.word2vec了解嗎,有什么弊端?BERT相比有什么優勢?
3.Bert中為什么要在開頭加個[CLS]?有其他代替方法嗎?
4.Bert中有哪些地方用到了mask?各有什么作用?
5.Bert中self attention 計算復雜度如何?如何處理過長文本?
點評:這部分也不會刁難候選人問太多,除了考察下知識深度,也為了確認候選人,簡歷上項目的來龍去脈比較熟悉,對原理的細節比較懂,排除調包,調參俠的可能。
針對知識廣度方面,
1.在你這個場景,標注的類別體系是怎么建立的?有什么機器學習方法可以幫助建立分類問題的類別體系嗎?
2.標注數據的周期有多長,積累了多少數據?如何評判這些數據模型已經夠用了?
3.有什么讓標注數據提升人效的方法嗎?
4.在你這個場景,遇到了新類別的數據怎么辦?有沒有辦法不重新訓練模型,就可以識別新的類目?
5.針對長尾類目,數量過少的問題,你是怎么解決的?除了積累數據,還有別的方法嗎?
點評:這部分問的相對較多,除了確認候選人的知識廣度,還會看看候選人是不是機械完成任務的工具人,對項目有沒有橫向的思考,有沒有主動多想一步的意愿。
針對業務理解方面,
0.這個模型,有多少場景和流量在用?有什么AB測的過程嗎?
1.你這個模型,除了技術上的準確率,在業務上觀測什么指標?
2.這個事情的業務價值體現是什么?提升審核效率嗎?具體怎么量化?上下游都有哪些關鍵業務?
這部分不會為難候選人,特別是沒有實習過的同學,他們可能不會完整的。
點評:這部分會簡單聊一下,主要看候選人在問題拆解,問題解決,技術指標提升,業務指標提升的一個邏輯。有沒有在大的視角關注你做的事情。
關于代碼題!
如果簡歷單薄,實在填不滿面試時間了,我還會問一道算法題。當然如果你前面很充實,是沒有這個環節的。
同一個題目分easy ?medium ?hard三部分。easy問思路暖場,然后問medium的手撕代碼,hard問解題思路。
1.easy ?正整數數數組,任取兩數x1,x2,求|x1-x2|的最小值。
2.medium ?任意兩個正整數數組,從中各取一數,分別為x1和x2,求|x1-x2|的最小值。
3.hard ?任意N個正整數數組,從中各取一數,分別為x1,x2…xn,求 |x1-x2| + |x2-x3|+ |x3-x4|? +... ?+? |xn-1-xn|的最小值。
點評:主要考察候選人的問題解決能力,通過問題拆分,難而化易,舉一反三的能力。
關于溝通表達,
主要體現在耐心傾聽,準確理解。有邏輯、有條理地表達自己的觀點。
有些小技巧:不搶話,回答簡潔,準確,有邏輯性。學習下新聞上領導發言,第一,第二,第三。或者背景,措施,效果等邏輯角度展開講解。
前面5個緯度都ok的話,SSP就手了~
往期精彩回顧適合初學者入門人工智能的路線及資料下載中國大學慕課《機器學習》(黃海廣主講)機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載本站qq群955171419,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【算法】我面了N+算法岗候选人,这样的给了SSP的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 防止u盘中毒的方法
- 下一篇: 【深度学习】我用 PyTorch 复现了