机器学习面试题(转)
面試了 8 家公司,他們問了我這些機(jī)器學(xué)習(xí)題目……
翻譯 | 王柯凝
出品 | AI 科技大本營(yíng)(公眾號(hào) ID:rgznai100)
【導(dǎo)讀】今年年初以來,作者一直在印度找數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)領(lǐng)域的工作。在找工作的這三十四天里,他面試了 8 到 10 家公司,其中也包括初創(chuàng)公司、基于服務(wù)的公司以及基于產(chǎn)品的公司。作者希望他的面試經(jīng)驗(yàn)?zāi)軌驗(yàn)榍舐氄咛峁┮恍┯杏玫男畔?#xff0c;因而撰寫了此文。希望你讀后能夠有所收獲!
首先自我介紹一下:
我在機(jī)器學(xué)習(xí)(語(yǔ)音分析、文本分析和圖像分析領(lǐng)域應(yīng)用)領(lǐng)域有 4 年以上的從業(yè)經(jīng)驗(yàn)。總的來說,我認(rèn)為這個(gè)領(lǐng)域的大多數(shù)工作職位主要包括文本分析(自然語(yǔ)言處理)和圖像分析(計(jì)算機(jī)視覺)。很少有公司招聘語(yǔ)音或音頻分析的人才。我現(xiàn)在的目標(biāo)是應(yīng)聘一個(gè)中高級(jí)職位,可以帶領(lǐng)一個(gè)深度學(xué)習(xí)或機(jī)器學(xué)習(xí)團(tuán)隊(duì)做一些有趣的項(xiàng)目。
下面是我在應(yīng)聘過程中被問到的問題,希望能夠?qū)δ阌兴鶐椭?/p>
公司一:基于全球性服務(wù)的某公司(面試時(shí)長(zhǎng):20-25min)
體驗(yàn)****:除此之外面試官還問了一些問題,但是都把我問懵了,我完全不知道他想聽到什么答案。我一直都想深入的聊一些技術(shù)層面的問題,比如訓(xùn)練一個(gè) tesseract(一款由 HP 實(shí)驗(yàn)室開發(fā)由 Google 維護(hù)的開源 OCR 引擎)或語(yǔ)言模型,但是他似乎并不感興趣。或許他只是想聽到一些已經(jīng)實(shí)現(xiàn)的成果或者是一個(gè)好的解釋,又或者是一些更好的方案。我感覺他們面試一個(gè)新手和面試一個(gè)有經(jīng)驗(yàn)的專業(yè)人員之間并沒有什么區(qū)別。
公司二:基于全球性服務(wù)的某公司(面試時(shí)長(zhǎng):40-45min)
在無監(jiān)督學(xué)習(xí)中,如何進(jìn)行文件聚類?
如何找到與某些查詢語(yǔ)句 / 搜索相關(guān)的文件?
解釋下 TF-IDF 技術(shù)。
根據(jù)我的經(jīng)驗(yàn)來看,TF-IDF 技術(shù)在文件分類或聚類上效果并不好,你將如何改進(jìn)?
什么是長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)? 解釋下其工作原理。
什么是 word2vec 模型?
解釋下 python 中的可變對(duì)象和不可變對(duì)象。
你在 python 中使用過什么數(shù)據(jù)結(jié)構(gòu)?
體驗(yàn): 整個(gè)面試過程都是圍繞著文本相似度提問的,我都順利通過了。但是這次仍舊沒有更深層次的技術(shù)探討。或許是公司在文本分析領(lǐng)域有幾個(gè)小項(xiàng)目,最終我拿到了公司的 offer。
公司三:基于全球性產(chǎn)品和服務(wù)的某公司(面試時(shí)長(zhǎng):40min)
** 體驗(yàn)?:** 還有幾個(gè)問題我已經(jīng)記不清了,這是我第一次在面試中深入談?wù)摷夹g(shù)細(xì)節(jié),隨后我也拿到了這家公司的 offer。
公司四:成立一年的醫(yī)療初創(chuàng)公司(面試時(shí)長(zhǎng):50min)
體驗(yàn): 還有幾個(gè)很好的問題我沒有記住。盡管整個(gè)面試過程很不錯(cuò),但是我們?cè)谝恍﹩栴}上看法并不一致。并且在面試期間,我發(fā)現(xiàn)作為一個(gè)初創(chuàng)公司,目前只有 2-3 個(gè)人在做 ML、DL 和 DS。最后我沒有面試成功。
公司五:亞馬遜公司(面試時(shí)長(zhǎng):50-55min)
體驗(yàn): 我面試的是亞馬遜 level 6 的職位。他們的主要關(guān)注點(diǎn)是在算法和數(shù)學(xué)上。但是我并沒有準(zhǔn)備數(shù)學(xué)方面的知識(shí),我只是談?wù)摿宋宜私獾臇|西,并沒有在數(shù)學(xué)的細(xì)節(jié)上做更為詳細(xì)的探討,因此面試官認(rèn)為我并不適合 level 6 的工作。我相信如果你能記住機(jī)器學(xué)習(xí)算法在數(shù)學(xué)上的通用表示,就可以很輕松的通過亞馬遜技術(shù)面試。
公司六:某全球服務(wù)巨頭(面試時(shí)長(zhǎng):50-55min)
體驗(yàn): 我也拿到了這家公司的 offer。事實(shí)上,我很喜歡這次技術(shù)交流。或許你會(huì)覺著這些問題是機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域最基礎(chǔ)的問題,但是我感覺面試官可能不是這一領(lǐng)域的,或者是對(duì)這個(gè)領(lǐng)域的發(fā)展了解的并不多。
公司七:全球性商業(yè)管理公司(面試時(shí)長(zhǎng):25-30min)
體驗(yàn): 說實(shí)話,這次面試有點(diǎn)水,以至于我沒有認(rèn)真對(duì)待。但是問題問的很不錯(cuò)。我面試的職位是要帶領(lǐng)一個(gè)十五六人的團(tuán)隊(duì)做項(xiàng)目,在這之后是經(jīng)理面試和 HR 面試。最終他們給我提供了崗位咨詢以及不錯(cuò)的薪資。
公司八:成立 4 年的生產(chǎn)和服務(wù)型公司(60 分鐘)
體驗(yàn): 是的,你可能會(huì)驚訝這都是些什么問題。巧合的是,我們兩個(gè)人的研究領(lǐng)域都是語(yǔ)音分析(尤其是發(fā)音識(shí)別)。所以整個(gè)面試過程一直在圍繞語(yǔ)音分析進(jìn)行提問。很顯然,面試官很專業(yè),并且給了我一個(gè)正面反饋。之后,這家公司給我提供了 AI 解決方案架構(gòu)師的工作。
一些建議
在這整個(gè)求職過程中,我大概和 25-30 位專業(yè)人士有過交流,下面是我為讀者以及求職者提出的建議:
- 簡(jiǎn)歷很重要。一定要在簡(jiǎn)歷中寫清楚你參加過的項(xiàng)目、Kaggle 競(jìng)賽、獲得的 MOOC 課程證書或者論文。我就是在沒有任何推薦人推薦的情況下接到了亞馬遜的面試電話。你的簡(jiǎn)歷是打動(dòng) HR 和面試官的利器。
- 自信心和熱情是成功的一半。參加面試時(shí)一定要自信,并且向面試官展示出你的熱情(這一點(diǎn)在面試創(chuàng)業(yè)公司和基于服務(wù)的公司時(shí)尤為重要)。
- 不要過于急著回答面試官提出的問題。花些時(shí)間組織好答案再回答,如果對(duì)問題有不理解的地方,一定要請(qǐng)教面試官。還有就是在面試時(shí)一定要冷靜!
- 在解釋概念時(shí)一定要恰當(dāng)?shù)谋憩F(xiàn)自己。舉幾個(gè)你已經(jīng)實(shí)現(xiàn)過的項(xiàng)目,并且一定要熟悉簡(jiǎn)歷中提到的熟練技能和做過的項(xiàng)目。
- 大多數(shù)情況下,面試官都是在尋找這個(gè)領(lǐng)域內(nèi)有經(jīng)驗(yàn)的技術(shù)人才。如果你在這個(gè)領(lǐng)域還是一個(gè)新手,在創(chuàng)建簡(jiǎn)歷時(shí)可以從自己做過的項(xiàng)目開始。你的 GitHub 賬號(hào)也很有說服力。除此之外,還可以多參加 Kaggle 競(jìng)賽和 MOOC 課程。
- 面對(duì)面試官的時(shí)候,一定要謙虛,注意傾聽面試官的意見,否則你就會(huì)被拒之門外。有的時(shí)候,使用 R 語(yǔ)言和 Python 語(yǔ)言的人會(huì)相互鄙視,你最好不要陷入這種爭(zhēng)論當(dāng)中,否則也容易被拒。我個(gè)人認(rèn)為 R 語(yǔ)言和 Python 語(yǔ)言都是實(shí)現(xiàn)邏輯和概念的工具。
最后,祝大家面試成功!
原文鏈接:
https://appliedmachinelearning.wordpress.com/2018/04/13/my-data-science-machine-learning-job-interview-experience-list-of-ds-ml-dl-questions/
轉(zhuǎn)載請(qǐng)注明?AIQ - 最專業(yè)的機(jī)器學(xué)習(xí)大數(shù)據(jù)社區(qū)?http://www.6aiq.com
轉(zhuǎn)載于:https://www.cnblogs.com/ciao/articles/10894680.html
總結(jié)
以上是生活随笔為你收集整理的机器学习面试题(转)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 上下取整函数的关系以及一些重要性质(附证
- 下一篇: 设备树总结