NE2018届校招内推笔试——数据挖掘
【單選題|2分/題】
1、在只有兩類的情況下,二維特征向量通過共享相同的協(xié)方差矩陣的正態(tài)分布生成,其中協(xié)方差矩陣為:
均值向量分別為:,則根據(jù)貝葉斯分類,樣本分類為:()
A. 分類2
B. 無法確定到兩個類的距離,無法確定
C. 到兩個類的距離相等,分類1或者分類2都可
D. 分類1
?
2、以下C語言和C++語言比較中錯誤的是()
A. C語言和C++的struct意義和用法一致
B. C++ 是面向?qū)ο蟮恼Z言,C語言是面向過程的語言
C. C語言不能使用繼承技術(shù),但C++可以
D. C語言絕大部分語法適用于C++
?
3、Java是一門面向?qū)ο蟮木幊陶Z言,下面關(guān)鍵字中能夠表示Java面向?qū)ο蟮奶匦允?#xff08;)
A. ?volatite , implements
B. static , void
C. abstract , interface
D. extends , interface
?
GXJ:D
?
4、在最小二乘法中,目標函數(shù)為 EXEY|X([Y-f(X)]2|X),如果將[Y-f(X)]2換成|Y-f(X)|,則f(X)解為:()
A. avg (Y|X=x)
B. median (Y|X=x)
C. E (Y|X=x)
D. E (Y2|X=x)
?
5、以下關(guān)于Python數(shù)據(jù)結(jié)構(gòu)說法正確的是:()
A. Python中l(wèi)ist 的元素可以是 tuple
B. Python 中tuple 可以動態(tài)更新,但是不容許嵌套
C. Python中l(wèi)ist 可以動態(tài)的更新,但是不容許嵌套
D. Python 中dict 保存鍵值對,并且鍵值對是有序的
?
GXJ:A
?
6、通??梢酝ㄟ^關(guān)聯(lián)規(guī)則挖掘來發(fā)現(xiàn)啤酒和尿布的關(guān)系,那么如果對于一條規(guī)則A→B,如果同時購買A和B 的顧客比例是4/7,而購買A的顧客當中也購買了B的顧客比例是1/2,而購買B的顧客當中也購買了A的顧客比例是1/3,則以下對于規(guī)則A→B的支持度(support)和置信度(confidence)分別是多少?()
A. 4/7 , 2/3
B. 3/7 , 1/2
C. 4/7 , 1/3
D. 4/7, 1/2
?
LLT :C ?D?
?
7、哪個不是DDL(數(shù)據(jù)庫定義語言)語句?()
A. CREATE
B. GRANT
C. RENAME
D. ALTER
?
?
8、用戶通過搜索后點擊找到所需信息,一般檢索系統(tǒng)會通過點擊的信息熵和term的權(quán)重來進行策略定位,則以下說法正確的是()
A. term的信息熵越大,term權(quán)重越大,則定位的頁面越準確
B. term的信息熵越大,term權(quán)重越小,則定位的頁面越準確
C. term的信息熵越小,term權(quán)重越小,則定位的頁面越準確
D. term的信息熵越小,term權(quán)重越大,則定位的頁面越準確
?
9、如果存在文本文件 /tmp/testfile,并且文件行數(shù)小于等于10行,則輸出文件前3行,下列腳本正確的是()
A.
If? [[ -f? ‘ /tmp/testfile ’ ]] ?&& ?[[ ‘ wc? -l? /tmp/testfile’? -le 10 ]] ;
then head -3? /tmp/testfile
fi
B. ?
[[ -f? ‘ /tmp/testfile ’ ]]? ||? [[ ‘ wc? -l? /tmp/testfile’? -le 10 ]] ;
then head -3? /tmp/testfile
fi
C.
[[ -n? ‘ /tmp/testfile ’ ]]? ||? [[ ‘ wc? -l? /tmp/testfile’? -le 10 ]] ;
then head -3? /tmp/testfile
fi
D.
[[ -n? ‘ /tmp/testfile ’ ]]? &&? [[ ‘ wc? -l? /tmp/testfile’? -le 10 ]] ;
then head -3? /tmp/testfile
fi
GXJ:A
?
10、在高斯混合分布中,其隱變量的含義是:()
A. 表示高斯分布的均值
B. 表示數(shù)據(jù)從每個高斯分布產(chǎn)生的概率
C. 表示數(shù)據(jù)從某個高斯分布產(chǎn)生
D. 表示高斯分布的方差
?
GXJ:C
ME:B?
?
11、以下意圖哪個是用來描述 OBSERVER(觀察者)?(C)
A. 將抽象部分與它的實現(xiàn)部分分離,使它們都可以獨立地變化
B. 用原型實例指定創(chuàng)建對象的種類,并且通過拷貝這些原型創(chuàng)建新的對象
C. 定義對象間的一種一對多的依賴關(guān)系,當一個對象的狀態(tài)發(fā)生變化時,所有依賴于它的對象都得到通知并被自動更新
D. 使多個對象都有機會處理請求,從而避免請求的發(fā)送者和接收者之間的耦合關(guān)系
?
12、Python讀取文件內(nèi)容并且生成迭代器,以下做法正確的是:()
A. (f? for? f? in? file? (? ‘ testfile’? , ’r’ ))
B. (f? for? f? in? file? (? ‘ testfile’? , ’w’ ))
C. [ f? for? f? in? file? (? ‘ testfile’? , ’w’ ) ]
D. [f? for? f? in? file? (? ‘ testfile’? , ’r’ ) ]
?
GXJ:A
?
13、設(shè)(x_n)服從獨立同分布,,則當n 趨向于無窮大時,下式值為:
?
A. ?0
B. ?2
C. ?1
D. ?無窮大
?
14、以下關(guān)于最小二乘法正確是()
A. ?最小二乘估計是線性無偏估計中方差最大的
B. ?最小二乘估計是線性無偏估計中方差最小的
C. ?最小二乘估計是線性有偏估計中方差最小的
D. ?最小二乘估計是線性有偏估計中方差最大的
LLT :B
?
15、現(xiàn)在一個抽象類中定義一個方法如下:
public abstract void getUserInfo ( String userId ,int age );
下面哪個選項不是該方法的重載?()
A. ?public abstract int getUserInfo (int age , ?String userId );
B. ?public abstract void? getUserInfo (String userId ,int age ,int sex );
C. ?public abstract void? getUserInfo (String name ,int age ,int sex );
D.? public abstract void? getUserInfo (String userId, String name );
?
?
16、小明在一次班干部二人競選中,支持率為百分之五十五,而置信水平0.95以上的置信區(qū)間為百分之五十到百分之六十,請問小明未當選的可能性有可能是()
A. ?50%
B. ?0%
C. ?6%
D.? 40%
?
17、
單鏈表的每個結(jié)點中包括一個指針 next ,它指向該結(jié)點的后繼結(jié)點?,F(xiàn)要將指針q 指向的新結(jié)點插入到指針p 指向的單鏈表結(jié)點之后中的哪一個是正確的?()
A. ?p→next=1;q→next= p→next
B. ?p= p→next= q→next;p→next
C. ?q= p→next;p→next= q→next
D.? q→next= p→next;p→next=q
?
LLT :D
GXJ: B
18、以下目標函數(shù)說法正確的是:()
?
A. ?最小二乘 + L2
B. ?最大似然估計 – alastic net
C. ?最小二乘 + alastic net
D.? 最小二乘 +L1
?
19、SVD經(jīng)常作為特征降維的一種有效方法,對于以下四個樣本,
X1={ 6 ,6 } ,X2={ 0 ,1 } ,X3={ 4 ,0 } ,X4={ 0 ,6 }
如果采用SVD的特征處理方式后,只保留最大特征值,則SVD后的樣本向量的均方差誤差為:
A. ?25
B. ?125
C. ?625
D.? 100
?
20、以下不屬于非監(jiān)督學(xué)習(xí)的是:()
A. ?Kmeans
B. ?Knn
C. ?Word2vec
D.? 關(guān)聯(lián)規(guī)則
?
GXJ:KNN是監(jiān)督
?
?
?
【編程題】
[編程題 | 20分] 等差數(shù)列
時間限制:1秒
空間限制:32768K
如果一個數(shù)列S滿足對于所有的合法的i,都有S[i + 1] = S[i] + d, 這里的d也可以是負數(shù)和零,我們就稱數(shù)列S為等差數(shù)列。
小易現(xiàn)在有一個長度為n的數(shù)列x,小易想把x變?yōu)橐粋€等差數(shù)列。小易允許在數(shù)列上做交換任意兩個位置的數(shù)值的操作,并且交換操作允許交換多次。但是有些數(shù)列通過交換還是不能變成等差數(shù)列,小易需要判別一個數(shù)列是否能通過交換操作變成等差數(shù)列?
輸入描述:
輸入包括兩行,第一行包含整數(shù)n(2 ≤ n ≤ 50),即數(shù)列的長度。
第二行n個元素x[i](0 ≤ x[i] ≤ 1000),即數(shù)列中的每個整數(shù)。
?
輸出描述:
如果可以變成等差數(shù)列輸出"Possible",否則輸出"Impossible"。
?
輸入例子1:
3
3 1 2
?
輸出例子1:
Possible
?
?
?
?
?
?
[編程題] 獨立的小易
時間限制:1秒
空間限制:32768K
小易為了向他的父母表現(xiàn)他已經(jīng)長大獨立了,他決定搬出去自己居住一段時間。一個人生活增加了許多花費: 小易每天必須吃一個水果并且需要每天支付x元的房屋租金。當前小易手中已經(jīng)有f個水果和d元錢,小易也能去商店購買一些水果,商店每個水果售賣p元。小易為了表現(xiàn)他獨立生活的能力,希望能獨立生活的時間越長越好,小易希望你來幫他計算一下他最多能獨立生活多少天。?
輸入描述:
輸入包括一行,四個整數(shù)x, f, d, p(1 ≤ x,f,d,p ≤ 2 * 10^9),以空格分割
?
輸出描述:
輸出一個整數(shù), 表示小易最多能獨立生活多少天。
?
輸入例子1:
3 5 100 10
?
輸出例子1:
11
?
?
?
?
[編程題] 堆棋子
時間限制:1秒
空間限制:32768K
小易將n個棋子擺放在一張無限大的棋盤上。第i個棋子放在第x[i]行y[i]列。同一個格子允許放置多個棋子。每一次操作小易可以把一個棋子拿起并將其移動到原格子的上、下、左、右的任意一個格子中。小易想知道要讓棋盤上出現(xiàn)有一個格子中至少有i(1 ≤ i ≤ n)個棋子所需要的最少操作次數(shù)。
輸入描述:
輸入包括三行,第一行一個整數(shù)n(1 ≤ n ≤ 50),表示棋子的個數(shù)
第二行為n個棋子的橫坐標x[i](1 ≤ x[i] ≤ 10^9)
第三行為n個棋子的縱坐標y[i](1 ≤ y[i] ≤ 10^9)
?
輸出描述:
輸出n個整數(shù),第i個表示棋盤上有一個格子至少有i個棋子所需要的操作數(shù),以空格分割。行末無空格
?
如樣例所示:
對于1個棋子: 不需要操作
對于2個棋子: 將前兩個棋子放在(1, 1)中
對于3個棋子: 將前三個棋子放在(2, 1)中
對于4個棋子: 將所有棋子都放在(3, 1)中
?
輸入例子1:
4
1 2 4 9
1 1 1 1
?
輸出例子1:
0 1 3 10
?
?
?
【問答題|20分】
題目描述:網(wǎng)易云音樂的用戶量已經(jīng)超過了2億,作為一款大眾音樂播放產(chǎn)品,請你綜合考慮,為他們設(shè)計一個好的歌曲推薦算法。
?
網(wǎng)易云音樂的歌單推薦算法是怎樣的?
網(wǎng)易云音樂:3種推薦維度和2種推薦算法漫談
只是一種猜想:云音樂的推薦算法
?
轉(zhuǎn)載于:https://www.cnblogs.com/shenxiaolin/p/7353656.html
總結(jié)
以上是生活随笔為你收集整理的NE2018届校招内推笔试——数据挖掘的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推进五通一平:手淘技术三大容器 五大方案
- 下一篇: redis持久化RDB和AOF