【机器学习基础】时间序列测试题的40题,看看你对时间序列的了解水平
? 磐創AI分享??
作者 | SAURABH JAJU?
編譯 | Flin?
來源 | analyticsvidhya
介紹
時間序列預測與建模在數據分析中起著重要的作用。時間序列分析是統計學的一個分支,廣泛應用于計量經濟學和運籌學等領域。這篇技能測試文章是為了測試你對時間序列概念的了解程度。
共有1094人報名參加了這次技能測試。這個測試是為了測試你對時間序列的了解的水平。如果你錯過了這次技能測試,這里有一些問題和對應的解決方案。如果你錯過了實時測試,也可以通過閱讀本文以了解你有多少題目是可以正確回答的。
這是所有參賽者的排行榜
https://datahack.analyticsvidhya.com/contest/avdatafest-skillpower-time-series/#LeaderBoard
所有的得分
下面是分布得分,它們將幫助你評估你的表現。
你可以在下方鏈接查看分數。
https://datahack.analyticsvidhya.com/contest/avdatafest-skillpower-time-series/#LeaderBoard
300多人參加了技能測試,獲得的最高分數為38分。以下是一些關于分布的統計數據。
平均分:17.13
中位數:19
眾數:19
1) 下面哪一個是時間序列問題的例子?
估計未來6個月酒店客房預訂數量。
估計保險公司未來三年的總銷售額。
估計下一周的通話次數。
A) 只有 3 B) 1 和 2 C) 2 和 3 D) 1 和 3 E) 1,2 和 3
解決方案:(E)
以上所有選項都與時間序列有關。
2) 以下哪項不是時間序列模型的示例?
A) 樸素法
B) 指數平滑
C) 移動平均
D) 以上都不是
解決方案:(D)
樸素法:一種估計技術,在這種技術中,最后一個時期的實際情況被用作這一時期的預測,而不加以調整或試圖確定因果因素,適用于比較穩定的序列。它僅用于與更復雜的技術生成的預測進行比較。
在指數平滑中,舊數據的相對重要性逐漸降低,而新數據的相對重要性逐漸提高。
在時間序列分析中,移動平均(MA)模型是一種常用的單變量時間序列建模方法。移動平均模型指定輸出變量線性依賴于隨機項(不完全可預測)的當前值和各種過去值。
3) 下列哪項不能作為時間序列圖的組成部分?
A) 季節性
B) 趨勢
C) 周期性
D) 噪聲
E) 以上都不是
解決方案:(E)
當一系列因素受到季節因素(例如,一年中的一個季度、一個月或一周中的一天)的影響時,就存在一種季節模式。季節性總是一個固定且已知的時期。因此,季節性時間序列有時被稱為周期性時間序列
季節總是一個固定且已知的時期。當數據呈現非固定周期的漲跌時,它就存在一種循環模式。
趨勢被定義為時間序列中跟日歷無關且無規律影響的“長期”運動,是底層的反映。它是人口增長、物價上漲和一般經濟變化等影響的結果。下圖描繪了一個隨時間有明顯上升趨勢的系列。
噪聲:在離散時間內,白噪聲是一種離散信號,其樣本被視為一系列均值為零、方差有限的不相關隨機變量。
因此,上述所有內容都是時間序列的組成部分。
4) 在時間序列建模中,下列哪項比較容易估計?
A) 季節性
B) 周期性
C) 季節性和周期性沒有區別
解決方案:(A)
正如我們在前面的解中所看到的,由于季節性呈現平穩的結構,所以更容易估計。
5) 下面的時間序列圖包含周期性和季節性成分
A)真 B)假
解決方案:?(B)
上面的圖中以固定的時間間隔重復出現差不多的趨勢,因此實際上只是季節性的。
6)時間序列數據(不包括白噪聲)中的相鄰觀測值是獨立且均勻分布的(IID)
A)真 B)假
解決方案:(B)
隨著觀測值之間的時間間隔變短,它們往往與時間強相關。因為時間序列預測是基于以前的觀察數據而不是當前的觀察數據,不像分類或回歸那樣數據與數據之間關聯性不高。
7) 接近1的平滑參數會給預測中的最新觀測值帶來更大的權重或影響
A) 真
B) 假
解決方案:(A)
將較大的權重應用于較新的觀測結果中,比應用到歷史數據的觀測結果中更為明智。這正是簡單指數平滑背后的概念。預測是使用加權平均值計算的,加權平均值隨著過去觀測值的增加呈指數遞減——最小的權重將與最早的觀測值相關。
8)指數平滑的權重之和是_____
A)<1 B)1 C)> 1 D)以上都不是
解決方案:?(B)
表7.1顯示了使用簡單指數平滑法進行預測時,對四個不同α值的觀測值的權重。請注意,對于任何合理的樣本量,即使對于較小的α,權重的總和也將約為1。
| Observation | α=0.2 | α=0.4 | α=0.6 | α=0.8 |
| yT | 0.2 | 0.4 | 0.6 | 0.8 |
| yT?1 | 0.16 | 0.24 | 0.24 | 0.16 |
| yT?2 | 0.128 | 0.144 | 0.096 | 0.032 |
| yT?3 | 0.102 | 0.0864 | 0.0384 | 0.0064 |
| yT?4 | (0.2)(0.8) | (0.4)(0.6) | (0.6)(0.4) | (0.8)(0.2) |
| yT?5 | (0.2)(0.8) | (0.4)(0.6) | (0.6)(0.4) | (0.8)(0.2) |
9)上一階段的預測是70,而需求是60。什么是簡單的指數平滑?當Alpha = 0.4時,預測下一個周期。
A) 63.8 B) 65 C) 62 D) 66
解決方案:(D) Yt-1 = 70 St-1 = 60 Alpha = 0.4
代入,得:
0.4 * 60 + 0.6 * 70 = 24 + 42 = 66
10)自協方差測量什么?
A) 不同時間觀測到的不同序列上多個點之間的線性相關性
B) 不同時間觀測到的同一序列上兩點之間的二次相關性
C) 同時觀測到的不同序列兩點之間的線性關系
D) 在不同時間觀測到的同一序列上兩點之間的線性關系
解決方案:(D)
選項D是自協方差的定義。
11) 下列哪項不是弱平穩時間序列的必要條件?
A) 平均值是恒定的,不依賴于時間
B) 自協方差函數僅通過其差|s-t|依賴于s和t(其中t和s為時刻)
C) 所考慮的時間序列是一個有限方差過程
D) 時間序列是高斯的
解決方案:(D)
高斯時間序列意味著平穩性是嚴平穩性。
12) 下列哪項不是平滑時間序列的技術?
A) 最近鄰回歸
B) 局部加權散點圖平滑
C) 基于樹的模型,如(CART)
D) 平滑樣條曲線
解決方案:(C)
時間序列平滑和濾波可以用局部回歸模型來表示。多項式和回歸樣條也提供了平滑的重要技術?;贑ART的模型不提供要疊加在時間序列上的方程,因此不能用于平滑。所有其他技術都是有據可查的平滑技術。
13)如果2016年10月需求為100,2016年11月需求為200,2016年12月需求為300,2017年1月需求為400。2017年2月的3個月移動平均線是多少?
A)300
B) 350
C) 400
D)需要更多的信息
解決方案:(A)
X' = (xt-3 + xt-2 + xt-1) /3
(200+300+400)/ 3 = 900/3 =300
14)查看下面的ACF圖,你是否建議將AR或MA用于ARIMA建模技術?
A)AR B)MA C)不能判斷
解決方案:(A)
在以下情況下考慮使用MA模型:如果差分序列的自相關函數(ACF)表現出明顯的截尾或偏相關系數表現出拖尾,則考慮添加一個模型的MA項。ACF截止的滯后時間就是MA項數。
但是,由于沒有表現出明顯的截尾,因此必須采用AR模型。
15)假設你是Analytics Vidhya的一名數據科學家。你注意到1 - 3月對文章的評論增加了。而11月- 12月期間的瀏覽量有所下降。
以上陳述是否代表數據具有季節性?
A)真 B)假 C)不能判斷
解決方案:(A)
是的,這是一個明確的季節性趨勢,因為在特定時間視圖會發生變化。
請記住,“季節性”是指在特定的周期性時間間隔內出現的變化。
16)以下哪個圖形可用于檢測時間序列數據中的季節性?
1.多個盒圖 2.自相關
A)僅1 B)僅2 C)1和2 D)這些都不是
解決方案:(C)
季節性是在特定的周期間隔內變化的存在。
分布的變化可以在多個盒圖中觀察到。因此,可以很容易地發現季節性。自相關圖應在等于周期的滯后處顯示峰值。
17)平穩性是時間序列過程的理想屬性。
A)是 B)假
解決方案:(A)
當滿足以下條件時,時間序列是平穩的。
平均值是恒定的,不依賴于時間
自協方差函數僅取決于s和t的差| s-t |。(其中t和s是時間點)
考慮的時間序列是一個有限方差過程
這些條件是數學上表示要用于分析和預測的時間序列的必要先決條件。因此,平穩性是理想的屬性。
18)假設你獲得的時間序列數據集只有4列(id,Time,X,Target)
如果給定窗口大小2,特征X的滑動平均值是多少?
注意:X欄代表滑動平均值。
A)
B)
C)
D)以上都不是
解決方案:?(B)
X` = Xt-2 + Xt-1 / 2
根據以上公式:(100 +200)/ 2 = 150; (200 + 300)/ 2 = 250,依此類推。
19)想象一下,你正在處理時間序列數據集。你的經理要求你建立一個高度準確的模型。你開始構建以下兩種類型的模型。
模型1:決策樹模型
模型2:時間序列回歸模型
在對這兩個模型進行評估的最后,你發現模型2比模型1更好。
A)模型1不能像模型2那樣映射線性關系 B)模型1總是比模型2更好 C)你不能將決策樹與時間序列回歸進行比較 D)這些都不是
解決方案:?(A)
時間序列模型類似于回歸模型。因此,它擅于找到簡單的線性關系。基于樹的模型雖然有效,但在發現和利用線性關系方面卻并不那么擅長。
20)哪種類型的分析對于根據以下類型的數據進行溫度預測最有效。
A)時間序列分析 B)分類 C)聚類 D)以上都不是
解決方案:(A)
本題獲取了連續幾天的數據,因此最有效的分析類型是時間序列分析。
21)溫度/降水變量的一次差分是多少?
A)15,12.2,-43.2,-23.2,14.3,-7 B)38.17,-46.11,-4.98,14.29,-22.61 C)35,38.17,-46.11,-4.98,14.29,-22.61 D)36.21, -43.23,-5.43,17.44,-22.61
解決方案:(B)
73.17-35 = 38.17 27.05-73.17 = – 46.11,依此類推。13.75 – 36.36 = -22.61
22)考慮以下數據集:
「{23.32 32.33 32.88 28.98 33.16 26.33 29.88 32.69 18.98 21.23 26.66 29.89} 時間序列滯后一個樣本的自相關是什么?」
A) 0.26 B) 0.52 C) 0.13 D) 0.07
解決方案:(C)
ρ?1 = PT t = 2(x t-1- xˉ)(x t- xˉ)PTt = 1(xt-xˉ)^2
=(23.32-x′)(32.33-x′)+(32.33-x′)(32.88-x′)+···PT t = 1(xt -x′)^2
= 0.130394786
其中x是級數的平均值,為28.0275
23)任何平穩時間序列都可以近似為在各種頻率下振蕩的正弦和余弦的隨機疊加。
A)真 B)假
解決方案:(A)
弱平穩時間序列 xt 是有限方差過程,因此
平均值函數 μt 是常數,并且不依賴于時間t;并且(ii)定義的自協方差函數γ(s,t)僅依賴于s和t的差| s-t |。
在各種頻率下振蕩的正弦和余弦的隨機疊加是白噪聲。白噪聲是微弱的或平穩的。如果白噪聲變量也呈正態分布或高斯分布,則該序列也是嚴平穩的。
24)弱平穩時間序列的自協方差函數不取決于_______?
A)xs和xt的間隔 B)h = | s – t | C)在特定時間點的位置
解決方案:(C)
通過定義上一個問題中描述的弱平穩時間序列。
25)如果_____,則兩個時間序列聯合平穩。
A)它們都是平穩的 B)交叉方差函數僅是滯后h的函數 C)僅A D)A和B
解決方案:(D)
聯合平穩性是根據上述兩個條件定義的。
26)在自回歸模型中_______
A)因變量的當前值受自變量的當前值影響 B)因變量的當前值受自變量的當前值和過去值影響 C)因變量的當前值受因變量和自變量的過去值影響 D)以上都不是
解決方案:(C)
自回歸模型基于這樣的思想,即序列的當前值xt可以解釋為p個過去值xt-1,xt-2,…,xt-p的函數,其中p決定了預測當前值所需的過去步進數。例如 xt = xt-1 -.90xt-2 + wt,
其中xt-1和xt-2是因變量和wt的過去值,白噪聲可以表示獨立值。
該示例可以擴展為包括類似于多元線性回歸的多序列。
27)對于MA(移動平均值)模型,對 σ=1 和 θ=5 產生與對 σ=25 和θ=1/5 相同的自協方差函數。
A)真 B)假
解決方案:(A)
正確,因為MA模型的自協方差是可逆的
請注意,對于MA(1)模型,對于θ和1 /θ,ρ(h)相同。
28)通過查看下面的ACF和PACF圖,可以在時間序列中包括多少個AR和MA項?
A)AR(1)MA(0) B)AR(0)MA(1) C)AR(2)MA(1) D)AR(1)MA(2) E)不能判斷
解決方案:(B)
滯后1的強負相關表明MA只有1個顯著滯后。閱讀本文以獲得更好的理解。
https://www.analyticsvidhya.com/blog/2015/12/complete-tutorial-time-series-modeling/
29)對于白噪聲,以下哪項是正確的?
A)均值= 0 B)自協方差為0 C)自協方差為0(零滯后除外 D)二次方差
解決方案:(C)
白噪聲過程必須具有恒定的均值,恒定的方差和無自協方差結構(滯后零(方差)除外)。
30)對于以下MA(3)過程 yt = μ + Εt + θ1Εt-1 + θ2Εt-2 + θ3Εt-3 ?,其中σt是方差為σ2的零均值白噪聲過程。
A)在滯后3時ACF = 0 B)在滯后5中ACF = 0 C)在滯后1中ACF = 1 D)在滯后2中ACF = 0 E)在滯后3和滯后5中ACF = 0
解決方案:(B)
回想一下,MA(q)過程僅具有長度為q的記憶。這意味著,所有自相關系數在滯后q以后的值為零。這可以通過檢查MA方程并看到只有過去的q個擾動項進入方程來看出。
因此,如果我們向前迭代此方程超過q個周期,則擾動項的當前值將不再影響y。由于滯后零的自相關函數是時間t處的y與時間t處的y的相關性(即y_t與自身的相關性),因此根據定義,滯后0處的自相關函數必須為1。
31)考慮下面的AR(1)模型,其擾動項具有零均值和單位方差。yt = 0.4 + 0.2 yt-1 ?+ ut, y的(無條件)方差由____給出。
A)1.5 B)1.04 C)0.5 D)2
解決方案:(B)
擾動的方差除以(1減去自回歸系數的平方)
在這種情況下為:1 /(1-(0.2 ^ 2))= 1 / 0.96 = 1.041
32)pacf(部分自相關函數)對于區分______是必需的。
A)AR和MA模型:錯誤 B)AR和ARMA模型:正確 C)MA和ARMA模型:錯誤 D)ARMA系列中的不同模型
解決方案:(B)
33)時間序列的二次差分可以幫助消除哪個趨勢?
A)二次趨勢 B)線性趨勢 C)A和B都是 D)以上都不是
解決方案:(A)
第一個差分表示為 xt = xt ?xt?1. (1)
如我們所見,第一個差分消除了線性趨勢。第二個差分(即(1)的差分)可以消除二次趨勢,依此類推。
34)以下哪種交叉驗證技術更適合時間序列數據?
A)k-折交叉驗證 B)留一法交叉驗證 C)Stratified Shuffle Split交叉驗證 D)前向鏈交叉驗證
解決方案:(D)
時間序列是有序數據。因此,必須對驗證數據進行排序。前向鏈可確保這一點。其工作方式如下:
fold 1:訓練[1],測試[2]
fold 2:訓練[1 2],測試[3]
fold 3:訓練[1 2 3],測試[4]
fold 4:訓練[1 2 3 4],測試[5]
fold 5:訓練[1 2 3 4 5],測試[6]
35)BIC比AIC更能懲罰復雜的模型。
A)真 B)假
解決方案:(A)
AIC = -2 * ln(likelihood)+ 2 * k,
BIC = -2 * ln(likelihood)+ ln(N)* k,
當:
k = 模型自由度
N = 觀察數
在N相對較低時(7及以下),BIC比AIC更能容忍自由參數,但在N相對較高時則容忍度較低(因為N的自然對數大于2)。
36)下圖顯示了n = 60個觀測值的時間序列的估計自相關和部分自相關?;谶@些圖,我們應該____.
A)通過獲取日志來轉換數據 B)對序列求差分以獲取平穩數據 C)將MA(1)模型擬合到時間序列
解決方案:(B)
自相關顯示出確定的趨勢,而部分自相關顯示出波動的趨勢,在這種情況下,采用對數是沒有用的。對序列求差分以獲得平穩序列是唯一的選擇。
37-38
37)使用上面給出的估計指數平滑度,并預測接下來3年(1998-2000年)的溫度
這些結果總結了簡單指數平滑與時間序列的擬合。
A)0.2,0.32,0.6 B)0.33,0.33,0.33 C)0.27,0.27,0.27 D)0.4,0.3,0.37
解決方案:(B)
指數平滑的預測值在3年中都是相同的,因此我們所需要的只是明年的值。平滑的表達式是
smootht = α yt + (1 – α) smooth t-1
因此,對于下一個點,平滑的下一個值(下一個觀察的預測)為
smoothn = α yn + (1 – α) smooth n-1
= 0.39680.43 + (1 – 0.3968) 0.3968
= 0.3297
38) 找出1999年氣溫預測的95%預測區間。
「這些結果總結了簡單指數平滑對時間序列的擬合?!?/strong>
A)0.3297 2 * 0.1125 B)0.3297 2 * 0.121 C)0.3297 2 * 0.129 D)0.3297 2 * 0.22
解決方案:(B)
預測誤差的標準偏差為
1個周期為 0.1125
2個周期為 0.1125 sqrt(1+α2) = 0.1125 * sqrt(1+ 0.39682) ≈ 0.121
39)以下哪個陳述是正確的?
如果ARIMA模型中的自回歸參數(p)為1,則表示序列中不存在自相關。
如果ARIMA模型中的移動平均成分(q)為1,則表示序列中具有滯后1的自相關
如果ARIMA模型中的積分成分(d)為0,則意味著系列不是平穩的。
A)僅1 B)1和2均 C)僅2 D)所有陳述
解決方案:(C)
自回歸分量:AR代表自回歸。自回歸參數由p表示。當p = 0時,表示序列中不存在自相關。當p = 1時,表示序列自相關到一個滯后。
積分:在ARIMA時間序列分析中,積分用d表示。積分是微分的倒數。
當d = 0時,這意味著級數是平穩的,我們不需要取其差。
當d = 1時,這意味著該序列不是平穩的,并且要使其平穩,我們需要求第一差分。
當d = 2時,表示序列需要二次差分。
通常情況下,兩個以上的差分是不可靠的。
移動平均分量:MA表示移動平均,用q表示。在ARIMA中,移動平均q = 1表示它是一個誤差項,并且存在一個滯后的自相關。
40)在時間序列預測問題中,如果第1、2和3季度的季節指數分別為0.80、0.90和0.95。你對第四季度的季節性指數有何看法?
A)小于1 B)大于1 C)等于1 D)季節性不存在 E)數據不足
解決方案:(B)
由于有四個季度,所以季節指數必須總計為4。0.80 + 0.90 + 0.95 = 2.65,因此對于4的季節指數個季度必須是4-2.65 = 1.35,所以B是正確的答案。
原文鏈接:https://www.analyticsvidhya.com/blog/2017/04/40-questions-on-time-series-solution-skillpower-time-series-datafest-2017
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯獲取一折本站知識星球優惠券,復制鏈接直接打開:https://t.zsxq.com/yFQV7am本站qq群1003271085。加入微信群請掃碼進群:總結
以上是生活随笔為你收集整理的【机器学习基础】时间序列测试题的40题,看看你对时间序列的了解水平的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【CV】基于UNet网络实现的人像分割
- 下一篇: 【Python基础】Github标星4.