python数据分析课后习题
目錄
第一章:
1.?(單選題)下列關于數據和數據分析的說法正確的是(B)
2.?(單選題)下列關于數據分析流程的說法錯誤的是(C)
3.?(單選題)下列關于分析與建模流程的說法錯誤的是(A)
4.?(單選題)下列關于模型評價與優化的說法正確的是(B)
5.?(單選題)下列不屬于數據分析應用場景的是(D)
6.?(單選題)下列不屬于?Python?優勢的是(C)
7.?(單選題)Jupyter Notebook?不具備的功能是(B)
8.?(多選題)【多選】下列關于JupyterNotebook的描述錯誤的是(B、C、D)
9.?(多選題)【多選】下列關于?Python數據分析庫的描述錯誤的是(A、B、D)
10.?(多選題)【多選】下列屬于Anaconda主要特點的是(A、B、C)
第二章:
1.?(單選題)下列不屬于數組屬性的是(D)
2.?(單選題)以下最能體現ufunc?函數特點的是(C)
3.?(單選題)創建一個3x3的數組,下列代碼中錯誤的是(C)。
4.?(多選題)NumPy提供的兩種基本對象是(B、C)
5.?(多選題)下面描述屬于廣播機制的是(A、B、C、D)。
第三章:
1.?(單選題)下列說法正確的是(C)。
2.?(單選題)下列代碼中繪制散點圖的是(A)。
3.?(單選題)下列字符串表示?plot?線條顏色、點的形狀和類型為紅色五角星點短虛線的是(D)。
4.?(單選題)下列參數中調整后顯示中文的是(C)。
5.?(單選題)以下關于繪圖標準流程說法錯誤的是(B)。
第四章:
1.?(單選題)使用其本身可以達到數據透視功能的函數是(D)
2.?(單選題)下列關于pandas數據讀/寫說法錯誤的是(A)
3.?(單選題)下列?loc、iloc、ix?屬性的用法正確的是(D)
4.?(單選題)下列關于分組聚合的說法錯誤的是(A)。
5.?(單選題)下列關于?groupby方法說法正確的是(C)
6.?(單選題)下列關于時間相關類錯誤的是(D)。
7.?(單選題)下列關于apply方法說法正確的是(D)。
8.?(單選題)使用?pivot_table?函數制作透視表用下列(A)參數設置行分組鍵。
第五章:
1.?(單選題)下列關于?concat?函數、append?方法、merge?函數和?join?方法的說法正確的是(C)。
2.?(單選題)以下關于數據分析預處理的過程描述正確的是(C)。
3.?(單選題)以下關于缺失值檢測的說法中,正確的是(B)。
4.?(單選題)關于標準差標準化,下列說法中錯誤的是(B)。
5.?(單選題)以下關于pandas數據預處理說法正確的是(D)。
6.?(單選題)以下關于異常值檢測的說法中錯誤的是(D)。
7.?(單選題)有一份數據,需要查看數據的類型,并將部分數據做強制類型轉換,以及對數值型數據做基本的描述性分析。下列的步驟和方法正確的是(A)。
8.?(單選題)下列與標準化方法有關的說法中錯誤的是(A)。
9.?(單選題)以下關于drop_duplicates函數的說法中錯誤的是(B)。
10.?(單選題)數據質量包含的要素有(D)。
第六章:
1.?(單選題)下列關于sklearn轉換器的說法與使用方式錯誤的是(A)
2.?(單選題)下列算法中,sklearn中未提及的是(D)
3.?(單選題)下列關于sklearn?說法錯誤的是(B)
4.?(單選題)下列關于train_test_split?函數的說法正確的是(D)
5.?(單選題)下列關于分類算法描述正確的是(C)
第七章:
1.?(單選題)下列關于K-Means算法初始聚類中心說法正確的是(B)
2.?(單選題)下列關于K-Means算法的說法錯誤的是(D)
3.?(單選題)下列關于客戶價值分析的說法錯誤的是(B)
4.?(單選題)K-Means?算法接收的數據類型為(A)
5.?(單選題)以下不屬于RFM?客戶價值分析模型常用特征的是(B)
第一章:
1.?(單選題)下列關于數據和數據分析的說法正確的是(B)
- A.?數據就是數據庫中的表格
- B.?文字、聲音、圖像這些都是數據
- C.?數據分析不可能預測未來幾天的天氣變化
- D.?數據分析的數據只能是結構化的
2.?(單選題)下列關于數據分析流程的說法錯誤的是(C)
- A.?需求分析是數據分析最重要的一部分
- B.?數據預處理是能夠建模的前提
- C.?分析與建模時只能夠使用數值型數據
- D.?模型評價能夠評價模型的優劣
3.?(單選題)下列關于分析與建模流程的說法錯誤的是(A)
- A.?傳統的統計對比分析不屬于分析與建模流程
- B.?分析與建模的模型選擇要根據需求確定
- C.?分析與建模時可以選擇多個模型,同時分析
- D.?分析與建模工作是數據分析的核心
4.?(單選題)下列關于模型評價與優化的說法正確的是(B)
- A.?模型構建完成就可以使用
- B.?模型評價的目的是為了確認模型的有效性
- C.?模型評價結果良好,模型一定可用,不需要重構
- D.?所有的模型評價方法相同
5.?(單選題)下列不屬于數據分析應用場景的是(D)
- A.?產品銷量分析
- B.?碼頭貨物吞吐量預測
- C.?計算機硬盤使用壽命預測
- D.?某人一生的命運預測
6.?(單選題)下列不屬于?Python?優勢的是(C)
- A.?語法簡潔,程序開發速度快
- B.?擁有大量的第三方庫,能夠調用C、C++、Java語言
- C.?程序的運行速度在所有計算機語言中最快
- D.?開源免費
7.?(單選題)Jupyter Notebook?不具備的功能是(B)
- A.?Jupyter Notebook?可以直接生成一份交互式文檔
- B.?Jupyter Notebook?可以安裝?Python庫
- C.?Jupyter Notebook?可以導出?HTML?文件
- D.?Jupyter Notebook?可以將文件分享給他人
8.?(多選題)【多選】下列關于JupyterNotebook的描述錯誤的是(B、C、D)
- A.?Jupyter Notebook?有兩種模式
- B.?Jupyter Notebook?有兩種單元形式
- C.?Jupyter Notebook Markdown?無法使用?LaTeX?語法
- D.?Jupyter Notebook?僅僅支持?Python?語言
9.?(多選題)【多選】下列關于?Python數據分析庫的描述錯誤的是(A、B、D)
- A.?NumPy?的在線安裝不需要其他任何輔助工具
- B.?SciPy?的主要功能是可視化圖表
- C.?pandas?能夠實現數據的整理工作
- D.?scikit-learn?包含所有算法
10.?(多選題)【多選】下列屬于Anaconda主要特點的是(A、B、C)
- A.?包含了眾多流行的科學、數學、工程、數據分析的?Python包
- B.?完全開源和免費
- C.?支持Python2.6、2.7、3.4、3.5、3.6,可自由切換
- D.?額外的加速和優化是免費的
第二章:
1.?(單選題)下列不屬于數組屬性的是(D)
- A. ndim
- B. shape
- C. size
- D. add
2.?(單選題)以下最能體現ufunc?函數特點的是(C)
- A.?又叫通用函數
- B.?對數組里的每一個元素逐一操作
- C.?對整個數組進行操作
- D.?數組里的元素都是相同類型的
3.?(單選題)創建一個3x3的數組,下列代碼中錯誤的是(C)。
- A.?np.arange(0,9).reshape(3,3)?
- B.?np.eye(3)?
- C.?np.random.random([3,3,3])?
- D.?np.mat("1 2 3;4 5 6;78 9")
4.?(多選題)NumPy提供的兩種基本對象是(B、C)
- A.?array
- B.?ndarray
- C.?ufunc
- D.?matrix
5.?(多選題)下面描述屬于廣播機制的是(A、B、C、D)。
- A.?讓所有的輸入數組都向其中?shape?最長的數組看齊,shape?中不足的部分通過在前面加1補齊。
- B.?輸出數組的shape是輸入數組?shape?的各個軸上的最大值。
- C.?如果輸人數組的某個軸和輸出數組的對應軸的長度相同或者其長度為1,則這個數組能夠用來計算,否則出錯。
- D.?當輸入數組的某個軸的長度為1時,沿著此軸運算時都用此軸上的第一組值。
第三章:
1.?(單選題)下列說法正確的是(C)。
- A.?散點圖不能在子圖中繪制
- B.?散點圖的x軸刻度必須為數值
- C.?折線圖可以用作查看特征間的趨勢關系
- D.?箱線圖可以用來查看特征間的相關關系
2.?(單選題)下列代碼中繪制散點圖的是(A)。
- A.?plt.scatter(x,y)
- B.?plt.plot(x,y)
- C.?plt.legend('upper left')
- D.?plt.xlabel("散點圖')
3.?(單選題)下列字符串表示?plot?線條顏色、點的形狀和類型為紅色五角星點短虛線的是(D)。
- A.?'bs-'?
- B.?'go-.'
- C.?'r+-.'
- D.??'r*:'?
4.?(單選題)下列參數中調整后顯示中文的是(C)。
- A.?lines.linestyle
- B.?lines.linewidth
- C.?font.sans-serif
- D.?axes.unicode_minus
5.?(單選題)以下關于繪圖標準流程說法錯誤的是(B)。
- A.?繪制最簡單的圖形可以不用創建畫布
- B.?添加圖例可以在繪制圖形之前
- C.?添加x軸、y軸的標簽可以在繪制圖形之前
- D.?修改x軸標簽、y軸標簽和繪制圖形沒有先后
第四章:
1.?(單選題)使用其本身可以達到數據透視功能的函數是(D)
- A.?groupby
- B.?transform
- C.?cosstab
- D.?pivot_table
2.?(單選題)下列關于pandas數據讀/寫說法錯誤的是(A)
- A. read_csv?能夠讀取所有文本文檔的數據
- B.?read_sql?能夠讀取數據庫的數據
- C.?to_csv?函數能夠將結構化數據寫入.csv文件
- D.?to_excel?函數能夠將結構化數據寫入?Excel?文件
3.?(單選題)下列?loc、iloc、ix?屬性的用法正確的是(D)
- A.?df.loc['列名','索引名'];df.iloc['索引位置','列位置'];df.ix['索引位置', '列名']?
- B.?df.loc['索引名','列名'];df.iloc['索引位置','列名'];df.ix['索引位置', '列名']?
- C.?df.loc['索引名','列名'];df.iloc['索引位置','列名'];df.ix['索引名', '列位置']?
- D.?df.loc['索引名','列名'];df.iloc['索引位置','列位置'];df.ix['索引位置', '列位置']
4.?(單選題)下列關于分組聚合的說法錯誤的是(A)。
- A.?pandas提供的分組和聚合函數分別只有一個?
- B.?pandas分組聚合能夠實現組內標準化
- C.?pandas聚合時能夠使用agg、apply、transform方法
- D.?pandas分組函數只有一個?groupby
5.?(單選題)下列關于?groupby方法說法正確的是(C)
- A.?groupby?能夠實現分組聚合
- B.?groupby方法的結果能夠直接查看
- C.?groupby?是?pandas?提供的一個用來分組的方法
- D.?groupby方法是pandas提供的一個用來聚合的方法
6.?(單選題)下列關于時間相關類錯誤的是(D)。
- A.?Timestamp?是存放某個時間點的類
- B.?Period?是存放某個時間段的類
- C.?Timestamp數據可以使用標準的時間字符串轉換得來
- D.?兩個數值上相同的?Period?和?Timestamp?所代表的意義相同
7.?(單選題)下列關于apply方法說法正確的是(D)。
- A.?apply方法是對DataFrame每一個元素應用某個函數的方法
- B.?apply方法能夠實現所有aggregate方法的功能
- C.?apply方法和map方法都能夠進行聚合操作
- D.?apply?方法只能夠對行列進行操作
8.?(單選題)使用?pivot_table?函數制作透視表用下列(A)參數設置行分組鍵。
- A.?index
- B.?raw
- C.?values
- D.?data
第五章:
1.?(單選題)下列關于?concat?函數、append?方法、merge?函數和?join?方法的說法正確的是(D)。
- A.?concat是最常用的主鍵合并的函數,能夠實現內連接和外連接?
- B.?append方法只能用來做縱向堆疊,適用于所有縱向堆疊情況
- C.?merge?是最常用的主鍵合并的函數,但不能夠實現左連接和右連接
- D.?join是常用的主鍵合并方法之一,但不能夠實現左連接和右連接
2.?(單選題)以下關于數據分析預處理的過程描述正確的是(C)。
- A.?數據清洗包含了數據標準化、數據合并和缺失值處理
- B.?數據合并按照合并軸方向主要分為左連接、右連接、內連接和外連接
- C.?預處理過程主要包括數據清洗、數據合并、數據標準化和數據轉換,它們之間存在交叉,沒有嚴格的先后關系?
- D.?數據標準化的主要對象是類別型的特征
3.?(單選題)以下關于缺失值檢測的說法中,正確的是(B)。
- A.?null?和?notnull?可以對缺失值進行處理
- B.?dropna方法既可以刪除觀測記錄,亦可以刪除特征
- C.?fillna方法中用來替換缺失值的值只能是數據框
- D.?pandas?庫中的interpolate?模塊包含了多種插值方法
4.?(單選題)關于標準差標準化,下列說法中錯誤的是(B)。
- A.?經過該方法處理后的數據均值為0,標準差為1?
- B.?可能會改變數據的分布情況
- C.
Python中可自定義該方法實現函數:
def StandardScaler(data):
data=(data-data.mean())/data.std()
? ? return data
- D.?計算公式為X*=(X-`X)/σ
5.?(單選題)以下關于pandas數據預處理說法正確的是(D)。
- A.?pandas沒有做啞變量的函數
- B.?在不導人其他庫的情況下,僅僅使用pandas?就可實現聚類分析離散化
- C.?pandas?可以實現所有的數據預處理操作
- D.?cut?函數默認情況下做的是等寬法離散化
6.?(單選題)以下關于異常值檢測的說法中錯誤的是(D)。
- A.?3σ原則利用了統計學中小概率事件的原理
- B.?使用箱線圖方法時要求數據服從或近似服從正態分布
- C.?基于聚類的方法可以進行離群點檢測
- D.?基于分類的方法可以進行離群點檢測
7.?(單選題)有一份數據,需要查看數據的類型,并將部分數據做強制類型轉換,以及對數值型數據做基本的描述性分析。下列的步驟和方法正確的是(A)。
- A.?dtypes?查看類型,astype?轉換類別,describe?描述性統計
- B.?astype?查看類型,dtypes轉換類別,describe描述性統計
- C.?describe查看類型,astype轉換類別,dtypes描述性統計
- D.?dtypes?查看類型,describe?轉換類別,astype?描述性統計
8.?(單選題)下列與標準化方法有關的說法中錯誤的是(A)。
- A.?離差標準化簡單易懂,對最大值和最小值敏感度不高
- B.?常用的標準化方法,又名零一均值標準化
- C.?小數定標標準化實質上就是將數據按照一定的比例縮小?
- D.?多個特征的數據的KMeans?聚類不需要對數據進行標準化
9.?(單選題)以下關于drop_duplicates函數的說法中錯誤的是(B)。
- A.?僅對?DataFrame?和?Series?類型的數據有效
- B.?僅支持單一特征的數據去重
- C.?數據重復時默認保留第一個數據
- D.?該函數不會改變原始數據排列
10.?(單選題)數據質量包含的要素有(D)。
- A.?準確性、完整性
- B.?一致性、可解釋性
- C.?時效性、可信性
- D.?以上所有要素
第六章:
1.?(單選題)下列關于sklearn轉換器的說法與使用方式錯誤的是(A)
- A.?fit在轉換器中起到的作用為訓練模型
- B.?fit在轉換器中起到的作用為生成規則
- C.?transform?在轉換器中起到的作用為應用規則
- D.?fit_transform?是?fit?和?transform?的結合
2.?(單選題)下列算法中,sklearn中未提及的是(D)
- A.?K-Means?聚類算法
- B.?Logistic Regression
- C.?KNN最近鄰分類算法
- D.?Apriori?關聯規則算法
3.?(單選題)下列關于sklearn?說法錯誤的是(B)
- A.?sklearn?全稱為?scikit-learn
- B.?sklearn在官網被分為7個大塊
- C.?sklearn的聚類算法幾乎都已經放在cluster模塊中了
- D.?sklearn?需要?NumPy?和?SciPy?庫的支持
4.?(單選題)下列關于train_test_split?函數的說法正確的是(D)
- A.?train_test_split?能夠將數據集劃分為訓練集、驗證集和測試集
- B.?生成的訓練集和測試集在賦值的時候可以調換位置,系統能夠自動識別
- C.?train_test_split?每次的劃分結果不同,無法解決
- D.?train test_split?函數可以自行決定訓練集和測試集的占比
5.?(單選題)下列關于分類算法描述正確的是(C)
- A.?分類算法的標簽和回歸算法完全相同
- B.?分類算法和聚類算法一樣都沒有標簽
- C.?分類算法的評價需要參考真實標簽
- D.?分類算法評價可以用均方誤差來判斷
第七章:
1.?(單選題)下列關于K-Means算法初始聚類中心說法正確的是(B)
- A.?樣本中擇優選出
- B.?樣本中隨機選出
- C.?互相距離最近的n個點
- D.?互相距離最遠的n個點
2.?(單選題)下列關于K-Means算法的說法錯誤的是(D)
- A.?構建K-Means?聚類模型需要對數據進行標準化
- B.?K-Means?算法涉及空間距離計算
- C.?K-Means?算法訓練結果具有一定的隨機性,所以需要多次訓練
- D.?K-Means?算法是?sklearn?的?cluster?模塊中唯一涉及距離計算的聚類算法
3.?(單選題)下列關于客戶價值分析的說法錯誤的是(B)
- A.?RFM?模型常用于客戶價值分析模型
- B.?RFM?模型適用于所有的客戶價值分析
- C.?客戶價值分析是客戶關系管理的一部分
- D.?客戶價值分析能夠幫助制定營銷策略
4.?(單選題)K-Means?算法接收的數據類型為(A)
- A.?連續型
- B.?離散型
- C.?名義型
- D.?順序型
5.?(單選題)以下不屬于RFM?客戶價值分析模型常用特征的是(B)
- A.?消費金額
- B.?消費人數
- C.?最近一次消費時間和截止時間的間隔
- D.?消費頻率
總結
以上是生活随笔為你收集整理的python数据分析课后习题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 下载离线地图数据并搭建离线地图开发环境(
- 下一篇: android 谷歌地图离线访问,谷歌升