python与数据挖掘课后实验答案_数据仓库与数据挖掘课后习题答案
數據倉庫與數據挖掘
第一章
課后習題
一:填空題
1
)數據庫中存儲的都是
數據
,而數據倉庫中的數據都是一些歷史的、存檔的、歸納的、計
算的數據。
2
)數據倉庫中的數據分為四個級別:
早起細節級、
當前細節級、
輕度綜合級、
高度綜合級
。
3
)數據源是數據倉庫系統的基礎,
是整個系統的數據源泉,
通常包括
業務數據和歷史數據。
4
)元數據是
“關于數據的數據”
。
根據元數據用途的不同將數據倉庫的元數據分為
技術元數
據和業務元數據兩類。
5
)數據處理通常分為兩大類:
聯機事務處理和聯機事務分析
6
)
Fayyad
過程模型主要有
數據準備,數據挖掘和結果分析
三個主要部分組成。
7
)如果從整體上看數據挖掘技術,可以將其分為
統計分析類、知識發現類和其他類型
的數
據挖掘技術三大類。
8
)那些與數據的一般行為或模型不一致的數據對象稱做
孤立點
。
9
)按照挖掘對象的不同,將
Web
數據挖掘分為三類:
web
內容挖掘、
web
結構挖掘和
web
使用挖掘。
10
)
查詢型工具、
分析型工具盒挖掘型工具
結合在一起構成了數據倉庫系統的工具層,
它們
各自的側重點不同,因此適用范圍和針對的用戶也不相同。
二:簡答題
1
)什么是數據倉庫?數據倉庫的特點主要有哪些?
數據倉庫是一個
面向主題的、集成的、相對穩定的、反映歷史變化
的數據集合,用于支
持管理決策。
主要特點:面向主題組織的、集成的、穩定的、隨時間不斷變化的、數據的集合性、支持決
策作用
2
)簡述數據挖掘的技術定義。
從技術角度看,數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際數據
中,提取隱含在其中的、人們不知道的、但又是潛在有用的信息和知識的過程。
3
)什么是業務元數據?
業務元數據從業務角度描述了數據倉庫中的數據,它提供了介于使用者和實際系統之間
的語義層,使得不懂計算機技術的業務人員也能夠讀懂數據倉庫中的數據
4
)簡述數據挖掘與傳統分析方法的區別。
本質區別是:數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識。數據挖掘所
得到的信息應具有先前未知、有效和實用三個特征。
5
)簡述數據倉庫
4
種體系結構的異同點及其適用性。
a.
虛擬的數據倉庫體系結構
b.
單獨的數據倉庫體系結構
c.
單獨的數據集市體系結構
d.
分布式數據倉庫結構
總結
以上是生活随笔為你收集整理的python与数据挖掘课后实验答案_数据仓库与数据挖掘课后习题答案的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AHK实现DD驱动按键连发
- 下一篇: Jensen不等式及其扩展