三十五、数据仓库的设计和应用
生活随笔
收集整理的這篇文章主要介紹了
三十五、数据仓库的设计和应用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 數據倉庫的設計
1.1 數據倉庫設計的基本內容
本節我們將研究用于信息處理、分析處理和數據挖掘的數據倉庫設計,數據倉庫的設計與使用包含的內容有:
- 數據倉庫的設計的商務分析框架
- 數據倉庫的設計過程
- 數據倉庫用于信息出處理
- 從聯機分析處理到多維數據挖掘
2 數據倉庫的設計的商務分析框架
2.1 數據倉庫的用途和優點
- 擁有數據倉庫,商務分析者能夠得到什么?
- 數據倉庫可以通過提供相關信息,據此估計性能并作出重要調整,可以提供競爭優勢。
- 數據倉庫可以提供企業生成力量,因為它能快速、有效地搜集準確描述組織機構的信息。
- 數據倉庫有利于客戶關系管理,因為它跨越所有商務、所有部門和所有市場,提供了顧客和商品的一致視圖。
- 數據倉庫通過以一致和可靠的方式長期跟蹤趨勢、模式和異常,數據倉庫可以降低成本。
2.2 數據倉庫設計需要考慮的視圖
- 自定向下視圖:可以讓用戶選擇數據倉庫所需的相關信息,這些信息能滿足當前和未來的需求。
- 數據源視圖:揭示被操作數據庫系統收集、存儲和管理的信息。這些信息可能以不同的詳細程度和精度記錄,存放在個別數據源表或集成的數據源表中。
- 數據倉庫視圖:包括事實表和維表。它們提供存放于在數據倉庫內的信息,包括預計算的總和與計數,以及提供歷史背景的關于源、日期和時間的信息。
- 商務查詢視圖:從最終用戶的角度透視數據倉庫中的數據。
3 數據倉庫的設計過程
3.1 數據倉庫設計過程和步驟
使用自頂向下方法、自底向上方法或二者結合的混合方法設計
- 自頂向下方法:由總體設計和規劃開始(當技術成熟并已掌握,這種方法是有用的)
- 自底向上方法: 以實驗和原型開始(在商務建模和技術開發的早期階段,這種方法是有用的)
- 混合方法:一個組織既能利用自頂向下方法的有計劃的戰略性的特點,又能保持像自底向上方法一樣快速實現和立即應用。
從軟件工程的觀點
- 瀑布式方法: 在進行下一步前,每一步都進行結構化和系統的分析。
- 螺旋式方法: 涉及功能漸增的系統的快速產生,相繼版本的時間間隔很短。
3.2 典型的數據倉庫設計過程
- 選取待建模的商務處理
- 如果一個商務過程是整個組織的,并涉及多個復雜的對象,應該選用數據倉庫模型,如果處理是部門的,并關注某一類商務處理,則應選擇數據集市
- 選擇商務處理的粒度
- 選取用于每個事實表記錄的維
- 選取事實表中每條記錄的度量
4 數據倉庫用于信息處理
4.1 數據倉庫的應用
- 數據倉庫和數據集市已在廣泛的應用領域使用。工商企業主管使用數據倉庫與數據集市中的數據進行數據分析并作出戰略決策。
- 數據倉庫使用的時間越長,它進化的就越好。
- 數據挖掘工具:檢索工具、數據庫報表工具、數據分析工具和數據挖掘工具
4.2 數據倉庫的應用的分類
- 信息處理:支持查詢和基本的統計分析,并使用交叉表、表、圖表或進行報告。數據倉庫信息處理的當前趨勢是構造低價格的基于Web的訪問工具,然后與Web瀏覽器集成在一起。
- 分析處理:支持基本的OLAP操作,包括切片與切塊、下鉆、上卷和轉軸。
- 數據挖掘:支持只是發現,包括找出隱藏的模式和管理,構造分析模型,進行分類和預測,并使用可視化工具提供挖掘結果。
5 聯機分析處理到多維數據挖掘
- 多維數據挖掘:把數據挖掘與OLAP集成在一起,在多維數據庫中發現知識。
- 數據倉庫總數據的高質量:大部分數據挖掘工具需要在集成的、一致的和清理后的數據上運行,這位需要昂貴的數據清理、數據變換和數據集成作為預處理步驟。
- 環繞數據倉庫的信息處理基礎設施:包含多個異構數據庫的訪問、集成、合并和變換。
- 基于OLAP的多維數據探索:有效的數據挖掘需要探索式數據分析。
- 數據挖掘功能的聯機選擇:用戶常常可能不知道他想挖掘什么類型的知識。通過將OLAP與多種數據挖掘功能集成在一起,多維數據數據為用戶選擇所期望的數據挖掘功能,動態地切換數據挖掘任務提供了靈活性。
總結
以上是生活随笔為你收集整理的三十五、数据仓库的设计和应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三十四、数据仓库的建模
- 下一篇: 三十六、数据仓库的实现