SQL2000联机丛书:使用和维护数据仓库
本次摘錄 來源于
SQL2000聯(lián)機叢書中 創(chuàng)建和使用數(shù)據(jù)倉庫概述
為的是對數(shù)據(jù)倉庫有個概觀的認識
=============
使用數(shù)據(jù)倉庫
=============
SQL 查詢
---------?
????????????????最終用戶很少使用結構化查詢語言 (SQL) 查詢直接訪問數(shù)據(jù)倉庫數(shù)據(jù)。
???????????????分析 SQL 查詢很復雜,必須具有數(shù)據(jù)庫專業(yè)知識才能正確創(chuàng)建。
???????????????數(shù)據(jù)倉庫中的數(shù)據(jù)量經(jīng)常很大,以至于需要完善的 SQL 技術獲得有用的性能。
???????????????如果一個 SQL 查詢將三個或四個維度表聯(lián)接到包含數(shù)百萬行的事實數(shù)據(jù)表,
???????????????并且使用聚合函數(shù)(如 SUM)匯總和分組結果,會顯著增加任何關系數(shù)據(jù)庫的負荷,
?????????????? 而且通常會產生聯(lián)機分析無法接受的性能。
???????????????SQL 查詢通常由數(shù)據(jù)庫專家創(chuàng)建,與在較低活動期間定期執(zhí)行的預定義報表一起使用。
???????????????可以創(chuàng)建輔助匯總表優(yōu)化這些查詢的性能;
???????????????必須在裝載數(shù)據(jù)倉庫時初始設計和填充這些表,然后在每次更新數(shù)據(jù)倉庫時更新它們。
OLAP 和數(shù)據(jù)挖掘
----------------
???????????????聯(lián)機分析處理 (OLAP) 是使用多維數(shù)據(jù)表達式(稱為多維數(shù)據(jù)集)提供對數(shù)據(jù)倉庫數(shù)據(jù)進行快速訪問的技術。
???????????????多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實數(shù)據(jù)表建立模型,并為客戶端應用程序提供完善的查詢和分析功能。?
?
???????????????數(shù)據(jù)挖掘使用復雜算法分析數(shù)據(jù)并創(chuàng)建模型來表示有關數(shù)據(jù)的信息。
???????????????數(shù)據(jù)挖掘模型可用于預測新數(shù)據(jù)的特點或識別具有相似特點的數(shù)據(jù)實體組。
?
???????????????多維數(shù)據(jù)集和數(shù)據(jù)挖掘模型必須經(jīng)過設計、配置和處理后才能由客戶端應用程序使用,
???????????????并且經(jīng)常要求在數(shù)據(jù)倉庫數(shù)據(jù)更新時更新。
?
English Query
--------------
???????????????English Query 提供用于開發(fā)客戶端應用程序的系統(tǒng),以使最終用戶能夠使用英語單詞和短語訪問數(shù)據(jù)。
???????????????English Query 可用于訪問由 Microsoft SQL Server 2000 Analysis Services 創(chuàng)建的數(shù)據(jù)倉庫數(shù)據(jù)庫或多維數(shù)據(jù)集中的數(shù)據(jù)。
???????????????若要開發(fā) English Query 應用程序,首先必須創(chuàng)建一個模型將數(shù)據(jù)庫表、字段、多維數(shù)據(jù)集和數(shù)據(jù)與英語單詞和短語相關。
???????????????然后,可以生成 English Query 應用程序并將其合并到自定義 Web 或客戶端應用程序由最終用戶使用。
Microsoft Office 2000
---------------------?
???????????????Microsoft SQL Server 2000 數(shù)據(jù)庫中的數(shù)據(jù)倉庫數(shù)據(jù)可由 Microsoft Office 組件訪問,
???????????????如 Microsoft Excel 或 Microsoft Access。
???????????????但是,大多數(shù)數(shù)據(jù)倉庫中的數(shù)據(jù)量通常表明,需要創(chuàng)建并維護特殊的查詢或數(shù)據(jù)表以支持最終用戶使用這些組件。
???????????????必須創(chuàng)建這類特殊的查詢和表并作為數(shù)據(jù)倉庫的一部分進行維護。
???????????????一個例外是 Excel PivotTables 和 SQL Server 2000 Analysis Services 的集成。
???????????????Analysis Services 用于創(chuàng)建和管理 OLAP 數(shù)據(jù)時,最終用戶很容易通過分析服務器連接到多維數(shù)據(jù)集聯(lián)機分析數(shù)據(jù),
???????????????或在他們的本地計算機上創(chuàng)建多維數(shù)據(jù)集脫機使用。
Web 訪問和創(chuàng)建報表
------------------?
???????????????向最終用戶提供數(shù)據(jù)倉庫數(shù)據(jù)訪問能力的 Web 應用程序很受歡迎,
???????????????因為客戶端可以使用標準的 Web 瀏覽器,而不必非得安裝、配置和維護特殊的應用程序。
???????????????最初只能查看靜態(tài) Web 頁上顯示的數(shù)據(jù),現(xiàn)在,最新技術支持創(chuàng)建高級交互式應用程序,
???????????????使客戶端得以查詢和更新數(shù)據(jù)倉庫和多維數(shù)據(jù)集中的數(shù)據(jù)。
脫機 OLAP 多維數(shù)據(jù)集
--------------------
???????????????聯(lián)機分析處理 (OLAP) 中使用的多維數(shù)據(jù)集提供數(shù)據(jù)倉庫數(shù)據(jù)的多維視圖,
???????????????最終用戶發(fā)現(xiàn)在他們搜索業(yè)務問題的答案時很容易使用和瀏覽該視圖。
???????????????Microsoft SQL Server 2000 Analysis Services 通過其用于客戶端應用程序的 PivotTable 服務組件,
???????????????提供創(chuàng)建數(shù)據(jù)倉庫多維數(shù)據(jù)集的子集并在本地保存它們以便脫機分析的功能。
???????????????最終用戶應用程序還可以在脫機模式下使用 PivotTable 服務,直接從關系數(shù)據(jù)庫創(chuàng)建脫機多維數(shù)據(jù)集
第三方應用程序
--------------
?
自定義應用程序
--------------
SQL2000聯(lián)機叢書:維護數(shù)據(jù)倉庫
本次摘錄 來源于
SQL2000聯(lián)機叢書中 創(chuàng)建和使用數(shù)據(jù)倉庫概述
為的是對數(shù)據(jù)倉庫有個概觀的認識
=============
維護數(shù)據(jù)倉庫
=============
更新數(shù)據(jù)倉庫數(shù)據(jù)
----------------
???????????????更新數(shù)據(jù)倉庫數(shù)據(jù)包括定期從可操作系統(tǒng)中析取數(shù)據(jù),清除和轉換數(shù)據(jù)和將新數(shù)據(jù)裝入數(shù)據(jù)倉庫。
???????????????每次數(shù)據(jù)更新還包括:
???????????????在 Microsoft SQL Server 2000 Analysis Services 用于聯(lián)機分析處理 (OLAP) 的情況下必須完成同步多維數(shù)據(jù)集的任務;
???????????????還必須更新所有作為數(shù)據(jù)倉庫一部分的數(shù)據(jù)集市。
?
???????????????用于定期更新的析取、清理和轉換數(shù)據(jù)的過程,
???????????????在本質上與初始裝載數(shù)據(jù)倉庫所使用的過程相同,
???????????????但更新過程通常比初始裝載過程簡單且自動化程度更高。
???????????????在初始裝載過程中制定的過程和自動化任務可以減少更新過程中所需的手工工作量。
???????????????初始裝載過程中識別和執(zhí)行的對源可操作系統(tǒng)的改正也減少了必須在更新過程中解決的不一致和錯誤的數(shù)目。
???????????????但是,經(jīng)常有這種情況,在更新過程中需要手工干預以確保數(shù)據(jù)準備裝入數(shù)據(jù)倉庫。
?
???????????????初始數(shù)據(jù)裝載和數(shù)據(jù)更新之間的一個不同之處在于,
???????????????在將數(shù)據(jù)裝入數(shù)據(jù)倉庫可由用戶使用之前,應在更新數(shù)據(jù)上不斷地驗證引用完整性。
???????????????更新通常包括添加和更改維度表以及向事實數(shù)據(jù)表添加行。
???????????????在將新更改的數(shù)據(jù)裝入數(shù)據(jù)倉庫之前,應檢查其內部一致性并在數(shù)據(jù)倉庫中的當前數(shù)據(jù)上驗證。
?
???????????????在更新數(shù)據(jù)已準備裝入數(shù)據(jù)倉庫后,
???????????????可以使用 Transact-SQL、數(shù)據(jù)轉換服務 (DTS) 或 bcp 實用工具更新數(shù)據(jù)倉庫表。
???????????????根據(jù)為最終用戶提供數(shù)據(jù)倉庫數(shù)據(jù)訪問能力的顯示應用程序的設計和實現(xiàn),
???????????????可能需要在更新過程中使數(shù)據(jù)倉庫脫機以免查詢結果不一致。
管理數(shù)據(jù)倉庫
------------
???????????????管理數(shù)據(jù)倉庫與管理聯(lián)機事務處理 (OLTP) 系統(tǒng)既相似又不同。
???????????????相似之處在于:
???????????????在關系數(shù)據(jù)庫中存儲和維護數(shù)據(jù)倉庫數(shù)據(jù),所以用于管理關系數(shù)據(jù)庫的工具也可以用于數(shù)據(jù)倉庫。
???????????????不同之處在于:
???????????????OLTP 系統(tǒng)通常具有大量不穩(wěn)定數(shù)據(jù)的事務更新的特點,而數(shù)據(jù)倉庫通常具有大量穩(wěn)定的歷史數(shù)據(jù)的特點。
???????????????這些差異要求對數(shù)據(jù)倉庫管理任務使用不同的方法,如備份數(shù)據(jù)和自動執(zhí)行反復出現(xiàn)的任務。
?
???????????????備份數(shù)據(jù)倉庫數(shù)據(jù)
????????????????聯(lián)機事務處理 (OLTP 系統(tǒng)捕獲外來數(shù)據(jù)并更新數(shù)據(jù)庫。
????????????????為確保不丟失數(shù)據(jù),系統(tǒng)在事務執(zhí)行時記錄事務,管理員則制定包括定期的完整和增量數(shù)據(jù)庫備份的備份策略。
??這些策略旨在防止數(shù)據(jù)丟失,最大程度地減少對可操作事務處理的影響,以及從系統(tǒng)故障中快速恢復。
??
??相反,數(shù)據(jù)倉庫存儲大量穩(wěn)定的歷史數(shù)據(jù),按照被管理的定期調度進行更新。
??對于數(shù)據(jù)倉庫,在設計備份策略時應盡量減少完整備份并對數(shù)據(jù)更新使用增量備份。
??
??在恢復時間約束上,數(shù)據(jù)倉庫故障比 OLTP 故障通常更靈活且限制更少。
??與 OLTP 系統(tǒng)相比,更寬松的恢復時間約束通常使得很少需要進行完整數(shù)據(jù)倉庫備份。
??例如,銷售事實表可能包含數(shù)百萬行反映十年歷史的銷售。
??在業(yè)務執(zhí)行到年終結束時,幾乎不太可能更改銷售數(shù)據(jù)。
??
??重復備份沒更改的數(shù)據(jù)是不必要的,備份策略中應考慮這一點。
??根據(jù)恢復時間約束和數(shù)據(jù)量,可以創(chuàng)建一個策略,使用增量備份備份在數(shù)據(jù)倉庫更新過程中新增的數(shù)據(jù),
??然后創(chuàng)建只包含在年終結束后的當前年度內新增的數(shù)據(jù)的備份。
??從徹底的數(shù)據(jù)倉庫數(shù)據(jù)庫故障中恢復要求裝載多個備份,
??當前年度之前的每一年各有一個備份,然后是當前年度更新的增量備份。
?自動化數(shù)據(jù)倉庫任務
??管理和維護數(shù)據(jù)倉庫涉及大量的任務。
??這些任務中的很多可通過 Microsoft SQL Server 2000 中的各種工具自動執(zhí)行。
??可以調度定期完成適當?shù)娜蝿铡?br />??
優(yōu)化數(shù)據(jù)倉庫性能
----------------
?對于分析并匯總多個聯(lián)接表中的大量行的查詢,數(shù)據(jù)倉庫必須提供對這類查詢的快速評估。
?Microsoft SQL Server 2000 提供可用于優(yōu)化包含數(shù)據(jù)倉庫數(shù)據(jù)的關系數(shù)據(jù)庫性能的信息。
?數(shù)據(jù)庫的性能會受您所做的很多選擇的影響,
?比如在數(shù)據(jù)庫的邏輯設計、它的物理實現(xiàn)、索引優(yōu)化、查詢優(yōu)化等方面的選擇。
轉載于:https://www.cnblogs.com/freeliver54/archive/2006/11/29/575992.html
總結
以上是生活随笔為你收集整理的SQL2000联机丛书:使用和维护数据仓库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 女性不孕检查三项什么
- 下一篇: 花自盛开蝴蝶自来下一句是什么呢?