ETL学习之四:SQL Server Integration Services入门
??ETL學習之四:SQL Server Integration Services入門
???????? SSIS就是微軟在SQL SERVER2005上對DTS的升級,不得不說,微軟在BI上是花了很大功夫的,包括提供了SSIS,SSAS,SSRS等多個工具,從創建數據倉庫,到從元數據抽取數據,到創建維度和挖掘結構,挖掘模型,訓練,報表模型設計,報表設計,發布,非常方便和強大。先從ETL開始,看看利用這些工具如何將元數據和數據倉庫聯系起來,以下轉自MSDN:
??????
?????在本課中,您將創建一個簡單 ETL 包,該包可以從單個平面文件源提取數據,使用兩個查找轉換組件轉換該數據,然后將該數據寫入 AdventureWorksDW 中的 FactCurrencyRate 事實數據表。在本課中,您還將學習如何創建新包、添加和配置數據源和目標連接以及使用新的控制流和數據流組件。
| 本教程需要 AdventureWorksDW 示例數據庫。有關安裝和部署 AdventureWorksDW 的詳細信息,請參閱: . ? |
?
了解包要求
在創建包之前,需要充分了解在源數據和目標數據中使用的格式。了解了這兩種數據格式后,才能定義將源數據映射到目標數據所需的轉換。
查看源
對于本教程,源數據是一組包含在平面文件 SampleCurrencyData.txt 中的歷史貨幣數據。源數據有以下四列:貨幣的平均匯率、貨幣鍵、日期鍵和當天匯率。
下面是 SampleCurrencyData.txt 文件中所包含的源數據示例:
1.00010001???ARS???9/3/2001 0:00????0.99960016
1.00010001???ARS???9/4/2001 0:00????1.001001001
1.00020004???ARS???9/5/2001 0:00????0.99990001
1.00020004???ARS???9/6/2001 0:00????1.00040016
1.00050025???ARS???9/7/2001 0:00????0.99990001
1.00050025???ARS???9/8/2001 0:00????1.001001001
1.00050025???ARS???9/9/2001 0:00????1
1.00010001???ARS???9/10/2001 0:00???1.00040016
1.00020004???ARS???9/11/2001 0:00???0.99990001
1.00020004???ARS???9/12/2001 0:00???1.001101211
?
在使用平面文件源數據時,需要了解平面文件連接管理器如何解釋平面文件數據,這一點很重要。如果平面文件源是 Unicode 編碼的,則平面文件連接管理將所有列定義為 [DT_WSTR],默認列寬為 50。如果平面文件源是 ANSI 編碼的,則將列定義為 [DT_STR],默認列寬為 50 。您可能必須更改這些默認設置,才能使字符串列類型與所使用的數據更相符。為此,您需要查看將寫入數據的目標的數據類型,然后在平面文件連接管理器中選擇正確的類型。
查看目標
源數據的最終目標是 AdventureWorksDW 中的 FactCurrencyRate 事實數據表。FactCurrencyRate 事實數據表有四列,并且與兩個維度表有關系,如下表所示。
| AverageRate | float | 無 | 無 |
| CurrencyKey | int (FK) | DimCurrency | CurrencyKey (PK) |
| TimeKey | Int (FK) | DimTime | TimeKey (PK) |
| EndOfDayRate | float | 無 | 無 |
將源數據映射為與目標兼容
對源數據和目標數據的分析指出需要查找 CurrencyKey 和 TimeKey 值。將執行這些查找的轉換通過使用 DimCurrency 和 DimTime 維度表中的備用鍵來獲取 CurrencyKey 和 TimeKey 值。
| 0 | FactCurrencyRate | AverageRate | Float |
| 1 | DimCurrency | CurrencyAlternateKey | nchar(3) |
| 2 | DimTime | FullDateAlternateKey | Datetime |
| 3 | FactCurrencyRate | EndOfDayRate | Float |
?
????
轉載于:https://www.cnblogs.com/millen/archive/2009/03/19/1416492.html
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的ETL学习之四:SQL Server Integration Services入门的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 初识ajaxpro以及使用
- 下一篇: 触摸屏调试经验谈