第 1 課:建立專案和基本封裝
在這一課,您將建立一個從單個一般檔案來源擷取資料的簡易 ETL 封裝,使用兩個查閱轉換元件來轉換資料、將該資料寫入至 AdventureWorksDW 中的 FactCurrencyRate 事實資料表。在這一課,您會學到如何建立新封裝,加入和設定資料來源和目的地連接,以及使用新控制流程和資料流程元件。
重要事項 |
---|
這個教學課程需要 AdventureWorksDW 範例資料庫。如需有關安裝和部署 AdventureWorksDW 的詳細資訊,請參閱:<安裝 SQL Server 範例和範例資料庫的考量>。 |
了解封裝需求
在建立封裝之前,您需要了解來源資料和目的地使用的格式。了解這些資料格式之後,您就可以定義必要的轉換,將來源資料對應至目的地。
查看來源
在這個教學課程中,來源資料是一般檔案 SampleCurrencyData.txt 中所含的貨幣記錄資料集。來源資料具有下列四個資料行:貨幣的平均匯率、貨幣索引鍵、日期索引鍵和收盤匯率。
以下是包含在 SampleCurrencyData.txt 檔案中的來源資料範例:
1.00010001 ARS 9/3/2001 0:00 0.99960016
1.00010001 ARS 9/4/2001 0:00 1.001001001
1.00020004 ARS 9/5/2001 0:00 0.99990001
1.00020004 ARS 9/6/2001 0:00 1.00040016
1.00050025 ARS 9/7/2001 0:00 0.99990001
1.00050025 ARS 9/8/2001 0:00 1.001001001
1.00050025 ARS 9/9/2001 0:00 1
1.00010001 ARS 9/10/2001 0:00 1.00040016
1.00020004 ARS 9/11/2001 0:00 0.99990001
1.00020004 ARS 9/12/2001 0:00 1.001101211
使用一般檔案來源資料時,一定要了解一般檔案連接管理員如何解譯一般檔案資料。如果一般檔案來源是 Unicode,一般檔案連接管理員會將所有資料行定義為 [DT_WSTR],預設資料行寬度為 50。如果一般檔案來源是以 ANSI 編碼,資料行會定義為 [DT_STR],且資料行寬度為 50。您或許必須變更這些預設值,好讓字串資料行類型更適合您的資料。若要這麼做,您必須查看要在其中寫入資料的目的地之資料類型,然後在一般檔案連接管理員內選擇正確類型。
查看目的地
來源資料的最終目的地是 AdventureWorksDW 中的 FactCurrencyRate 事實資料表。FactCurrencyRate 事實資料表有 4 個資料行,而且與兩個維度資料表之間有關聯性,如下表所示。
資料行名稱 |
資料類型 |
查閱資料表 |
查閱資料行 |
---|---|---|---|
AverageRate |
float |
無 |
無 |
CurrencyKey |
int (FK) |
DimCurrency |
CurrencyKey (PK) |
TimeKey |
Int (FK) |
DimTime |
TimeKey (PK) |
EndOfDayRate |
float |
無 |
無 |
對應來源資料以便與目的地相容
來源和目的地資料格式的分析指出 CurrencyKey 和 TimeKey 值可能需要查閱。要執行這些查閱的轉換將使用 DimCurrency 和 DimTime 維度資料表的替代索引鍵來取得 CurrencyKey 和 TimeKey 值。
一般檔案資料行 |
資料表名稱 |
資料行名稱 |
資料類型 |
---|---|---|---|
0 |
FactCurrencyRate |
AverageRate |
Float |
1 |
DimCurrency |
CurrencyAlternateKey |
nchar (3) |
2 |
DimTime |
FullDateAlternateKey |
Datetime |
3 |
FactCurrencyRate |
EndOfDayRate |
Float |
課程工作
這一課包含下列工作:
開始課程
工作 1:建立新的 Integration Services 專案
|