共用方式為


工作 4 (選擇性):結合、比對及發行新的資料集

經過一段時間後,您需要將更多的資料加入至 MDS 儲存機制。 在加入資料之前,比較新資料與已在 MDS 中管理的資料,有助於確保不會加入重複或不精準的資料。 在適用於 Excel 的 Master Data Services 增益集中,您可以結合兩個工作表中的資料然後比較資料,以識別重複項並加以移除,之後再將資料發行到 MDS。 MDS Excel 增益集的比對功能會使用 DQS 比對功能來識別資料中的相符內容。 在這項工作中,您會將兩個工作表中的資料結合到一個工作表,然後執行比對活動來識別重複項並加以移除,之後再將資料發行到 MDS。 如需詳細資訊,請參閱適用於 Excel 的 MDS 增益集中的資料品質比對結合資料主題。

  1. 啟動新的 Excel 執行個體。 按一下 [開始]、指向 [執行]、輸入 Excel,然後按一下 [確定]。

  2. 按一下功能表列上的 [主要資料],切換到 [主要資料] 索引標籤。

  3. 在功能區上的 [連接和載入] 群組中按一下 [連接],連接到 MDS 伺服器。 您在這一課的稍早已經設定這個連接。

    Excel - [主要資料] 索引標籤上的 [顯示總管] 按鈕

  4. 您應該會看到右側的 [主資料總管] 窗格。 如果您看不到 [主資料總管],請按一下功能區上的 [顯示總管] 按鈕。

  5. 在 [主資料總管] 視窗中,針對 [模型] 選取下拉式清單中的 [Suppliers]。 您應該會看到此模型有一個實體:Supplier

    Excel - [主資料總管] 視窗

  6. 在實體清單中按兩下 [Supplier],將實體成員載入到 Excel 工作表。

  7. 按一下底部的 [Sheet2],切換到 [Sheet2] 索引標籤。 如果您未看到 [Sheet2],請加入新的工作表。

  8. 開啟 Suppliers.xls 檔案 (教學課程檔案中所包含的原始輸入檔),並將 CombineAndCleanse 工作表中的所有 (三個) 資料列複製到 Sheet2

  9. 切換回連接到 MDSBook 1 – Microsoft Excel (不是清理和比對的供應商清單 Excel) 中的 [Supplier] 工作表。

  10. 按一下功能表列上的 [主要資料]。

  11. 在功能區上按一下 [結合資料]。 您將會看到 [結合資料] 對話方塊。

  12. 在 [結合資料] 對話方塊中,按一下 [要與 MDS 資料結合的範圍] 文字方塊旁邊的按鈕,如以下影像所示。

    Excel - [結合資料] 對話方塊

  13. 您現在應該會看到縮小的對話方塊。 現在,按一下 [Sheet2] 切換到 [Sheet2] 索引標籤,其中包含有 4 個資料列的新供應商資料 (包含一個標頭資料列)。

  14. 在 [Sheet2] 中,選取 [包含標頭資料列的所有資料列] (即使看起來似乎已選取)。 您應該會看到 [要與 MDS 資料結合的範圍] 已自動更新。

    Excel - [結合資料] 對話方塊 - 最小化

  15. 切換回 [Supplier] 索引標籤,而不必關閉 [結合資料] 對話方塊。

  16. 按一下 [文字方塊] 旁邊的 [按鈕]。 您現在應該會看到對話方塊已放大。 您應該會看到Supplier MDS 實體的資料行到 Excel 資料行之間的所有對應已自動填入。

    Excel - 有資料填入的 [結合資料] 對話方塊

  17. 確定 [Code] 實體資料行會對應到工作表中的 [SupplierID] 資料行,而且 [Zip Code] 實體資料行會對應到工作表中的 [Zip Code] 資料行。

  18. 在 [結合資料] 對話方塊中,按一下 [合併]。

  19. 確認三個資料列已加入至工作表底部,而且應該有色彩標示。

    Excel - 結合之後的新元素

  20. 按一下功能區上的 [數學資料] 以識別重複項。 此功能會使用 DQS 的比對功能。

  21. 在 [比對資料] 對話方塊中,針對 [DQS 知識庫] 選取 [Supplier]。

    Excel - [比對資料] 對話方塊

  22. 將工作表資料行對應至定義域,如下表所示。

    工作表資料行

    定義域

    Code (您已上傳供應商識別碼當做 MDS 中供應商實體的代碼)

    Supplier ID

    Name (您已上傳供應商名稱當做 MDS 中供應商實體的名稱)

    Supplier Name

    ContactEmailAddress

    ContactEmail

  23. 針對 [Code] 資料行對應選取 [必要條件]。

  24. 輸入 70% 當做 [Supplier Name] 的 [加權],並輸入 30% 當做 [Contact Email] 的 [加權],如影像中所示。

  25. 按一下 [確定]。

  26. 比對程序應該識別出具有 Code:S1 的供應商有一個重複項。

    Excel - 比對結果

  27. 選取 [重複列] (橙色),並以滑鼠右鍵按一下,然後按一下 [刪除] 以刪除此資料列。

  28. 請刪除 CLUSTER_ID 資料行,因為您不再需要它。

  29. 按一下 [發行],將具有 Code S66S57 的其他兩筆新記錄發行至 MDS。

  30. 在 [發行並註解] 對話方塊中加入 [註解],然後按一下 [發行]。

  31. 切換到 [主資料管理員 Web 應用程式]。

  32. 在首頁上確定已針對 [模型] 選取 [Suppliers],然後按一下 [總管]。 如果您已經開啟 [總管],請重新整理網際網路瀏覽器。

  33. 依 [Code] 排序清單,並尋找代碼為 S57S66 的記錄。 您也可以使用工具列上的 [篩選] 按鈕來搜尋清單中的特定記錄。

  34. 現在,關閉 Book1 – Microsoft Excel 視窗,而不用儲存檔案。

下一個步驟

工作 5:從 Excel 建立定義域屬性