共用方式為


工作 4 (選擇性):結合、比對和發佈新數據集

經過一段時間,您會想要將更多數據新增至 MDS 存放庫。 新增數據之前,比較新數據與已在 MDS 中管理的數據相當有用,以確保您不會新增重複或不正確的數據。 在適用於 Excel 的 Master Data Services 載入巨集中,您可以結合來自兩個工作表的數據,並比較數據以識別和移除重複數據,再將數據發佈至 MDS。 MDS Excel 增益集的比對功能會使用 DQS 比對功能來識別資料中的相符專案。 在這項工作中,您會將數據從兩個工作表合併成一個工作表,然後執行比對活動來識別並移除重複專案,再發佈至 MDS。 如需詳細資訊,請參閱 適用於 Excel 的 MDS 增益集中的數據品質匹配合併數據 主題。

  1. 啟動 Excel 的新實例。 按兩下 [開始],指向 [ 執行],輸入 Excel,然後按兩下 [ 確定]。

  2. 單擊選單列上的 [ 主數據] 以切換至 [ 主要數據 ] 索引標籤。

  3. 按一下功能區中的 [連線和載入] 群組上的 [連線] 以連線到 MDS 伺服器。 您已在此課程稍早設定此連線。

    Excel - 在主要數據索引標籤上顯示總管按鈕 Excel

  4. 您應該會在右側看到主數據檢視器窗格。 如果您沒有看到主要數據總管,請按下功能區上的 [ 顯示 總管] 按鈕。

  5. 在 [主要數據總管] 視窗中,選取 [模型] 下拉式清單中的 [供貨商]。 您應該會看到模型有一個實體: 供應商

    Excel - 主要數據總管視窗 Excel

  6. 按兩下實體清單中的 [供貨商 ],將實體成員載入Excel工作表。

  7. 點擊底部的 Sheet2 ,切換至 Sheet2 索引標籤。如果您沒有看到 Sheet2,請新增工作表。

  8. 開啟 Suppliers.xls 檔案(教學課程檔案中包含的原始輸入檔),並將 [CombineAndCleanse ] 工作表中的所有 (三) 列複製到 Sheet2

  9. MDS 連接到的 Book 1 - Microsoft Excel 中,切換回 供貨商 工作表,而不是 清理和相符的供貨商清單 工作表。

  10. 按兩下選單列上的 [ 主數據 ]。

  11. 在功能區上按一下合併資料。 您會看到 [ 合併資料] 對話框。

  12. 在 [合併數據] 對話框中,點擊 [與 MDS 數據合併的範圍] 文字框旁的按鈕,如下圖所示。

    Excel - 合併資料對話框 Excel

  13. 您現在應該會看到縮小的對話框。 現在,按兩下 [Sheet2 ] 切換至 [ Sheet2 ] 索引標籤,該索引標籤具有4個數據列的新供應商數據(包括一個標題列)。

  14. Sheet2 中,選取 包括標題行的所有行 (即使看起來已經選取)。 您應該會看到 要與 MDS 數據結合的範圍 會自動更新。

    Excel - 合併資料對話框 - 最小化

  15. 切換回 [供貨商 ] 索引標籤,而不關閉 [ 合併數據 ] 對話方塊。

  16. 按下文字框旁的按鈕。 您應該會看到對話框現在已展開。 您應該會看到供應商 MDS 實體的列與 Excel 列之間的所有對應會自動填入。

    Excel - 填滿數據的結合資料對話框

  17. 確定 Code 實體數據行已對應至工作表中的 SupplierID 數據行,而 郵政編碼 實體數據行會對應至工作表中的 [郵遞區號 ] 資料行。

  18. 在 [ 合併數據] 對話框中,按兩下 [ 合併]。

  19. 確認已將三個數據列新增至工作表底部,而且應該以色彩編碼。

    Excel - 合併後的新元素

  20. 按一下功能區上的數學資料以識別重複項目。 此功能使用 DQS 的比對功能。

  21. 在 [比對數據] 對話框中,選取 [DQS 知識庫供應商]。

    Excel - 比對數據對話框 Excel

  22. 將工作表數據行對應至定義域,如下表所示。

    工作表欄 網域
    代碼(您已將供應商 ID 上傳為 MDS 中供應商實體的代碼) 供應商標識碼
    名稱(您已將供應商名稱上傳為 MDS 的供應商實體名稱) 供應商名稱
    聯絡電子郵件地址 聯絡電子郵件
  23. 選擇 先決條件 用於 程序代碼 列對應。

  24. 輸入 70% 作為供應商名稱權數,以及 30% 做為聯繫人電子郵件權數,如下圖所示。

  25. 按一下 [確定]

  26. 比對程序應該識別代碼為S1的供應商的一個重複項目。

    Excel - 比對結果 Excel

  27. 選取 重複的數據列 (orange),按下滑鼠右鍵,然後按下 [ 刪除] 以刪除資料列。

  28. 刪除 CLUSTER_ID 數據行,因為您不再需要它。

  29. 單擊 [發佈 ] 將其他兩筆具有 Code S66S57 的新記錄發行至 MDS。

  30. 在 [ 發佈和批注 ] 對話框中,新增 批注,然後按兩下 [ 發佈]。

  31. 切換至 Master Data Manager Web 應用程式

  32. 在首頁上,確保選擇 供貨商 作為 模型,然後點擊 瀏覽器。 如果您已經開啟 [ 檔案總管 ],請重新整理網頁瀏覽器。

  33. 程式代碼排序列表,並尋找以 S57 和S66 作為代碼的記錄。 您也可以使用工具列上的 [ 篩選 ] 按鈕來搜尋清單中的特定記錄。

  34. 現在,關閉 Book1 - Microsoft Excel 視窗,並且不儲存檔案。

後續步驟

工作 5:從 Excel 建立 Domain-Based 屬性