當你將資料整合進 Dataverse 時,常見的情況之一是保持資料與來源同步。 利用標準資料流,你可以將資料載入 Dataverse。 本文說明如何保持資料與來源系統同步。
關鍵欄的重要性
如果你使用關聯式資料庫系統作為來源,通常資料表中有關鍵欄位,且資料格式正確,可以載入 Dataverse。 不過,Excel 檔案中的資料並不總是那麼乾淨。 你通常會有一個包含資料表的 Excel 檔案,但沒有任何關鍵欄位。 在標準 資料流的欄位映射考量中,你可以看到如果來源中有鍵欄位,它可以輕鬆地作為資料流欄位映射的替代鍵。
在 Dataverse 中,有鍵欄位對資料表很重要。 鍵欄位是列識別碼;此欄位每列包含唯一的值。 有鍵欄位有助於避免重複列,也有助於資料與來源系統同步。 如果某列從來源系統中移除,擁有一個關鍵欄位有助於找到它並從 Dataverse 中移除。
建立鍵欄位
如果你的資料來源(Excel、文字檔或其他來源)沒有關鍵欄位,你可以用以下方法產生一個:
清理你的資料。
建立鍵欄位的第一步是移除所有不必要的列、清理資料、移除空列,以及可能的重複。
新增索引欄。
資料清理完成後,下一步是為其指派一個金鑰欄位。 你可以從新增欄位標籤中使用新增索引欄位來達成這個目的。
當你加入索引欄時,你可以自訂它,例如對起始數字或每次跳躍的數值進行自訂。 預設起始值為零,且每次會增加一個值。
使用該鍵列作為替代鍵
現在你已經有了鍵欄位,就可以將資料流的欄位映射指派到備用鍵。
設定很簡單,你只需要設定備用鍵。 不過,如果你有多個檔案或資料表,還有一個步驟需要考慮。
如果你有多個檔案
如果你只有一個 Excel 檔案(或試紙或表格),那麼前一個步驟的步驟就足以設定備用鍵。 不過,如果你有多個檔案(或工作表、表格)結構相同(但資料不同),那你就應該把它們附加在一起。
如果你從多個 Excel 檔案取得資料,Power Query 的 「合併檔案 」選項會自動將所有資料附加在一起,輸出結果會呈現如下圖。
如前圖所示,除了附加結果外,Power Query 還會帶入包含檔案名稱的 Source.Name 欄。 每個檔案的索引值可能是唯一的,但在多個檔案中並非唯一。 然而,索引欄與 Source.Name 欄的組合是獨特的組合。 在這種情況下,請選擇一個複合候補鍵。
刪除查詢輸出中不再存在的列
最後一步是選擇刪除查詢輸出中不再存在的列。 此選項會將 Dataverse 資料表中的資料與來源資料比對,基於替代鍵(可能是複合鍵),並移除已不存在的資料列。 因此,Dataverse 中的資料將始終與資料來源同步。