使用數據表更新原則的常見案例為何
本節說明一些使用更新原則的已知案例。 當您的情況很類似時,請考慮採用這些案例。
在本文中,您將瞭解下列常見案例:
Medallion 架構數據擴充
數據表上的更新原則提供有效率的方式來套用快速轉換,並與 Fabric 中的 medallion Lakehouse 架構相容。
在獎牌架構中,當原始數據登陸在登陸數據表 (銅層) 時,可以使用更新原則來套用初始轉換,並將擴充的輸出儲存至銀層數據表。 此程式可以串聯,其中銀層數據表的數據可以觸發另一個更新原則,進一步精簡數據並凍結金層數據表。
下圖說明名為 Get_Values 的數據擴充更新原則範例。 擴充的數據會輸出到銀層數據表,其中包含根據原始數據的計算時間戳值和查閱值。
數據路由
當原始數據元素包含必須根據數據本身的一或多個屬性路由傳送至不同數據表的數據時,就會發生數據擴充的特殊案例。
請考慮使用與先前案例相同的基底數據,但這次有三則訊息。 第一則訊息是裝置遙測訊息,第二則訊息是裝置警示訊息,而第三則訊息是錯誤。
若要處理此案例,會使用三個更新原則。 Get_Telemetry更新原則會篩選裝置遙測訊息、擴充數據,並將它儲存至Device_Telemetry數據表。 同樣地, Get_Alarms 更新原則會將數據儲存至 Device_Alarms 數據表。 最後, Log_Error 更新原則會將未知的訊息傳送至 Error_Log 數據表,讓運算符偵測格式不正確的訊息或非預期的架構演進。
下圖描述使用三個更新原則的範例。
將資料模型最佳化
數據表上的更新原則是針對速度而建置的。 數據表通常符合 star 架構設計,可支援針對效能和可用性優化的數據模型開發。
在 star 架構中查詢數據表通常需要聯結數據表。 不過,數據表聯結可能會導致效能問題,特別是在查詢大量數據時。 若要改善查詢效能,您可以藉由在擷取時儲存反正規化數據來壓平模型。
在擷取時間聯結數據表具有在小型數據批次上操作的額外優點,導致聯結的計算成本降低。 這種方法可以大幅改善下游查詢的效能。
例如,您可以查閱維度數據表中的值,從裝置擴充原始遙測數據。 更新原則可以在擷取時間執行查閱,並將輸出儲存到反正規化數據表。 此外,您可以使用從參考數據表取得的數據源來擴充輸出。
下圖描述範例,其中包含名為 Enrich_Device_Data的更新原則。 它會使用從 站 台參考數據表取得的數據源來擴充輸出數據。
相關內容
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應