共用方式為


定價範例:複製資料並使用 Azure Databricks 轉換資料

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用

在此案例中,您希望依每小時的排程將資料從 AWS S3 複製到 Azure Blob 儲存體,並使用 Azure Databricks 轉換,每天 8 小時,持續 30 天。

下列範例中使用的價格為假設,並非表示確切實際價格。 系統不會顯示讀取/寫入和監視成本,因為這些成本通常是可忽略的,而且不會對整體成本造成太大的影響。 在定價計算機估計值中,活動執行也會四捨五入至最接近的 1000。

注意

此估計值僅適用於涉及的 Azure Data Factory 成本。 不過,Azure Databricks 也會在此案例中產生成本,您可以使用 Azure 定價計算機來預估成本。

請參閱 Azure 定價計算機以取得更明確的案例,並估計未來使用服務的成本。

組態

若要完成案例,您需要使用下列項目建立管線:

  • 一個複製活動,包含要從 AWS S3 複製資料的輸入資料集,以及 Azure 儲存體上之資料的輸出資料集。
  • 一個用於資料轉換的 Azure Databricks 活動。
  • 一個每小時執行管線的排程觸發程序。 當您想要執行管線時,您可以立即加以觸發或安排排程。 除了管線本身之外,每個觸發程序執行個體都會被視為單一活動執行。

圖表:具有排程觸發程序的管線。在管線中,複製活動會流向輸入資料集、輸出資料集和在 Azure Databricks 上執行的 DataBricks 活動。輸入資料集會流向 AWS S3 連結服務。輸出資料集會流向 Azure 儲存體連結服務。

成本估計

Operations 類型與單位
執行管線 「每次執行」都有 3 個活動執行 (1 個用於觸發程序執行,2 個則用於活動執行) = 720 個活動執行,並會無條件進位至 1000,因為這是允許的最少遞增單位。
複製資料假設:「每次執行」的 DIU 小時 = 10 分鐘 10 分鐘\60 分鐘 * 4 Azure 整合執行階段 (預設 DIU 設定 = 4) 如需資料整合單位以及最佳化複製效能的詳細資訊,請參閱此文章
執行 Databricks 活動假設:「每次執行」的外部執行時數 = 10 分鐘 10 分鐘/60 分鐘外部管線活動執行

定價計算機範例

30 天的案例定價總計:$41.01

螢幕擷取畫面:針對「使用 Azure Databricks 來複製和轉換資料」案例所設定的定價計算機。