適用於:
Azure Data Factory
Azure Synapse Analytics
提示
Data Factory in Microsoft Fabric 是下一代的 Azure Data Factory,擁有更簡單的架構、內建 AI 及新功能。 如果你是資料整合新手,建議先從 Fabric Data Factory 開始。 現有的 ADF 工作負載可升級至 Fabric,以存取資料科學、即時分析與報告等新能力。
歡迎來到 Azure Data Factory! 本文可協助您在五分鐘內建立第一個數據處理站和管線。
本文中的 Azure Resource Manager 範本(ARM 範本)能建立並設定你需要的所有功能。 接著你可以到示範資料工廠,觸發管線,將部分樣本資料從一個 Azure Blob Storage 資料夾移到另一個資料夾。
必要條件
如果你沒有Azure訂閱,請在開始前建立一個free帳號。
影片摘要
下列影片提供本文中範例的逐步解說:
步驟 1:使用示範來建立資源
在這個示範情境中,你會在資料工廠中使用 copy activity,將一個名為 moviesDB2.csv 的 blob 從 Azure Blob Storage 的輸入資料夾複製到輸出資料夾。 在實際案例中,此複製作業可能在服務中可用的任何支援資料來源和接收器之間進行。 其也可能牽涉到資料中的轉換。
選取下列按鈕。
選擇按鈕後會產生以下 Azure 資源:
- Azure Data Factory 帳戶
- 包含具有一個複製活動的管線的資料處理站
- 一個 Azure Blob Storage 帳號,將 moviesDB2.csv 上傳到輸入資料夾作為資料來源
- 用於將資料工廠連接到 Blob 儲存空間的連結服務
系統會將您導向至組態頁面以部署範本。 在本頁:
針對 [資源群組],選取 [ 新建 ] 以建立資源群組。 您可以將所有其他值保留預設值。
選取 [檢閱 + 建立],然後選取 [ 建立 ] 以部署資源。
附註
需部署範本的用戶需要為管理的身分識別指派角色。 此步驟需要可透過擁有者、使用者存取管理員或受控識別作員角色授與的許可權。
此示範中的所有資源都會在新的資源群組中建立,因此您稍後可以輕鬆地加以清除。
步驟 2:檢閱已部署的資源
在顯示部署成功完成的訊息中,選取 [移至資源群組]。
資源群組包含新的資料工廠、Blob Storage 帳號,以及部署所建立的管理身份。 選取資源群組中的資料處理站加以檢視。
選取 [啟動工作室] 按鈕。
In Azure Data Factory Studio:
- 選取 [建立者] 索引標籤
。 - 選取範本建立的管線。
- 選取 [ 開啟] 來檢查源數據。
- 選取 [建立者] 索引標籤
在來源數據集中,選取 [ 流覽 ] 以檢視針對示範建立的輸入檔。
請注意 moviesDB2.csv 檔案,檔案已上傳至輸入資料夾。
步驟 3:觸發要執行的示範管線
選取 [新增觸發程式],然後選取 [ 立即觸發]。
在右側窗格上的 [管線執行] 下,選取 [確定]。
監視管線
選取 [監視] 索引標籤
。 此索引標籤提供管線執行的概觀,包括開始時間和狀態。
在本快速入門中,管線只有一個活動類型:複製資料。 選取管線名稱,以檢視複製活動執行結果的詳細數據。
選取 [詳細數據 ] 圖示以顯示詳細的複製程式。 在結果中, [數據讀取 ] 和 [ 數據寫入 大小] 相同,而且一個檔案已讀取和寫入。 這項信息證明所有數據都已成功複製到目的地。
清除資源
您可以使用下列兩種方式之一,清除您在本文中建立的所有資源:
你可以刪除整個Azure資源群組,其中包含所有在該群組中建立的資源。
如果您想要保留一些資源,請移至資源群組,並只刪除您想要移除的特定資源。
例如,如果您使用此範本來建立數據處理站以供另一個教學課程使用,您可以刪除其他資源,但只保留數據處理站。
相關內容
在本文中,您已建立包含具有複製活動之管線的資料處理站。 想了解更多關於 Azure Data Factory 的資訊,請繼續閱讀以下文章及培訓模組:
- 快速入門:使用 Azure Data Factory Studio 中的複製資料工具來複製資料
訓練模組:Azure Data Factory 導論