分享方式:


快速入門:開始使用 Azure Data Factory

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory (部分機器翻譯),這是適用於企業的全方位分析解決方案。 Microsoft Fabric (部分機器翻譯) 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用 (部分機器翻譯)!

歡迎使用 Azure Data Factory! 本快速入門文章可讓您在 5 分鐘內建立第一個資料處理站和管線。 下列 ARM 範本會建立並設定試用所需的一切。然後,您只需要瀏覽至示範資料處理站,再按一下以觸發管線,以將一些樣本資料從某個 Azure Blob 儲存體移至另一個 Blob 儲存體。

必要條件

如果您沒有 Azure 訂用帳戶,請在開始前建立免費帳戶

影片摘要

下列影片提供範例的逐步解說:

按一下即可試用第一個示範

在第一個示範情節中,您將使用資料處理站中的複製活動,將名為 moviesDB2.csv 的 Azure Blob 從 Azure Blob 儲存體上的輸入資料夾複製到輸出檔案夾。 在真實世界情節中,此複製作業可能在服務中可用的任何支援資料來源和接收之間進行。 其也可能牽涉到資料中的轉換。

按一下即可立即試用! 按一下下方的按鈕之後,將會在 Azure 中建立下列物件:

  • 資料處理站帳戶
  • 資料處理站內具有一個複製活動的管線
  • moviesDB2.csv 上傳至輸入資料夾作為來源的 Azure blob 儲存體
  • 將資料處理站連線至 Azure blob 儲存體的連結服務

步驟 1:按一下按鈕以啟動

選取下方的按鈕以試用! (如果您已按一下上述按鈕,就不需要再次點擊。)

Try your first data factory demo

系統會將您重新導向至下圖中顯示的設定頁面,以部署範本。 您只需要在這裡建立新的資源群組。 (您可以保留所有其他值的預設值)。然後,按一下 [檢閱並建立],接著按一下 [建立] 來部署資源。

注意

範本的部署使用者必須將角色指派給受控識別。 這需要可透過擁有者、使用者存取管理員或受控識別操作員角色授與的權限。

上述所有的資源都會建立在新的資源群組中,因此您可以在試用示範之後輕鬆清除這些資源。

A screenshot of the deployment template creation dialog.

步驟 2:檢閱已部署的資源

  1. 部署完成後,請選取 [移至資源群組]A screenshot of the deployment complete page in the Azure portal after successfully deploying the template.

  2. 在資源群組中,您會看到部署所建立的新資料處理站、Azure Blob 儲存體帳戶和受控識別。 A screenshot of the contents of the resource group created for the demo.

  3. 選取資源群組中的資料處理站加以檢視。 然後選取 [啟動工作室] 按鈕以繼續。 A screenshot of the Azure portal on the newly created data factory page, highlighting the location of the Open Azure Data Factory Studio button.

  4. 選取 [作者] 索引標籤 Author tab,然後選取該範本所建立的 [管線]。 然後選取 [開啟] 來檢查來源資料。

    Screenshot of the Azure Data Factory Studio showing the pipeline created by the template.

  5. 在您會看到的來源資料集中,選取 [瀏覽],並記下已上傳至輸入資料夾的 moviesDB2.csv 檔案。

    Screenshot of the source dataset highlighting the Browse button where the user can see the input file created for the demo.

    Screenshot of the contents of the input folder showing the moviesDB2.csv file used in the demo.

步驟 3:觸發要執行的示範管線

  1. 選取 [新增觸發程序],接著 [立即觸發]Screenshot of the Trigger Now button for the pipeline in the demo.
  2. 在右側窗格的 管線執行下,選取 [確定]

監視管線

  1. 選取 [監視] 索引標籤 Monitor tab

  2. 您可以在 [監視] 索引標籤中看到管線執行的概觀,例如執行開始時間、狀態等。

    Screenshot of the data factory monitoring tab.

  3. 在本快速入門中,管線只有一個活動類型:複製。 按一下管線名稱,您可以看到複製活動執行結果的詳細資料。

    Screenshot of the run results of a copy activity in the data factory monitoring tab.

  4. 按一下詳細資料,隨即顯示詳細的複製程序。 從結果中,讀取和寫入的資料大小都相同,而且 1 個檔案已讀取和寫入,這也證明所有資料都已成功複製到目的地。

    Screenshot of the detailed copy activity run results.

清除資源

您有兩種方式可以清除您在本快速入門中建立的所有資源。 您可以刪除整個 Azure 資源群組,其中包括在資源群組中建立的所有資源。 或者,如果您想要保留一些資源,請瀏覽至資源群組,並只刪除您想要的特定資源,並保留其他資源。 例如,如果您使用此範本來建立資料處理站以供另一個教學課程使用,您可以刪除其他資源,但只保留資料處理站。

在本快速入門中,您已建立 Azure Data Factory,其中包含具有複製活動的管線。 若要深入瞭解 Azure Data Factory,請繼續閱讀本文和以下學習課程模組。