快速入門:使用 Azure Data Factory Studio 中的複製資料工具來複製資料

適用于: Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用于企業的單一分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告等所有專案。 瞭解如何 免費啟動新的試用版

在本快速入門中,您將使用複製資料工具來建立管線,以將資料從 Azure Blob 儲存體中的源資料夾複製到目的檔案夾。

必要條件

Azure 訂用帳戶

如尚未擁有 Azure 訂用帳戶,請在開始之前先建立免費帳戶

在 Azure Blob 儲存體 中準備來源資料

選取下方的按鈕來試試看!

Try your first data factory demo

系統會將您重新導向至下圖中顯示的組態頁面,以部署範本。 在這裡,您只需要建立 新的資源群組 。 (您可以保留所有其他值的預設值。然後按一下 [ 檢閱 + 建立 ],然後按一下 [ 建立 ] 以部署資源。

注意

部署範本的使用者必須將角色指派給受控識別。 這需要可透過擁有者、使用者存取管理員istrator 或受控識別操作員角色授與的許可權。

新的 Blob 儲存體帳戶將會在新的資源群組中建立,moviesDB2.csv 檔案會儲存在 Blob 儲存體中稱為 輸入 的資料夾。

A screenshot of the deployment template creation dialog.

建立資料處理站

您可以使用現有的資料處理站或建立新的資料處理站,如 快速入門:使用 Azure 入口網站 建立資料處理站中所述。

使用複製資料工具來複製資料

下列步驟將逐步引導您使用 Azure Data Factory 中的複製資料工具輕鬆複製資料。

步驟 1:啟動複製資料工具

  1. 在 Azure Data Factory 的首頁上,選取 [內嵌 ] 圖格以啟動複製資料工具。

    Screenshot that shows the Azure Data Factory home page.

  2. 在 [ 複製資料] 工具的 [屬性 ] 頁面上,選擇 [工作類型 ] 下的 [內建複製工作 ],然後選取 [ 下一步 ]。

    Screenshot that shows the Properties page.

步驟 2:完成來源設定

  1. 按一下 [+ 建立新連線 ] 以新增連線。

  2. 選取您要為來源連線建立的連結服務類型。 在本教學課程中,我們使用 Azure Blob 儲存體 。 從資源庫選取它,然後選取 [ 繼續 ]。

    Screenshot that shows the Select Blob dialog.

  3. 在 [ 新增連線](Azure Blob 儲存體) 頁面上,指定連線的名稱。 從 Azure 訂用帳戶清單中選取您的 Azure 訂用帳戶,並從儲存體帳戶名稱 清單中選取您的儲存體帳戶 、測試連線,然後選取 [ 建立 ]。

    Screenshot that shows where to configure the Azure Blob storage account.

  4. 在 連線ion 區塊中 選取新建立的連線

  5. 在 [ 檔案或資料夾] 區段中,選取 [流覽 ] 以流覽至 adftutorial/input 資料夾,選取 emp.txt 檔案,然後按一下 [ 確定 ]。

  6. 選取 [ 二進位複製] 核取方塊以依目前狀態複製 檔案,然後選取 [ 下一步 ]。

    Screenshot that shows the Source data store page.

步驟 3:完成目的地設定

  1. 選取您在 連線ion 區塊中建立的 AzureBlob儲存體 連線

  2. 在 [ 資料夾路徑] 區段中,輸入 資料夾路徑的 adftutorial/output

    Screenshot that shows the Destination data store page.

  3. 將其他設定保留為預設值,然後選取 [ 下一步 ]。

步驟 4:檢閱所有設定和部署

  1. [設定] 頁面上,指定管線的名稱及其描述,然後選取 [下一步 ] 以使用其他預設組態。

    Screenshot that shows the settings page.

  2. 在 [ 摘要] 頁面上,檢閱所有設定,然後選取 [ 下一步 ]。

  3. 在 [ 部署完成 ] 頁面上,選取 [監視 ] 以監視您所建立的管線。

    Screenshot that shows the Deployment complete page.

步驟 5:監視執行中的結果

  1. 應用程式會切換至 [ 監視] 索引標籤。您會在此索引標籤上看到管線的狀態。選取 [ 重新整理 ] 以重新整理清單。 按一下 [管線名稱 ] 底下 的連結,以檢視活動執行詳細資料或重新執行管線。

    Screenshot that shows the refresh pipeline button.

  2. 在 [活動執行] 頁面上,選取 [活動名稱 ] 資料行底下的 [詳細資料 ] 連結(眼鏡圖示),以取得複製作業的詳細資訊。 如需屬性的詳細資訊,請參閱 複製活動概觀

此範例中的管線會將資料從一個位置複製到 Azure Blob 儲存體中的另一個位置。 若要深入瞭解在更多案例中使用 Data Factory,請流覽教學 課程