使用複製資料工具將資料從 Azure Blob 儲存體複製到 SQL Database
適用於:Azure Data Factory Azure Synapse Analytics
提示
試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用!
在這個教學課程中,您會使用 Azure 入口網站來建立資料處理站。 接著,您會使用複製資料工具來建立管線,以將資料從 Azure Blob 儲存體複製到 SQL Database。
注意
如果您不熟悉 Azure Data Factory,請參閱 Azure Data Factory 簡介。
在本教學課程中,您會執行下列步驟:
- 建立資料處理站。
- 使用複製資料工具建立管線。
- 監視管線和活動執行。
必要條件
- Azure 訂用帳戶:如果您沒有 Azure 訂用帳戶,請在開始前建立免費帳戶。
- Azure 儲存體帳戶:使用 Blob 儲存體作為來源資料存放區。 如果您沒有 Azure 儲存體帳戶,請參閱建立儲存體帳戶中的指示。
- Azure SQL Database:使用 SQL Database 作為接收資料存放區。 如果您沒有 SQL Database,請參閱建立 SQL Database 中的指示。
準備 SQL 資料庫
允許 Azure 服務存取 Azure SQL Database 的邏輯 SQL Server。
確認已為執行 SQL Database 的伺服器啟用 [允許 Azure 服務和資源存取此伺服器] 設定。 此設定可讓 Data Factory 將資料寫入您的資料庫執行個體。 若要確認並開啟此設定,請移至邏輯 SQL Server>[安全性]>[防火牆與虛擬網路]>將 [允許 Azure 服務和資源存取此伺服器] 選項設定為 [開啟]。
注意
[允許 Azure 服務和資源存取此伺服器] 選項允許從任何 Azure 資源 (而不僅僅是訂用帳戶中的資源) 透過網路存取您的 SQL Server。 它可能不適用於所有環境,但適用於此有限的教學課程。 如需詳細資訊,請參閱 Azure SQL Server 防火牆規則。 相反地,您可以使用私人端點來連線到 Azure PaaS 服務,而不需使用公用 IP。
建立 Blob 和 SQL 資料表
請執行下列步驟,為本教學課程準備 Blob 儲存體和您的 SQL Database。
建立來源 Blob
啟動 [記事本]。 複製下列文字,並將其儲存在磁碟上名為 inputEmp.txt 的檔案:
FirstName|LastName John|Doe Jane|Doe
建立名為 adfv2tutorial 的容器,並將 inputEmp.txt 檔案上傳至該容器。 您可以使用 Azure 入口網站或各種工具來執行這些工作,例如 Azure 儲存體總管。
建立接收 SQL 資料表
使用以下 SQL 指令碼,在您的 SQL Database 中建立名為
dbo.emp
的資料表:CREATE TABLE dbo.emp ( ID int IDENTITY(1,1) NOT NULL, FirstName varchar(50), LastName varchar(50) ) GO CREATE CLUSTERED INDEX IX_emp_ID ON dbo.emp (ID);
建立資料處理站
在左側功能表上,選取 [建立資源]>[整合]>[Data Factory]:
在 [新增資料處理站] 頁面的 [名稱] 下,輸入 ADFTutorialDataFactory。
資料處理站的名稱必須是「全域唯一」的名稱。 您可能會收到下列錯誤訊息:
如果您收到有關名稱值的錯誤訊息,請輸入不同的資料處理站名稱。 例如,使用您的名稱ADFTutorialDataFactory。 如需 Data Factory 成品的命名規則,請參閱 Data Factory 命名規則。
選取要在其中建立新資料處理站的 Azure 訂用帳戶。
針對 [資源群組],採取下列其中一個步驟︰
a. 選取 [使用現有的] ,然後從下拉式清單選取現有的資源群組。
b. 選取 [建立新的] ,然後輸入資源群組的名稱。
若要了解資源群組,請參閱使用資源群組管理您的 Azure 資源。
在 [版本] 下,選取 [V2] 作為版本。
在 [位置] 下,選取資料處理站的位置。 只有受支援的位置會顯示在下拉式清單中。 資料處理站所使用的資料存放區 (例如 Azure 儲存體和 SQL Database) 和計算 (例如 Azure HDInsight) 可位於其他地區和區域。
選取 建立。
建立完成後,隨即會顯示 Data Factory 首頁。
若要在個別索引標籤中啟動 Azure Data Factory 使用者介面 (UI),請在 [開啟Azure Data Factory Studio] 圖格上選取 [開啟]。
使用複製資料工具建立管線
在 Azure Data Factory 的首頁上,選取 [內嵌] 圖格以啟動 [複製資料] 工具。
在 [資料複製] 工具的 [屬性] 頁面上,選擇 [工作型別] 底下的 [內建複製工作],然後選取 [下一步]。
在 [來源資料存放區] 頁面上,完成下列步驟:
a. 選取 [+ 建立新連線] 以新增連線。
b. 從資源庫選取 [Azure Blob 儲存體],然後選取 [繼續]。
c. 在 [新連線 (Azure Blob 儲存體)] 頁面上,從 [Azure 訂用帳戶] 清單中選取您的 Azure 訂用帳戶,並從 [儲存體帳戶名稱] 清單選取您的儲存體帳戶。 測試 [連線],然後選取 [建立]。
d. 在 [連線] 區塊中選取新建立的連結服務作為來源。
e. 在 [檔案或資料夾] 區段中,選取 [瀏覽] 以瀏覽至 adfv2tutorial 資料夾,選取 inputEmp.txt 檔案,然後按一下 [確定]。
f. 選取 [下一步] 移至下一個步驟。
在 [檔案格式設定] 頁面上,啟用 [第一個資料列作為標題] 的核取方塊。 請注意,此工具會自動偵測資料行和資料列分隔符號,並且您可以選取此頁面上的 [預覽資料] 按鈕來預覽資料並檢視輸入資料的結構描述。 然後選取下一步。
在 [目的地資料存放區] 頁面上,完成下列步驟:
a. 選取 [+ 建立新連線] 以新增連線。
b. 從資源庫選取 [Azure SQL Database],然後選取 [繼續]。
c. 在 [新連線 (Azure SQL Database)] 頁面上,從下拉式清單選取您的 Azure 訂用帳戶、伺服器名稱和資料庫名稱。 然後在 [驗證類型] 下選取 [SQL 驗證],指定使用者名稱和密碼。 測試連線,然後選取 [建立]。
d. 選取新建立的連結服務作為接收端,然後選取 [下一步]。
在 [目的地資料存放區] 頁面上,選取 [使用現有的資料表],然後選取
dbo.emp
資料表。 然後選取下一步。在 [資料行對應] 頁面上,請注意系統會將輸入檔案中的第二個和第三個資料行對應至 emp 資料表的 FirstName 和 LastName 資料行。 調整對應以確保不會發生錯誤,然後選取 [下一步]。
在 [設定] 頁面上的 [工作名稱] 下方,輸入CopyFromBlobToSqlPipeline,然後選取 [下一步]。
在 [摘要] 頁面上檢閱設定,然後選取 [下一步]。
在 [部署] 頁面上,選取 [監視] 以監視管線 (工作)。
在管線執行頁面上,選取 [重新整理] 以重新整理清單。 選取 [管線名稱] 下的連結,以檢視活動執行詳細資料或重新執行管線。
在 [活動執行] 頁面上,選取 [活動名稱] 資料行下的 [詳細資料] 連結 (眼鏡圖示),取得複製作業的詳細資料。 若要回到 [管線執行] 檢視,選取階層連結功能表中的 [所有管線執行] 連結。 若要重新整理檢視,請選取 [重新整理]。
確認資料已插入 SQL Database 中的 dbo.emp 資料表。
選取左側的 [作者] 索引標籤以切換至編輯器模式。 您可以使用編輯器更新透過此工具建立的連結服務、資料集和管線。 如需在 Data Factory 使用者介面中編輯這些實體的詳細資訊,請參閱本教學課程的 Azure 入口網站版本。
相關內容
在此範例中,管線會將資料從 Blob 儲存體複製到SQL Database。 您已了解如何︰
- 建立資料處理站。
- 使用複製資料工具建立管線。
- 監視管線和活動執行。
若要了解如何將資料從內部部署複製到雲端,請進入下列教學課程: