共用方式為


使用 Azure Data Factory 從 Microsoft 365 (Office 365) 載入資料

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用

此文章說明如何使用 Data Factory「將資料從 Microsoft 365 (Office 365) 載入至 Azure Blob 儲存體」。 您可以依照類似的步驟,將資料複製到 Azure Data Lake Gen1 或 Gen2。 請參閱 Microsoft 365 (Office 365) 連接器一文,了解通常會如何從 Microsoft 365 (Office 365) 複製資料。

建立資料處理站

  1. 若您尚未建立資料處理站,請遵循快速入門:使用 Azure 入口網站和 Azure Data Factory Studio 建立資料處理站中的步驟加以建立。 建立後,請瀏覽至 Azure 入口網站中的資料處理站。

    Azure Data Factory 的首頁,具有 [開啟 Azure Data Factory Studio] 圖格。

  2. 在 [開啟 Azure Data Factory Studio] 圖格上選取 [開啟],在不同的索引標籤中啟動資料整合應用程式。

建立新管線

  1. 在首頁上,選取 [協調]

    顯示ADF首頁的螢幕快照。

  2. 在管線的 [一般] 索引標籤中,輸入 "CopyPipeline" 作為管線的 [名稱]

  3. 在 [活動] 工具箱中 > [移動和轉換] 類別 > 將 [複製] 活動從工具箱中拖放到管線設計工具介面。 指定 "CopyFromOffice365ToBlob" 作為活動名稱。

注意

請在來源和接收連結服務中使用 Azure 整合執行階段。 不支援自我裝載整合執行階段和受控虛擬網路整合執行階段。

設定來源

  1. 前往管線 > [來源] 索引標籤,選取 [+ 新增] 以建立來源資料集。

  2. 在 [新增資料集] 視窗中,選取 [Microsoft 365 (Office 365)],然後選取 [繼續]

  3. 您現在位於 [複製活動組態] 索引標籤中。選取 Microsoft 365 (Office 365) 資料集旁的 [編輯] 按鈕,以繼續資料設定。

    設定 Microsoft 365 (Office 365) 數據集一般。

  4. 您會看到已為 Microsoft 365 (Office 365) 資料集開啟一個新的索引標籤。 在 [屬性] 視窗底部的 [一般] 索引標籤中,輸入 "SourceOffice365Dataset" 作為 [名稱]。

  5. 移至 [屬性] 視窗的 [連線] 索引標籤。 在 [已連結的服務] 文字方塊旁,選取 [+ 新增]

  6. 在 [新增已連結的服務] 視窗中,輸入 "Office365LinkedService" 作為名稱,輸入服務主體識別碼和服務主體金鑰,然後測試連線並選取 [建立] 來部署已連結的服務。

    新的Microsoft 365 (Office 365) 鏈接服務。

  7. 在連結服務建立後,您會回到資料集設定。 在 [資料表] 旁,選擇下拉式箭頭以展開可用的 Microsoft 365 (Office 365) 資料集清單,然後從下拉式清單中選擇 [BasicDataSet_v0.Message_v0]:

    Config Microsoft 365 (Office 365) 數據集數據表。

  8. 現在返回 [管線] > [來源] 索引標籤,繼續設定 Microsoft 365 (Office 365) 資料擷取的其他屬性。 使用者範圍和使用者範圍篩選是選擇性的述詞,您可以定義來限制您想要從 Microsoft 365 (Office 365) 擷取的資料。 如需如何設定這些設定的詳細資訊,請參閱 Microsoft 365 (Office 365) 資料集屬性一節。

  9. 您必須選擇其中一個日期篩選條件,並提供開始時間和結束時間值。

  10. 選取 [匯入結構描述] 索引標籤,以匯入訊息資料集的結構描述。

    Config Microsoft 365 (Office 365) 數據集架構。

設定接收

  1. 移至管線 > [接收] 索引標籤,然後選取 [+ 新增] 以建立接收資料集。

  2. 在 [新增資料集] 視窗中,請注意,從 Microsoft 365 (Office 365) 複製時,只會選取已支援的目的地。 選取 [Azure Blob 儲存體]、選取「二進位」格式,然後選取 [繼續]。 在此教學課程中,您會將 Microsoft 365 (Office 365) 資料複製到「Azure Blob 儲存體」中。

  3. 選取 Azure Blob 儲存體資料集旁的 [編輯] 按鈕以繼續資料設定。

  4. 在 [屬性] 視窗的 [一般] 索引標籤上,於 [名稱] 中輸入 "OutputBlobDataset"。

  5. 移至 [屬性] 視窗的 [連線] 索引標籤。 在 [已連結的服務] 文字方塊旁,選取 [+ 新增]

  6. 在 [新增已連結的服務] 視窗中,輸入 "AzureStorageLinkedService" 作為名稱,從驗證方法下拉式清單中選取 [服務主體],填入 [服務端點]、[租用戶]、[服務主體識別碼] 及 [服務主體金鑰],然後選取 [儲存] 來部署已連結的服務。 如需了解如何設定「Azure Blob 儲存體」的服務主體驗證,請參閱這裡

    新的 Blob 連結服務

驗證管線

若要驗證管線,請從工具列中選取 [驗證]

您也可以按一下右上方的 [程式碼],以查看與管線相關聯的 JSON 程式碼。

發佈管線

在頂端工具列中,選取 [全部發行]。 此動作會將您建立的實體 (資料集和管線) 發佈至 Data Factory。

發行變更

手動觸發管線

選取工具列上的 [新增觸發程序],然後選取 [立即觸發]。 在 [管線執行] 頁面上,選取 [完成]

監視管線

移至左側的 [監視] 索引標籤。 您會看到手動觸發程序所觸發的管線執行。 您可以使用 [動作] 資料行中的連結來檢視活動詳細資料,以及重新執行管線。

監視管線

若要查看與此管線執行相關聯的活動執行,請選取 [動作] 資料行中的 [檢視活動執行] 連結。 此範例中只有一個活動,因此您在清單中只會看到一個項目。 如需有關複製作業的詳細資料,請選取 [動作] 資料行中的 [詳細資料] 連結 (眼鏡圖示)。

監視活動

如果這是您第一次要求此內容 (結合了正在存取的資料資料表、正在載入資料的目的地帳戶,以及提出資料存取要求的使用者身分識別) 的資料,您將會看到複製活動狀態為「進行中」,而只有當您選取 [動作] 底下的 [詳細資料] 連結時,才會看到狀態為 RequesetingConsent。 資料存取核准者群組的成員必須先在 Privileged Access Management 中核准該要求,資料擷取才能繼續。

要求同意的狀態:活動執行詳細數據 - 要求同意

擷取資料時的狀態:

活動執行詳細數據 - 擷取數據

表示同意之後,資料擷取將會繼續進行,而在一些時間之後,管線執行就會顯示為已成功。

監視管線 - 成功

現在,請移至目的地「Azure Blob 儲存體」,並確認已經以二進位格式擷取 Microsoft 365 (Office 365) 資料。

前往下列文章,以了解 Azure Synapse Analytics 支援: