使用 Apache Spark 轉換 Azure Synapse Link for Dataverse 資料

您可以使用 Azure Synapse Link 將您的 Microsoft Dataverse 資料連線至 Azure Synapse Analytics,以探索您的資料並加快深入解析速度。 本文將介紹如何使用 Synapse 工作區中提供的 Apache Spark 引擎來轉換 Dataverse 資料。

注意

Azure Synapse Link for Microsoft Dataverse 先前被稱為匯出至資料湖。 服務的重新命名已在 2021 年 5 月生效,並將繼續匯出資料至 Azure Data Lake 以及 Azure Synapse Analytics。

先決條件

本節說明在使用 Azure Synapse Link for Dataverse 服務後,透過 Apache Spark 轉換 Dataverse 資料所需的先決條件。

  • Azure Synapse Link for Dataverse。 本指南假設您已經使用 Azure Synapse Link for Dataverse 將 Dataverse 資料匯出。

  • 儲存體帳戶存取。 您必須要在儲存體帳戶被授與下列角色負責人:、儲存體 Blob 資料讀者、儲存體 Blob 資料參與者或者儲存體 Blob 資料負責人。

  • Synapse 管理員。 您必須在 Synapse 工作室中獲得 Synapse 管理員角色存取權。

使用 Apache Spark 筆記本轉換您的資料

  1. 在 Power Apps 中,從清單選取您想要的 Azure Synapse Link,然後選取移至 Azure Synapse workspace

    移至工作區。

  2. 展開資料庫,選取您的 Dataverse 容器。 您所匯出的資料表會顯示在左側邊欄的資料表目錄下。

    在 Synapse 中尋找資料表。

  3. 在想要的表格上按一下滑鼠右鍵,然後選取新增筆記本 > 載入至 DataFrame

    載入 DataFrame。

  4. 從下拉式功能表中選取一個集區,將筆記本附加到 Apache Spark 集區中。 如果您沒有 Apache Spark 集區,請選取管理集區來建立一個。

    附加 Spark 集區。

  5. 新增程式碼儲存格以轉換您的資料。 選取每個儲存格左邊的播放按鈕,或從頂端欄選取全部執行,以執行個別儲存格。

    Spark 筆記本。

另請參閱

部落格:宣佈 Azure Synapse Link for Dataverse

什麼是 Azure HDInsight 中的 Apache Spark

注意

是否能請您告知您偏好的慣用文件語言? 請填寫問卷。 (請注意,本問卷為英文版)

完成問卷大約需要七分鐘。 本問卷將不會收集個人資料 (隱私權聲明)。