Auf Englisch lesen

Freigeben über


Daten mit Azure Synapse Link for Dataverse Daten mit Apache Spark transformieren

Verwenden Sie die Azure Synapse Link um Ihre Microsoft Dataverse Daten mit Azure Synapse Analytics zu verbinden, um Ihre Daten zu untersuchen und die Zeit bis zur Erkenntnis zu verkürzen. Dieser Artikel zeigt Ihnen, wie Sie Ihre Dataverse-Daten mithilfe dem Apache Spark Modul, das in Ihrem Synapse-Arbeitsbereich verfügbar ist, transformieren.

Hinweis

Azure Synapse Link for Microsoft Dataverse war früher als „In Data Lake exportieren“ bekannt. Der Dienst wurde mit Wirkung zum Mai 2021 umbenannt und exportiert weiterhin Daten nach Azure Data Lake sowie Azure Synapse Analytics.

Anforderungen

In diesem Abschnitt werden die Voraussetzungen beschrieben, die für den Zugriff auf Dataverse-Optionen mit Apache Spark erforderlich sind, nachdem Sie den Azure Synapse Link for Dataverse-Service verwendet haben.

  • Azure Synapse Link for Dataverse. In dieser Anleitung wird davon ausgegangen, dass Sie bereits Daten aus Dataverse mithilfe von Azure Synapse Link for Dataverse exportiert haben.

  • Speicherkonto Zugang. Sie müssen die folgenden Rollen für das Speicherkonto haben: Storage-Blob-Datenleser, Storage-Blob-Datenmitwirkender oder Storage-Blob-Datenbesitzer.

  • Synapse-Administrator. Sie müssen den Synapse Administrator-Rollenzugriff innerhalb von Synapse Studio haben.

Transformieren Sie Ihre Daten mit einem Apache Spark Notebook

  1. Wählen Sie in Power Apps Ihren gewünschten Azure Synapse Link aus der Liste und dann Zu Azure Synapse workspace wechseln.

    Zum Arbeitsbereich wechseln

  2. Erweitern Sie Ihre Datenbanken und wählen Sie Ihren Dataverse-Container. Ihre exportierten Tabellen werden im Verzeichnis Tabellen in der linken Seitenleiste angezeigt.

    Tabellen in Synapse finden

  3. Klicken Sie mit der rechten Maustaste auf die gewünschte Tabelle, und wählen Sie Neues Notebook > In DataFrame laden aus.

    In DataFrame laden

  4. Fügen Sie das Notebook an einen Apache Spark Pool an, indem Sie einen Pool aus dem Dropdownmenü auswählen. Wenn Ihnen kein Apache Spark-Pool zur Verfügung steht, wählen Sie Pools verwalten aus, um einen zu erstellen.

    Spark-Pool anfügen

  5. Fügen Sie Codezellen hinzu, um Ihre Daten zu transformieren. Führen Sie einzelne Zellen aus, indem Sie die Wiedergabeschaltfläche links neben jeder Zelle auswählen, oder führen Sie alle Zellen nacheinander aus, indem Sie aus der oberen Leiste Alle ausführen auswählen.

    Spark-Notebook

Siehe auch

Blog: Ankündigung von Azure Synapse Link for Dataverse

Was ist Apache Spark in Azure HDInsight

Hinweis

Können Sie uns Ihre Präferenzen für die Dokumentationssprache mitteilen? Nehmen Sie an einer kurzen Umfrage teil. (Beachten Sie, dass diese Umfrage auf Englisch ist.)

Die Umfrage dauert etwa sieben Minuten. Es werden keine personenbezogenen Daten erhoben. (Datenschutzbestimmungen).