Azure Synapse Link for Dataverse-gegevens transformeren met Apache Spark

Gebruik Azure Synapse Link om uw Microsoft Dataverse-gegevens te verbinden met Azure Synapse Analytics om uw gegevens te verkennen en sneller inzicht te krijgen. Dit artikel laat zien hoe u uw Dataverse-gegevens transformeert met behulp van de Apache Spark-engine die beschikbaar is in uw Synapse-werkruimte.

Notitie

Azure Synapse Link for Microsoft Dataverse werd voorheen Exporteren naar data lake genoemd. De service is met ingang van mei 2021 hernoemd en gaat door met het exporteren van gegevens naar Azure Data Lake en Azure Synapse Analytics.

Vereisten

In dit gedeelte worden de vereisten beschreven die nodig zijn om Dataverse-gegevens met Apache Spark te transformeren na gebruik van de Azure Synapse Link for Dataverse-service.

  • Azure Synapse Link for Dataverse. In deze handleiding wordt ervan uitgegaan dat u al gegevens uit Dataverse hebt geëxporteerd met behulp van Azure Synapse Link for Dataverse.

  • Toegang tot opslagaccount. Voor het opslagaccount moet aan u een van deze rollen zijn verleend: Opslag-blob-gegevenslezer, Inzender van opslag-blob-gegevens of Eigenaar van opslag-blob-gegevens.

  • Synapse-beheerder. U moet de rol Synapse-beheerder krijgen binnen Synapse Studio.

Uw gegevens met een Apache Spark-notebook transformeren

  1. Selecteer in Power Apps uw gewenste Azure Synapse Link in de lijst en selecteer vervolgens Ga naar Azure Synapse workspace.

    Ga naar werkruimte.

  2. Vouw Databases uit, selecteer uw Dataverse-container. Uw geëxporteerde tabellen worden weergegeven onder de map Tabellen in de linkerzijbalk.

    Tabellen zoeken in Synapse.

  3. Klik met de rechtermuisknop op de gewenste tabel en selecteer Nieuw notitieblok > Laden naar DataFrame.

    Laden naar DataFrame.

  4. Koppel het notebook aan een Apache Spark-pool door een pool te selecteren in het vervolgkeuzemenu. Als u geen Apache Spark-pool hebt, selecteert u Pools beheren om er een te maken.

    Spark-pool koppelen.

  5. Voeg codecellen toe om uw gegevens te transformeren. Voer afzonderlijke cellen uit door de afspeelknop links van elke cel te selecteren of voer alle cellen na elkaar uit door Alles uitvoeren te selecteren op de bovenste balk.

    Spark-notitieblok.

Zie ook

Blog: Aankondiging van Azure Synapse Link for Dataverse

Wat is Apache Spark in Azure HDInsight > [!NOTE] >Laat ons uw taalvoorkeuren voor documentatie weten! Beantwoord een korte enquête. (houd er rekening mee dat deze in het Engels is) > >De enquête duurt ongeveer zeven minuten. Er worden geen persoonlijke gegevens verzameld (privacyverklaring).?