Sdílet prostřednictvím


Transformace Azure Synapse Link pro Dataverse pomocí Apache Spark

Pomocí Azure Synapse Linku můžete propojit data Microsoft Dataverse s Azure Synapse Analytics a prozkoumat data a zrychlit čas na získání přehledu. Tento článek ukazuje, jak transformovat data Dataverse pomocí modulu Apache Spark, který je k dispozici v pracovním prostoru Synapse.

Poznámka:

Azure Synapse Link pro Microsoft Dataverse se dříve označoval jako Export do data lake. Služba byla přejmenována s účinností od května 2021 a bude i nadále exportovat data do Azure Data Lake i Azure Synapse Analytics.

Požadavky

Tato část popisuje požadavky potřebné k transformaci dat Dataverse pomocí Apache Sparku po použití azure Synapse Linku pro službu Dataverse.

  • Azure Synapse Link pro službu Dataverse V této příručce se předpokládá, že jste už exportovali data z Dataverse pomocí Azure Synapse Linku pro Dataverse.

  • Přístup k účtu úložiště Pro účet úložiště musíte mít udělenou jednu z následujících rolí: Čtenář dat objektů blob služby Storage, Přispěvatel dat objektů blob služby Storage nebo Vlastník dat objektů blob služby Storage.

  • Správce Synapse. Musíte mít udělený přístup k roli Synapse Administrator v Synapse Studio.

Transformace dat pomocí poznámkového bloku Apache Spark

  1. V Power Apps vyberte v seznamu požadovanou službu Azure Synapse Link a pak vyberte Přejít do pracovního prostoru Azure Synapse.

    Přejděte do pracovního prostoru.

  2. Rozbalte Databáze a vyberte kontejner Dataverse. Exportované tabulky se zobrazí v adresáři Tabulky na levém bočním panelu.

    Vyhledání tabulek ve službě Synapse

  3. Klikněte pravým tlačítkem na požadovanou tabulku a vyberte Nový poznámkový blok>Načíst do DataFrame.

    Načíst do DataFrame.

  4. Připojte notebook k fondu Apache Spark výběrem fondu z rozevírací nabídky. Pokud nemáte fond Apache Spark, vytvořte ho výběrem Spravovat fondy.

    Připojte fond Sparku.

  5. Přidejte buňky kódu pro transformaci dat. Jednotlivé buňky můžete spustit tak, že vyberete tlačítko přehrát vlevo od každé buňky nebo spustíte všechny buňky po sobě výběrem možnosti Spustit vše z horního panelu.

    Poznámkový blok Sparku

Viz také

Blog: Oznámení Azure Synapse Linku pro Dataverse

Co je Apache Spark ve službě Azure HDInsight