Transformace dat Azure Synapse Link for Dataverse pomocí Apache Spark

Použijte Azure Synapse Link k připojení vašich dat Microsoft Dataverse k Azure Synapse Analytics za účelem prozkoumání vašich dat a urychlení času na získání statistik. Tento článek ukazuje, jak transformovat data Dataverse pomocí modulu Apache Spark, který je dostupný ve vašem pracovním prostoru Synapse.

Poznámka

Azure Synapse Link for Microsoft Dataverse byl dříve známý jako Export do datového jezera. Služba byla s účinností od května 2021 přejmenována a bude i nadále exportovat data do Azure Data Lake a také do Azure Synapse Analytics.

Předpoklady

Tato část popisuje požadavky nezbytné pro transformaci dat Dataverse pomocí Apache Spark po použití služby Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. Tento průvodce předpokládá, že jste již exportovali data z Dataverse pomocí Azure Synapse Link for Dataverse.

  • Přístup k účtu úložiště. Pro účet úložiště musí být přidělena jedna z následujících rolí: Čtenář dat v objektech blob služby Storage Přispěvatel dat v objektech blob služby Storage nebo Vlastník dat v objektech blob služby Storage.

  • Správce Synapse. Musíte mít přidělenu roli Správce Synapse v rámci studia Synapse.

Transformujte svá data pomocí notebooku Apache Spark

  1. V Power Apps vyberte požadované propojení Azure Synapse Link ze seznamu a poté vyberte příkaz Přejít do Azure Synapse workspace.

    Přejít do pracovního prostoru.

  2. Rozbalte Databáze, vyberte kontejner Dataverse. Exportované tabulky se zobrazí v adresáři Tabulky adresář na levém postranním panelu.

    Vyhledání tabulek v Synapse.

  3. Klikněte pravým tlačítkem na požadovanou tabulku a vyberte Nový notebook > Načíst do DataFrame.

    Načíst do DataFrame.

  4. Připojte notebook k fondu Apache Spark výběrem fondu z rozevírací nabídky. Pokud nemáte fond Apache Spark, vyberte Spravovat fondy k jeho vytvoření.

    Připojte fond Spark.

  5. Přidejte buňky kódu a transformujte data. Spusťte jednotlivé buňky výběrem tlačítka přehrávání vlevo od každé buňky nebo spusťte všechny buňky postupně výběrem Spustit vše z horního pruhu.

    Notebook Spark.

Viz také

Blog: Oznámení Azure Synapse Link for Dataverse

Co je Apache Spark v Azure HDInsight

Poznámka

Můžete nám sdělit, jaké máte jazykové preference pro dokumentaci? Zúčastněte se krátkého průzkumu. (upozorňujeme, že tento průzkum je v angličtině)

Průzkum bude trvat asi sedm minut. Nejsou shromažďovány žádné osobní údaje (prohlášení o zásadách ochrany osobních údajů).