Partager via


Transformer les données Azure Synapse Link for Dataverse avec Apache Spark

Vous pouvez utiliser Azure Synapse Link pour connecter vos données Microsoft Dataverse à Azure Synapse Analytics pour explorer vos données et accélérer le délai d’obtention d’informations. Cet article vous montre comment transformer vos données Dataverse à l’aide du moteur Apache Spark disponible dans votre espace de travail Synapse.

Notes

Azure Synapse Link for Microsoft Dataverse était auparavant connu sous le nom de Exporter vers le lac de données. Ce service a été renommé en mai 2021 et continuera d’exporter des données vers Azure Data Lake ainsi que vers Azure Synapse Analytics.

Conditions préalables

Cette section décrit les conditions préalables nécessaires pour transformer les données Dataverse avec Apache Spark après avoir utilisé le service Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. Ce guide suppose que vous avez déjà exporté des données Dataverse en utilisant Azure Synapse Link for Dataverse.

  • Accès au compte de stockage. Vous devez disposer de l’un des suivants pour le compte de stockage : Lecteur de données d’objets Blob de stockage, Contributeur des données d’objets Blob de stockage ou Propriétaire des données d’objets Blob de stockage.

  • Administrateur Synapse. Vous devez obtenir le rôle d’accès Administrateur Synapse dans Synapse Studio.

Transformer vos données avec un notebook Apache Spark

  1. Dans Power Apps, sélectionnez votre Azure Synapse Link dans la liste, puis sélectionnez Accéder à Azure Synapse workspace.

    Accéder à l’espace de travail.

  2. Développer Bases de données, sélectionnez votre conteneur Dataverse. Vos tables exportées sont affichées sous le répertoire Tables dans la barre latérale gauche.

    Trouver des tables dans Synapse.

  3. Cliquez avec le bouton droit sur la table souhaitée et sélectionnez Nouveau notebook > Charger dans DataFrame.

    Charger dans DataFrame.

  4. Attachez le notebook à un pool Apache Spark en sélectionnant un pool dans le menu déroulant. Si vous n’avez pas de pool Apache Spark, sélectionnez Gérer les pools pour en créer un.

    Attacher un pool Spark.

  5. Ajoutez des cellules de code pour transformer vos données. Exécutez des cellules individuelles en sélectionnant le bouton de lecture à gauche de chaque cellule ou exécutez toutes les cellules successivement en sélectionnant Exécuter tout dans la barre supérieure.

    Notebook Spark.

Voir aussi

Blog : Annonce d’Azure Synapse Link for Dataverse

Qu’est-ce que Apache Spark dans Azure HDInsight ?

Notes

Pouvez-vous nous indiquer vos préférences de langue pour la documentation ? Répondez à un court questionnaire. (veuillez noter que ce questionnaire est en anglais)

Le questionnaire vous prendra environ sept minutes. Aucune donnée personnelle n’est collectée (déclaration de confidentialité).