Transformar dados do Azure Synapse Link for Dataverse com o Apache Spark

Pode usar o Azure Synapse Link para ligar os seus dados do Microsoft Dataverse ao Azure Synapse Analytics para explorar os seus dados e acelerar o tempo até às informações. Este artigo mostra-lhe como transformar os seus dados do Dataverse usando o motor do Apache Spark disponível na sua área de trabalho do Synapse.

Nota

O Azure Synapse Link for Microsoft Dataverse era anteriormente conhecido como o serviço Exportar para data lake. O serviço foi renomeado a partir de maio de 2021 e continuará a exportar dados para o Azure Data Lake, bem como Azure Synapse Analytics.

Pré-requisitos

Esta secção descreve os pré-requisitos necessários para transformar dados do Dataverse com o Apache Spark após a utilização do serviço Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. Este guia assume que já exportou dados do Dataverse através do Azure Synapse Link for Dataverse.

  • Acesso à Conta de Armazenamento. É necessário ser-lhe concedida uma das seguintes funções para a conta de armazenamento: Leitor de Dados do Storage Blob, Contribuidor de Dados do Storage Blob ou Proprietário de Dados do Storage Blob.

  • Administrador de Synapse. Deve ser-lhe concedida a função Administrador Synapse dentro do estúdio Synapse.

Transformar os seus dados com um bloco de notas do Apache Spark

  1. Em Power Apps, selecione o desejado Azure Synapse Link da lista e, em seguida, selecione Ir para o Azure Synapse workspace.

    Aceder à área de trabalho.

  2. Expanda Bases de dados, selecione o seu contentor do Dataverse. As suas tabelas exportadas serão apresentadas sob o diretório Tabelas na barra lateral esquerda.

    Localizar tabelas no Synapse.

  3. Clique com o botão direito na tabela desejada e selecione Novo caderno > Carregar em DataFrame.

    Carregar em DataFrame.

  4. Anexe o caderno a um conjunto do Apache Spark selecionando um conjunto do menu pendente. Se não tiver um conjunto do Apache Spark, selecione Gerir conjuntos para criar um.

    Anexe a piscina Spark.

  5. Adicione células de código para transformar os seus dados. Executar as células individuais selecionando o botão de reprodução à esquerda de cada célula ou executar todas as células sucessivamente selecionando Executar tudo a partir da barra superior.

    Caderno de faíscas.

Consulte também

Blogue: Anúncio do Azure Synapse Link for Dataverse

O que é o Apache Spark no Azure HDInsight

Nota

Pode indicar-nos as suas preferências no que se refere ao idioma da documentação? Responda a um breve inquérito. (tenha em atenção que o inquérito está em inglês)

O inquérito irá demorar cerca de sete minutos. Não são recolhidos dados pessoais (declaração de privacidade).