Criar uma área de trabalho do Synapse

Neste tutorial, irá aprender a criar uma área de trabalho do Synapse, um conjunto de SQL dedicado e um conjunto do Apache Spark sem servidor.

Pré-requisitos

Para concluir os passos deste tutorial, tem de ter acesso a um grupo de recursos para o qual lhe foi atribuída a função proprietário . Crie a área de trabalho do Synapse neste grupo de recursos.

Criar uma área de trabalho do Synapse no portal do Azure

Iniciar o processo

  1. Abra o portal do Azure, na barra de pesquisa, introduza Synapse sem bater em Enter.
  2. Nos resultados da pesquisa, em Serviços, selecione Azure Synapse Analytics.
  3. Selecione Criar para criar uma área de trabalho.

Detalhes do Projeto do separador > Noções Básicas

Preencha os seguintes campos:

  1. Subscrição – escolha qualquer subscrição.
  2. Grupo de recursos – utilize qualquer grupo de recursos.
  3. Grupo de Recursos Geridos – deixe isto em branco.

Detalhes da área de trabalho do separador > Noções básicas

Preencha os seguintes campos:

  1. Nome da área de trabalho – escolha qualquer nome globalmente exclusivo. Neste tutorial, vamos utilizar a minha área de trabalho.
  2. Região – escolha a região onde colocou as suas aplicações/serviços cliente (por exemplo, VM do Azure, Power BI, Azure Analysis Service) e armazenamentos que contenham dados (por exemplo, armazenamento analítico do Azure Data Lake, armazenamento analítico do Azure Cosmos DB).

Nota

Uma área de trabalho que não esteja co-localizada com as aplicações cliente ou o armazenamento pode ser a causa principal de muitos problemas de desempenho. Se os seus dados ou os clientes forem colocados em várias regiões, pode criar áreas de trabalho separadas em diferentes regiões co-localizadas com os seus dados e clientes.

Em Selecionar Data Lake Storage Gen2:

  1. Por Nome da conta, selecione Criar Novo e dê um nome à nova conta de armazenamento contosolake ou semelhante ao nome tem de ser exclusivo.
  2. Por Nome do sistema de ficheiros, selecione Criar Novo e dê-lhe um nome de utilizador. Isto irá criar um contentor de armazenamento chamado utilizadores. A área de trabalho utilizará esta conta de armazenamento como a conta de armazenamento "primária" para tabelas do Spark e registos de aplicações do Spark.
  3. Selecione a caixa "Atribuir-me a função Contribuidor de Dados de Blobs de Armazenamento na conta Data Lake Storage Gen2".

Concluir o processo

Selecione Rever + criar>Criar. A área de trabalho está pronta dentro de alguns minutos.

Nota

Para ativar as funcionalidades da área de trabalho a partir de um conjunto de SQL dedicado existente (anteriormente SQL DW), veja Como ativar uma área de trabalho para o conjunto de SQL dedicado (anteriormente SQL DW).

Abrir Synapse Studio

Após a criação da área de trabalho Azure Synapse, tem duas formas de abrir Synapse Studio:

  1. Abra a área de trabalho do Synapse no portal do Azure, na secção Descrição geral da área de trabalho do Synapse, selecione Abrir na caixa Abrir Synapse Studio.

  2. Aceda ao https://web.azuresynapse.net e inicie sessão na sua área de trabalho.

    Iniciar sessão na área de trabalho

Nota

Para iniciar sessão na área de trabalho, existem dois métodos de seleção de Conta. Uma é da subscrição do Azure, a outra é de Enter manualmente. Se tiver a função do Azure do Synapse ou funções do Azure de nível superior, pode utilizar ambos os métodos para iniciar sessão na área de trabalho. Se não tiver as funções do Azure relacionadas e lhe tiver sido concedida a função RBAC do Synapse, Enter manualmente é a única forma de iniciar sessão na área de trabalho. Para saber mais sobre o RBAC do Synapse, veja O que é o controlo de acesso baseado em funções (RBAC) do Synapse.

Colocar dados de exemplo na conta de armazenamento primária

Vamos utilizar um pequeno conjunto de dados de exemplo de linha de 100 000 linhas de dados de Táxis de NYC para muitos exemplos neste guia de introdução. Começamos por colocá-la na conta de armazenamento primária que criou para a área de trabalho.

  • Transfira o conjunto de dados Táxi nyc - viagem verde para o seu computador. Navegue para a localização do conjunto de dados original a partir da ligação acima, escolha um ano específico e transfira os registos de viagem de táxi Verde no formato Parquet.
  • Mude o nome do ficheiro transferido para NYCTripSmall.parquet.
  • No Synapse Studio, navegue para o Data Hub.
  • Selecione Ligado.
  • Na categoria Azure Data Lake Storage Gen2 verá um item com um nome como myworkspace (Primary - contosolake ).
  • Selecione o contentor denominado utilizadores (Primário).
  • Selecione Carregar e selecione o NYCTripSmall.parquet ficheiro que transferiu.

Assim que o ficheiro parquet for carregado, estará disponível através de dois URIs equivalentes:

  • https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet
  • abfss://users@contosolake.dfs.core.windows.net/NYCTripSmall.parquet

Nos exemplos que se seguem neste tutorial, certifique-se de que substitui contosolake na IU pelo nome da conta de armazenamento primária que selecionou para a área de trabalho.

Passos seguintes