Compartilhar via


Importar e consultar dados usando o Suplemento do Excel do Azure Databricks

Importante

Esse recurso está em Visualização Pública.

O Suplemento do Azure Databricks Excel conecta seu workspace do Azure Databricks ao Microsoft Excel, trazendo dados do Lakehouse controlados diretamente para suas planilhas para ajudá-lo a migrar de dados para decisões mais rapidamente.

Esta página descreve como usar o Suplemento do Excel do Azure Databricks para importar e analisar dados do Azure Databricks no Excel. Você pode navegar e importar tabelas do Azure Databricks por meio de uma interface intuitiva em que nenhum conhecimento do SQL é necessário. Embora o suplemento ofereça flexibilidade para executar consultas SQL personalizadas, ele é opcional.

Pré-requisitos

Antes de usar o Suplemento do Excel, verifique se você o configurou.

Selecionar um sql warehouse

Escolha qual sql warehouse usar:

  1. No canto superior direito do painel suplemento do Azure Databricks no Excel, clique no menu suspenso.
  2. Selecione qual sql warehouse você deseja usar.

Importar dados do Azure Databricks

Importe dados do Azure Databricks no Excel selecionando uma tabela, escrevendo uma consulta SQL ou importando uma tabela dinâmica.

Observação

Você pode importar exibições de métrica do Catálogo do Unity usando tabelas dinâmicas, consultas SQL e funções personalizadas.

Criar tabelas dinâmicas

Para criar uma tabela dinâmica a partir de tabelas e exibições do Catálogo do Unity no Excel:

  1. No painel Suplemento do Excel do Azure Databricks, na guia Nova importação, selecione Selecionar dados como o método de importação.

  2. Em Catálogo, selecione a tabela na qual você deseja criar uma tabela dinâmica e clique em Selecionar.

  3. Marque a caixa de seleção Dados Dinâmicos .

  4. Configure sua linha, coluna, valor e filtros conforme necessário.

  5. (Opcional) Para ver um exemplo da importação, clique em Visualizar.

  6. (Opcional) Defina um limite de linha para sua importação.

  7. Importe seus resultados. Escolha uma destas opções:

    • Clique em Salvar e importar para salvar a consulta para reutilização na pasta de trabalho do Excel e importar os resultados.
    • Clique na seta para baixo e clique em Importar resultados para importar os resultados sem salvar a consulta. Use essa opção quando quiser continuar editando uma importação.

    Observação

    Tabelas dinâmicas só podem ser importadas para uma nova planilha.

Ao trabalhar com métricas do Catálogo do Unity em tabelas de pivot, você pode ver Sum(measure) exibidas nos resultados. Esse é o comportamento esperado e nenhuma agregação adicional ocorre. O Excel exige que os valores tenham uma função de agregação, mas como os dados contêm valores exclusivos, nenhuma agregação ocorre.

Selecionar tabelas

Os dados são importados como um objeto de tabela do Excel. Você pode mover a tabela ou renomear a planilha e o Suplemento do Excel atualiza os dados no novo local.

Para importar dados de uma tabela do Azure Databricks, faça o seguinte:

  1. No painel Suplemento do Excel do Azure Databricks, na guia Nova importação, selecione Selecionar dados como o método de importação.
  2. Escolha uma tabela para importar do Gerenciador de Catálogos. Você pode filtrar o catálogo por proprietário, status de certificação e outras propriedades usando o ícone Controles Deslizantes.
  3. Clique em Selecionar.
  4. Em Colunas, clique na seta para baixo e desmarque as colunas que você não deseja importar ou deixe todas as colunas selecionadas para importar a tabela inteira.
  5. (Opcional) Para definir filtros, clique + ao lado de Filtros, selecione a coluna à qual você deseja aplicar um filtro e, em seguida, insira sua condição de filtro.
  6. (Opcional) Para ver um exemplo da importação, clique em Visualizar.
  7. (Opcional) Você pode definir um limite de linha para restringir o número de linhas importadas.
  8. (Opcional) Para identificar facilmente seus dados importados, você pode inserir um nome de importação.
  9. Em Destino de Saída, escolha importar os dados para uma nova planilha ou a planilha atual. Se você importar para a planilha atual, os dados serão iniciados na referência da célula inserida (por padrão, A1).
  10. Importe seus resultados. Escolha uma destas opções:
    • Clique em Salvar e importar para salvar a consulta para reutilização na pasta de trabalho do Excel e importar os resultados.
    • Clique na seta para baixo e clique em Importar resultados para importar os resultados sem salvar a consulta. Use essa opção quando quiser continuar editando uma importação.

Gravar consultas SQL

O método de importação Write SQL dá suporte a funções SQL e procedimentos armazenados.

Para executar consultas SQL personalizadas no workspace do Azure Databricks, faça o seguinte:

  1. No painel do suplemento do Excel do Azure Databricks, na guia Nova importação, selecione Escrever SQL como o método de importação.

  2. Insira um nome para sua consulta para identificá-la mais tarde.

  3. Escreva uma nova consulta ou use uma consulta existente do workspace do Azure Databricks.

    • Escreva sua consulta SQL no editor. Você pode consultar qualquer tabela no Catálogo do Unity que tenha permissões para acessar.

      • Clique no ícone Dados. Gerenciador de catálogos para exibir seus esquemas e tabelas.
    • Para usar uma consulta do workspace do Azure Databricks ou de uma consulta existente no Excel, clique no ícone de pasta. na pasta. Se você usar uma consulta existente do workspace do Azure Databricks, as edições feitas no Excel não serão refletidas no Azure Databricks.

      Observação

      As consultas devem ser salvas explicitamente no Azure Databricks usando o botão Salvar no editor de consultas antes de aparecerem no Excel.

  4. (Opcional) Para adicionar parâmetros de consulta, clique em +Adicionar ao lado de Parâmetros. Clique no parâmetro para especificar o nome do parâmetro e o valor do parâmetro.

  5. Em Destino de Saída, escolha importar os dados para uma nova planilha ou a planilha atual. Se você importar para a planilha atual, os dados serão iniciados na referência da célula inserida (por padrão, A1).

  6. Para visualizar os resultados da consulta, clique em Executar.

  7. Importe seus resultados. Escolha uma destas opções:

    • Clique em Salvar e importar para salvar a consulta para reutilização na pasta de trabalho do Excel e importar os resultados.
    • Clique na seta para baixo e clique em Importar resultados para importar os resultados sem salvar a consulta. Use essa opção quando quiser continuar editando uma importação.

Você também pode usar funções personalizadas para adicionar parâmetros de consulta. Consulte Escrever SQL.

Usar funções personalizadas no Excel

O Suplemento do Excel fornece funções personalizadas que você pode usar em fórmulas do Excel para importar dados do Azure Databricks.

Selecionar uma tabela

A DATABRICKS.Table função importa dados de uma tabela do Catálogo do Unity.

Sintaxe:

=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])

Parâmetros:

  • catalog_name.schema_name.table_name (obrigatório): o nome totalmente qualificado da tabela.
  • columns (opcional): uma matriz de nomes de colunas para importação. Omita esse parâmetro para importar todas as colunas.
  • limit (opcional): o número máximo de linhas a serem importadas. Omita esse parâmetro para importar todas as linhas, até o limite de 10 MB.

Exemplo:

=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)

Essa fórmula importa as colunas customer_id e customer_name da tabela main.default.customers, limitadas a 100 linhas.

Escrever SQL

A DATABRICKS.SQL função executa uma consulta SQL que usa parâmetros de consulta e retorna os resultados.

Sintaxe:

Especifique parâmetros usando valores.

=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})

Especifique parâmetros usando um intervalo de células. Os parâmetros de nome e valor devem ser definidos em células que estão na mesma linha.

=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})

Parâmetros:

  • query_text (obrigatório): a consulta SQL a ser executada.
  • parameters (obrigatório): um mapeamento de valores de parâmetro para substituir na consulta.

Exemplo:

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)

Esta fórmula realiza uma consulta que filtra os dados de vendas por longitude e latitude, usando os valores de parâmetro fornecidos.

Gerenciar consultas

Gerencie suas importações existentes da página Importações.

Editar uma importação existente

Para editar uma importação existente:

  1. No painel Suplemento do Azure Databricks no Excel, clique na guia Importações .
  2. Localize a importação que você deseja editar.
  3. Clique no menu de três pontos ao lado da importação.
  4. Clique em Editar para editar sua importação.

Atualizar dados

O Suplemento do Excel não atualiza automaticamente os dados importados. Para atualizar seus dados com os valores mais recentes do Azure Databricks:

  • Para atualizar uma única importação, faça o seguinte:
    1. No painel Suplemento do Azure Databricks no Excel, clique na guia Importações .
    2. Clique no ícone Atualizar. Atualize ao lado da importação que você deseja atualizar.
  • Para atualizar todas as importações, faça o seguinte:
    1. Clique em Atualizar Tudo no painel do complemento Azure Databricks.

O Suplemento executa a consulta original ou a seleção de tabela novamente e atualiza sua planilha com dados novos.

Importante

Ao atualizar dados, o Suplemento do Excel limpa todos os dados existentes na tabela especificada e recarrega os dados mais recentes do Azure Databricks. Todas as colunas personalizadas adicionadas à tabela são excluídas durante o processo de atualização.

Implicações de compartilhamento

Ao compartilhar uma pasta de trabalho do Excel que contém dados do Azure Databricks, considere as seguintes implicações de acesso a dados e segurança:

Visibilidade dos dados importados

Quando um destinatário atualiza uma importação, o Suplemento usa as permissões do Catálogo do Unity do destinatário. Se eles não tiverem acesso aos dados subjacentes, a atualização falhará.

Para pastas de trabalho em que a privacidade de dados é uma preocupação, você pode usar a seguinte solução alternativa:

  1. Crie uma pasta de trabalho que contenha todas as fórmulas e importações necessárias.
  2. Exclua os dados importados da planilha.
  3. Compartilhe a pasta de trabalho com o destinatário.
  4. Fazer com que o destinatário atualize os dados.

O destinatário vê apenas os dados aos quais tem acesso com base em suas permissões do Catálogo do Unity.

Acesso a espaços de trabalho e ativos de dados

  • Os usuários sem acesso aos objetos do Catálogo do Unity referenciados na pasta de trabalho não podem atualizar os dados. Para atualizar dados, os usuários devem ter permissões de leitura nas tabelas e exibições subjacentes no Catálogo do Unity.
  • Os usuários devem ter acesso à tabela subjacente no Azure Databricks para editar importações existentes.

Visibilidade da consulta

Os usuários com acesso de edição à pasta de trabalho podem exibir as consultas usadas para gerar os dados por meio do Suplemento do Azure Databricks, mesmo que não tenham acesso aos dados subjacentes no Catálogo do Unity.

Limitações

  • Funções personalizadas: para funções personalizadas, os resultados da consulta são limitados a 25 MiB devido a limitações da API de execução do SQL.
  • Carregamento de dados: o carregamento de dados poderá falhar se qualquer célula na pasta de trabalho estiver no modo de edição.
  • Limite de linha da Área de Trabalho do Excel: a Área de Trabalho do Excel dá suporte a um máximo de 1.048.576 linhas por planilha.
  • Excel para o limite de tamanho do arquivo Web: o Excel para a Web dá suporte a um tamanho máximo de arquivo de pasta de trabalho de aproximadamente 25 MB para exibição e edição.