Este artigo descreve como usar o Looker com um cluster do Azure Databricks ou SQL warehouse do Databricks (antigo ponto de extremidade SQL Databricks).
Importante
Quando as PDTs (tabelas derivadas persistentes) estão habilitadas, o Looker regenera por padrão as PDTs a cada 5 minutos conectando-se ao banco de dados associado. O Databricks recomenda que você altere a frequência padrão para evitar o excesso de custos de computação. Para obter mais informações, consulte Habilitar e gerenciar PDTs (tabelas derivadas persistentes).
Requisitos
Antes de se conectar ao Looker manualmente, você precisará do seguinte:
Um cluster ou SQL warehouse do workspace do Azure Databricks.
Como melhor prática de segurança, ao autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, o Databricks recomenda que você use tokens de acesso pertencentes às entidades de serviço e não aos usuários do workspace. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.
Conectar-se ao Looker manualmente
Para se conectar ao Looker manualmente, faça o seguinte:
No Looker, clique em Admin > Conexões > Adicionar conexão.
Insira um Nome exclusivo para a conexão.
Dica
Os nomes das conexões devem conter apenas letras minúsculas, números e sublinhados. Outros caracteres podem ser aceitos, mas podem causar resultados inesperados posteriormente.
Em Dialeto, selecione Databricks.
Para Host remoto, insira o Nome do host do servidor nos requisitos.
Em Porta, insira a Porta obtida nos requisitos.
Em Banco de dados, insira o nome do banco de dados no workspace que você deseja acessar por meio da conexão (por exemplo, default).
Em Nome de usuário, insira a palavra token.
Em senha, insira o seu token de acesso pessoal dos requisitos.
Em Parâmetros adicionais, insira transportMode=http;ssl=1;httpPath=<http-path>, substituindo <http-path> pelo valor do Caminho HTTP obtido nos requisitos.
Se o Unity Catalog estiver habilitado para seu workspace, também defina um catálogo padrão. Insira ConnCatalog=<catalog-name>, substituindo <catalog-name> pelo nome de um catálogo.
Para Agendamento de manutenção de PDT e grupo de dados, insira uma expressão cron válida para alterar a frequência padrão para regenerar as PDTs. A frequência padrão é a cada cinco minutos.
Se você quiser converter consultas para outros fusos horários, ajuste o Fuso horário da consulta.
Para os campos restantes, mantenha os padrões, em especial:
Mantenha os padrões de Tempo limite do pool de conexões e Máximo de conexões.
Deixe o Fuso horário do banco de dados em branco (supondo que você esteja armazenando tudo em UTC).
Clique em Testar essas configurações.
Se o teste for bem-sucedido, clique em Adicionar conexão.
Modelar seu banco de dados no Looker
Esta seção cria um projeto e executa o gerador. As seguintes etapas pressupõem que há tabelas permanentes armazenadas no banco de dados para sua conexão.
No menu Desenvolver, ative o Modo de Desenvolvimento.
Clique em Desenvolver > Gerenciar projetos do LookML.
Clique em Novo projeto do LookML.
Insira um Nome de projeto exclusivo.
Dica
Os nomes dos projetos devem conter apenas letras minúsculas, números e sublinhados. Outros caracteres podem ser aceitos, mas podem causar resultados inesperados posteriormente.
Em Conexão, selecione o nome da conexão obtida na Etapa 2.
Em Esquemas, insira default, a menos que você tenha outros bancos de dados para modelar por meio da conexão.
Para os campos restantes, mantenha os padrões, em especial:
Deixe o Ponto de partida definido como Gerar modelo a partir do esquema de banco de dados.
Deixe Criar exibições de definido como Todas as tabelas.
Clique em Criar projeto.
Depois que você cria o projeto e o gerador é executado, o Looker exibe uma interface do usuário com um arquivo .model e vários arquivos .view. O arquivo .model mostra as tabelas no esquema e quaisquer relações de junção descobertas entre elas, e os arquivos .view listam cada dimensão (coluna) disponível para cada tabela no esquema.
Próximas etapas
Para começar a trabalhar com seu projeto, consulte os seguintes recursos no site do Looker:
Habilitar e gerenciar tabelas derivadas persistentes (PDTs)
O Looker pode reduzir os tempos de consulta e o carregamento de banco de dados criando tabelas derivadas persistentes (PDTs). Um PDT é uma tabela derivada que o Looker grava em um esquema transitório em seu banco de dados. Em seguida, o Looker regenera o PDT no agendamento que você especificar. Para obter mais informações, consulte PDTs (tabelas derivadas persistentes) na documentação do Looker.
Quando as PDTs estão habilitadas, o Looker regenera por padrão as PDTs a cada 5 minutos conectando-se ao banco de dados associado. O Looker reiniciará o recurso do Azure Databricks associado se ele for interrompido. O Databricks recomenda a alteração dessa frequência padrão, definindo o campo Agendamento de manutenção de PDT e grupo de dados para sua conexão de banco de dados com uma expressão cron válida. Para obter mais informações, consulte Agendamento de manutenção de PDT e grupo de dados na documentação do Looker.
Para habilitar as PDTs ou alterar a frequência de regeneração de PDT para uma conexão de banco de dados existente, clique em Admin > Conexão de banco de dados, clique em Editar ao lado de sua conexão de banco de dados e siga as instruções anteriores.
Administrar uma infraestrutura de banco de dados do SQL Server para bancos de dados relacionais de nuvem, locais e híbridos usando as ofertas de banco de dados relacional do Microsoft PaaS.