Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este tutorial usa o conjunto de dados de táxi da cidade de Nova York em Exemplos. Ele mostra como usar o editor de SQL no Databricks SQL para criar uma visualização para cada uma das várias consultas e, em seguida, criar um dashboard usando essas visualizações. Ele também mostra como criar um parâmetro dashboard para cada uma das visualizações no dashboard.
Conecte-se ao Databricks SQL com o editor SQL
Clique em
Novo na barra lateral e selecione Consulta.O editor SQLé aberto.
Selecione um depósito.
Quando você cria uma consulta pela primeira vez, a lista de SQL warehouses disponíveis é exibida em ordem alfabética. Na próxima vez que você criar uma consulta, o último warehouse que foi usado será selecionado.
Clique Serverless Starter Warehouse. Esse armazém é criado automaticamente para ajudá-lo a começar rapidamente. Se o recurso de serverless não estiver habilitado para seu ambiente de trabalho, escolha Starter Warehouse. Para obter informações sobre como criar SQL warehouses, consulte Criar um SQL warehouse.
Consulta para distribuição de hora de retirada
No editor SQL, cole a seguinte consulta na nova janela de consulta para retornar a distribuição das corridas de táxi por hora.
SELECT date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`, count(*) AS `Number of Rides` FROM samples.nyctaxi.trips GROUP BY 1Pressione Ctrl/Cmd + Enter ou clique em Executar (1000). Após alguns segundos, os resultados da consulta são mostrados abaixo da consulta no painel de resultados.
Limite 1000 fica selecionado por padrão para todas as consultas para garantir que a consulta retorne no máximo 1000 linhas. Se uma consulta for salva com a configuração Limite 1000, essa configuração se aplicará a todas as execuções da consulta (inclusive nos dashboards). Se você quiser retornar todas as linhas dessa consulta, poderá desmarcar LIMIT 1000 clicando na lista suspensa Executar (1000). Para especificar um limite diferente para o número de linhas, você pode adicionar uma cláusula
LIMITem sua consulta com um valor de sua escolha.O resultado da consulta é exibido na guia Resultados.
Clique em Salvar e salve a consulta como
Pickup hour.
Crie uma visualização para a distribuição de retiradas de táxi por hora.
Ao lado da guia Resultados, clique + e clique em Visualização.
O editor de visualização é exibido.
Na lista suspensa Tipo de Visualização, verifique se a Barra está selecionada.
Altere o nome da visualização para
Bar chart.Verifique se
Pickup Hourestá especificado para a coluna Y da lista suspensa.Verifique se
Number of RideseSumestão especificados para a lista suspensa da coluna X.
Clique em Save (Salvar).
O gráfico salvo é exibido no editor de SQL.
Consultar tendências diárias de tarifas
No Editor de SQL, clique + e clique em Criar nova consulta.
Na nova janela de consulta, cole a consulta a seguir para retornar as tendências diárias de tarifa.
SELECT T.weekday, CASE WHEN T.weekday = 1 THEN 'Sunday' WHEN T.weekday = 2 THEN 'Monday' WHEN T.weekday = 3 THEN 'Tuesday' WHEN T.weekday = 4 THEN 'Wednesday' WHEN T.weekday = 5 THEN 'Thursday' WHEN T.weekday = 6 THEN 'Friday' WHEN T.weekday = 7 THEN 'Saturday' ELSE 'N/A' END AS day_of_week, T.fare_amount, T.trip_distance FROM ( SELECT dayofweek(tpep_pickup_datetime) as weekday, * FROM `samples`.`nyctaxi`.`trips` ) TClique em Salvar e salve a consulta como
Daily fare to distance analysis.
Criar uma visualização para tendências diárias de tarifas
Ao lado da guia Resultados, clique + e clique em Visualização.
O editor de visualização é exibido.
No menu suspenso Tipo de visualização, selecione Dispersão.
Altere o nome da visualização para
Fare by distance.Na guia Geral, defina o valor da coluna X como
trip_distancee defina o valor das colunas Y comofare_amount.Na lista suspensa Agrupar por, defina o valor como
day_of_week.Na guia Eixo X, defina o valor Nome como
Trip distance (miles).Na guia Eixo Y, defina o valor Nome como
Fare Amount (USD).Clique em Salvar
O gráfico salvo é exibido no editor de SQL.
Criar um dashboard usando essas visualizações
Clique em
Novo na barra lateral e selecione Painel herdado.Defina o nome do dashboard como
NYC taxi trip analysis.Clique em Save (Salvar).
Na lista suspensa Escolher warehouse, selecione Serverless Starter Warehouse. Se o recurso de serverless não estiver habilitado para seu ambiente de trabalho, escolha Starter Warehouse.
Na lista suspensa Adicionar, clique em Visualização.
Na janela Adicionar widget de visualização, selecione a consulta Tarifa diária para análise de distância.
Na lista Selecionar visualização existente , selecione Tarifa por distância.
Na caixa de texto Título, insira
Daily fare trends.
Clique em Adicionar ao painel herdado.
A visualização de tendências diárias de tarifas aparece na superfície de design do painel.
Na lista suspensa Adicionar para adicionar um segundo widget à dashboard e clique em Visualização.
Na janela Adicionar widget de visualização, selecione a consulta Hora de coleta.
Na lista Selecionar visualização existente , selecione Gráfico de barras.
Na caixa de texto Título, insira
Pickup hour distribution.Clique em Adicionar ao painel herdado.
Redimensione essa visualização para corresponder à largura da primeira visualização no dashboard.
Clique em Edição concluída.
Adicionar um parâmetro de cep de coleta a cada consulta
No editor de SQL, abra a consulta Tarifa diária para análise da distância.
Adicione a seguinte cláusula
WHEREà consulta Análise de distância da tarifa diária para filtrar a consulta pelo cep de origem.WHERE pickup_zip IN ({{ pickupzip }})Na caixa de texto pickupzip, insira
10018e clique em Aplicar alterações para executar a consulta com o parâmetro do código postal de retirada.Clique em Save (Salvar).
Abra a consulta Hora de coleta.
Adicione a seguinte cláusula
WHEREà consulta Hora de coleta para filtrar pelo CEP de retirada. Adicione esta cláusula antes da cláusulaGROUP BY.WHERE pickup_zip IN ({{ pickupzip }})Na caixa de texto pickupzip, insira
10018e clique em Aplicar alterações para executar a consulta com o filtro de código postal de coleta.Clique em Save (Salvar).
Atualizar o dashboard para usar um parâmetro do dashboard
Abra o painel de análise das corridas de táxi em Nova York.
Todas as visualizações agora incluem um parâmetro para o código de área de retirada.
Clique no
para este painel e depois clique em Editar.
Clique no ícone do
para a visualização de tendências de tarifas diárias e clique em Alterar configurações do widget.
Na seção Parâmetros, clique no ícone de lápis
para o parâmetro Widget no campo Valor.
Na janela Editar origem e Valor, altere o Origem para Novo parâmetro de painel.
Clique em OK e, em seguida, em Salvar.
O parâmetro pickupzip dashboard é exibido e o parâmetro widget para a visualização tendências diárias de tarifas não aparece mais.
-
- Clique no
para a visualização de distribuição de horários de retirada e clique em Alterar configurações do widget.
- Clique no
Na seção Parâmetros, clique no ícone de lápis
para o parâmetro Widget no campo Valor.Na janela Editar origem e Valor, altere o parâmetro Origem para Painel de controle existente.
Verifique se pickupzip está selecionado como o valor chave.
Clique em OK e, em seguida, em Salvar.
O parâmetro de widget para a visualização de distribuição da hora de retirada não é mais exibido.
Clique em Edição concluída.
Altere o valor do parâmetro pickupzip dashboard para
10017e clique em Aplicar alterações.Os dados em cada uma das visualizações agora exibem dados de retiradas no CEP 10017.