Partilhar via


Primeiros passos: consultar e visualizar dados de um bloco de anotações

Este artigo de introdução orienta você pelo uso de um bloco de anotações do Azure Databricks para consultar dados de exemplo armazenados no Catálogo Unity usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no bloco de anotações.

Requisitos

Para concluir as tarefas neste artigo, você deve atender aos seguintes requisitos:

  • Seu espaço de trabalho deve ter o Unity Catalog habilitado. Para obter informações sobre como começar a usar o Unity Catalog, consulte Configurar e gerenciar o Unity Catalog.
  • Você deve ter permissão para usar um recurso de computação existente ou criar um novo recurso de computação. Consulte Introdução: Configuração de conta e espaço de trabalho ou consulte o administrador do Databricks.

Etapa 1: Criar um novo bloco de anotações

Para criar um bloco de notas na sua área de trabalho, clique Novo ícone em Novo na barra lateral e, em seguida, clique em Bloco de Notas. Um bloco de anotações em branco é aberto no espaço de trabalho.

Para saber mais sobre como criar e gerir blocos de notas, consulte Gerir blocos de notas.

Etapa 2: Consultar uma tabela

Consulte a samples.nyctaxi.trips tabela no Catálogo Unity usando o idioma de sua escolha.

  1. Copie e cole o código a seguir na nova célula vazia do bloco de anotações. Esse código exibe os resultados da consulta à samples.nyctaxi.trips tabela no Unity Catalog.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Pressione Shift+Enter para executar a célula e, em seguida, vá para a próxima célula.

    Os resultados da consulta aparecem no bloco de anotações.

Etapa 3: exibir os dados

Exiba o valor médio da tarifa por distância da viagem, agrupado pelo CEP de retirada.

  1. Ao lado da guia Tabela , clique em e, em + seguida, clique em Visualização.

    O editor de visualização é exibido.

  2. Na lista suspensa Tipo de visualização, verifique se Barra está selecionada.

  3. Selecione fare_amount a coluna X.

  4. Selecione trip_distance para a coluna Y.

  5. Selecione Average como o tipo de agregação.

  6. Selecione pickup_zip como a coluna Agrupar por .

    Gráfico de barras

  7. Clique em Guardar.

Próximos passos