Condividi tramite


Introduzione: Eseguire query e visualizzare i dati da un notebook

Questo articolo introduttivo illustra l'uso di un notebook di Azure Databricks per eseguire query sui dati di esempio archiviati in Unity Catalog usando SQL, Python, Scala e R e quindi visualizzare i risultati della query nel notebook.

Requisiti

Per completare le attività in questo articolo, è necessario soddisfare i requisiti seguenti:

  • L'area di lavoro deve avere Unity Catalog abilitato. Per informazioni su come iniziare a usare Il catalogo unity, vedere Configurare e gestire il catalogo unity.
  • È necessario disporre dell'autorizzazione per usare una risorsa di calcolo esistente o creare una nuova risorsa di calcolo. Vedere Introduzione: Configurazione dell'account e dell'area di lavoro o vedere l'amministratore di Databricks.

Passaggio 1: Creare un nuovo notebook

Per creare un notebook nell'area di lavoro, fare clic su Nuova icona Nuovo nella barra laterale e quindi su Notebook. Viene aperto un notebook vuoto nell'area di lavoro.

Per altre informazioni sulla creazione e la gestione dei notebook, vedere Gestire i notebook.

Passaggio 2: Eseguire query su una tabella

Eseguire una query sulla samples.nyctaxi.trips tabella in Unity Catalog usando il linguaggio preferito.

  1. Copiare e incollare il codice seguente nella nuova cella vuota del notebook. Questo codice visualizza i risultati dell'esecuzione di query sulla samples.nyctaxi.trips tabella nel catalogo unity.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Premere Shift+Enter per eseguire la cella e quindi passare alla cella successiva.

    I risultati della query vengono visualizzati nel notebook.

Passaggio 3: Visualizzare i dati

Visualizzare l'importo medio della tariffa in base alla distanza della corsa, raggruppata in base al codice postale del ritiro.

  1. Accanto alla scheda Tabella fare clic su + e quindi su Visualizzazione.

    Viene visualizzato l'editor di visualizzazione.

  2. Nell'elenco a discesa Tipo di visualizzazione verificare che sia selezionata l'opzione Barra.

  3. Selezionare fare_amount per la colonna X.

  4. Selezionare trip_distance per la colonna Y.

  5. Selezionare Average come tipo di aggregazione.

  6. Selezionare pickup_zip come colonna Raggruppa per .

    Grafico a barre

  7. Fare clic su Salva.

Passaggi successivi