Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Questa funzionalità è in Anteprima Pubblica.
Questa pagina descrive come usare il connettore Databricks per Fogli Google per connettersi ad Azure Databricks da Fogli Google. Il connettore Databricks esegue una query sui dati di Azure Databricks all'interno di Fogli Google, abilitando un'ulteriore analisi.
Prima di iniziare
- Creare un'area di lavoro di Azure Databricks. Vedere Creare un'area di lavoro.
- Creare un'istanza di magazzino SQL di Azure Databricks. Consulta Creare un SQL Warehouse.
- Avere accesso a Google Sheets.
- Installare il connettore Databricks per Fogli Google.
- Se l'area di lavoro di Azure Databricks dispone di elenchi di accesso IP abilitati, l'amministratore dell'account deve aggiungere l'elenco di indirizzi IP di Google Cloud all'elenco elementi consentiti.
- Per altre informazioni sugli elenchi di accesso IP, vedere Configurare gli elenchi di accesso IP per la console dell'account.
- Per l'elenco ip di Google Cloud, vedere questo elenco di indirizzi IP.
Connettersi a un'area di lavoro di Azure Databricks
Importare dati da Azure Databricks in fogli Google usando il connettore Databricks per Fogli Google connettendosi prima a un'area di lavoro di Azure Databricks:
In Fogli Google, selezionare Estensioni > Connettore Databricks > Avvia barra laterale per aprire il connettore.
Nella finestra di dialogo Accesso immettere l'URL dell'area di lavoro di Azure Databricks. Per informazioni su come trovare l'URL dell'area di lavoro, vedere Ottenere gli identificatori per gli oggetti dell'area di lavoro.
- L'URL dell'area di lavoro è nel formato seguente:
adb-<workspace-id>.<random-number>.azuredatabricks.net.
- L'URL dell'area di lavoro è nel formato seguente:
Fare clic su Accedi.
Una finestra di dialogo richiede di accedere o visualizzare lo stato di accesso.
Dopo l'accesso, è possibile selezionare quale SQL Warehouse usare. Nella barra laterale del connettore Databricks, nella scheda Dati scegliere un databricks SQL warehouse facendo clic sul cerchio in alto a destra della barra laterale del connettore e selezionando il databricks SQL warehouse preferito. Il connettore avvia il data warehouse SQL scelto.
Usare il connettore Databricks per Fogli Google
Il connettore Databricks per Fogli Google esegue query sui dati a cui si ha accesso in Unity Catalog e importa i dati in Fogli Google. Il connettore salva automaticamente tutte le query come importazioni. È possibile aggiornare i risultati, riutilizzare le query esistenti e tenere traccia delle origini dei dati nei fogli Google.
Dopo l'importazione dei dati, la query viene associata al foglio. La modifica del nome del foglio interrompe la mappatura. Per informazioni su come gestire le modifiche dei nomi, vedere Limitazioni.
Importante
L'esecuzione della query scade dopo tre minuti. Se la query supera questo limite, viene annullata automaticamente. Per i set di risultati di grandi dimensioni, le prime 1.000 righe vengono scritte immediatamente, con i dati rimanenti recuperati progressivamente. Se il recupero dei dati viene interrotto, i risultati parziali rimangono nel foglio e possono essere cancellati eseguendo nuovamente la query.
Scegliere un metodo di importazione
Selezionare uno dei metodi seguenti per importare dati da Azure Databricks:
Selezionare una tabella
Per importare dati da una tabella in Azure Databricks:
- Nella barra laterale del connettore, per Metodo di importazione, selezionare Seleziona dati.
- In Catalogo usare i menu a discesa catalogo, schema e tabella per cercare la tabella da importare.
- Facoltativamente, aggiornare il nome dell'asset per modificare il nome dell'importazione.
- Facoltativamente, in Campi scegliere le colonne da includere o escludere.
- Facoltativamente, è possibile importare come tabella pivot.
- Per aggiungere un filtro, fare clic su + Filtro in Filtri. Selezionare la colonna a cui applicare il filtro e il tipo di filtro.
- Facoltativamente, selezionare Limita righe per impostare un limite per il numero di righe da importare.
- In Opzioni avanzate scegliere se salvare i risultati della query in un nuovo foglio o nel foglio corrente.
- Se si sceglie il foglio corrente, specificare la cella in cui iniziare ad aggiungere i dati.
- Fare clic su Salva e importa per popolare il foglio.
Scrivere una query SQL
Per scrivere una nuova query SQL:
- Nella barra laterale del connettore, per Metodo di importazione, selezionare Crea nuova query.
- Databricks consiglia di immettere un nome per la query in modo che sia identificabile.
- È possibile esplorare cataloghi, schemi e tabelle.
- In Testo query, inserire la query SQL.
- Facoltativamente, è possibile aggiungere parametri di query.
- In Opzioni avanzate scegliere se salvare i risultati della query in un nuovo foglio o nel foglio corrente.
- Se si sceglie il foglio corrente, specificare la cella in cui iniziare ad aggiungere i dati.
- Fare clic su Salva e importa per eseguire la query e popolare il foglio.
Importante
Se si usa "Seleziona dati" per importare le visualizzazioni delle metriche del catalogo Unity, possono essere importate solo come tabelle pivot perché le metriche di Unity Catalog rappresentano dati con pivot.
Aggiungere parametri di query (facoltativo)
Per aggiungere parametri di query alla query SQL:
Verificare che la query abbia almeno un parametro di query, nel formato .
:parameter_namePer altre informazioni sui parametri di query, vedere Usare i parametri di query.Fare clic su + Aggiungi parametro.
Immettere il parametro nella prima casella. Assicurarsi che il nome del parametro corrisponda a quello immesso nell'editor di query.
Immettere il nome del foglio e la posizione della cella del valore del parametro nella seconda casella, incluso il punto esclamativo dopo il nome del foglio.
Per aggiungere altri parametri di query, fare di nuovo clic su + Aggiungi parametro .
Ad esempio, la query seguente include il parametro di query
:trip_distance, definito nel fogliosheet_1, cella H1.
Importare come tabella pivot (facoltativo)
Per importare i dati come tabella pivot:
- Quando si importano dati, selezionare Tabella pivot.
- In Configurazione pivot selezionare le righe e le colonne per le dimensioni della tabella pivot.
- Specificare i valori per cui aggregare. Fare clic su + Aggiungi valore e selezionare la colonna e il metodo di aggregazione.
- Facoltativamente, aggiungere filtri facendo clic su + Aggiungi filtro e selezionare il tipo di colonna e filtro.
- Fare clic su Salva e importa per importare i risultati come tabella pivot. Le tabelle pivot di importazione vengono importate automaticamente in un nuovo foglio.
Gestire i dati importati
Per gestire i dati importati da Azure Databricks:
- Selezionare la scheda Importazioni nella barra laterale del connettore.
- Per aggiornare un'importazione, fare clic sull'icona di aggiornamento accanto al nome della query.
- Per visualizzare il foglio a cui è connessa un'importazione, fare clic
> Passare a Foglio accanto al nome della query.
- Per modificare un'importazione, fare clic
> Modificare accanto al nome della query.
- Per eliminare un'importazione, fare clic
> Eliminare accanto al nome della query. Questa operazione elimina la query, non i dati importati in Fogli Google. È necessario eliminare manualmente i dati importati.
Modificare l'area di lavoro di Azure Databricks
Per modificare l'area di lavoro di Azure Databricks a cui si è connessi:
- Selezionare Estensioni > Databricks Connector > Modifica area di lavoro.
- Immettere l'URL della nuova area di lavoro ed eseguire l'autenticazione nell'area di lavoro.
Implicazioni per la condivisione
Il componente aggiuntivo non influisce sulla possibilità di condividere il tuo foglio Google. Tuttavia, il modo in cui si condivide il file influisce sulle azioni che i destinatari possono eseguire usando il componente aggiuntivo.
- I destinatari con il ruolo Visualizzatore o Commenter non possono accedere al componente aggiuntivo.
- I destinatari con il ruolo Editor e l'accesso equivalente agli asset di dati possono usare il componente aggiuntivo con il proprio account Google. Possono usare il connettore proprio come il proprietario.
- I destinatari con il ruolo Editor e lo stesso accesso alle risorse sottostanti possono aggiornare le importazioni se sono connessi alla stessa area di lavoro di Azure Databricks.
Limitazioni
La ridenominazione o l'eliminazione di un foglio collegato a un'importazione esistente impedisce di aggiornare l'importazione. Per risolvere questo problema, eseguire una delle operazioni seguenti:
- Ricreare il foglio con lo stesso nome.
- Creare una nuova importazione scegliendo Selezionare una query come origine, riutilizzare l'importazione e fare clic su Salva come nuovo.
Se due query vengono mappate agli stessi intervalli o intervalli sovrapposti, il componente aggiuntivo visualizza i risultati della query eseguita più di recente. Questo sovrascrive i dati importati in precedenza.