Introduzione ad Azure Databricks

Completato

Azure Databricks è una piattaforma distribuita basata sul cloud per l'elaborazione e l'analisi dei dati in un data lakehouse. Databricks si basa su Apache Spark e sulle tecnologie open source correlate ed è progettato per unificare data science, ingegneria dei dati e analisi dei dati aziendali in un ambiente facile da usare che consente agli utenti di dedicare più tempo a lavorare in modo efficace con i dati e meno tempo alla gestione di cluster e infrastruttura. Man mano che la piattaforma si è evoluta, è stata aggiornata con i progressi più recenti nel runtime di Spark e in altre tecnologie e sono state aggiunte funzionalità di usabilità per supportare carichi di lavoro per i dati comuni in un'unica interfaccia gestita centralmente.

Azure Databricks è ospitato nella piattaforma cloud di Microsoft Azure e integrato con i servizi di Azure, ad esempio Microsoft Entra ID, Archiviazione di Azure, Azure Synapse Analytics e Azure Machine Learning. Le organizzazioni possono applicare le capacità esistenti con la piattaforma Databricks e creare soluzioni di analisi dei dati completamente integrate che interagiscono con l'infrastruttura cloud usata dalle altre applicazioni aziendali.

Creazione di un'area di lavoro di Azure Databricks

Per usare Azure Databricks, è necessario creare un'area di lavoro di Azure Databricks nella sottoscrizione di Azure. A tale scopo, effettuare le operazioni descritte di seguito:

  • Uso dell'interfaccia utente del portale di Azure.
  • Uso di un modello di Azure Resource Manager (ARM) o Bicep.
  • Uso del cmdlet di PowerShell di Azure New-AzDatabricksWorkspace
  • Uso del comando dell'interfaccia della riga di comando di Azure az databricks workspace create.

Quando si crea un'area di lavoro, è necessario specificare uno dei piani tariffari seguenti:

  • Standard - Funzionalità principali di Apache Spark con l'integrazione di Microsoft Entra.
  • Premium - Controlli degli accessi in base al ruolo e altre funzionalità di livello aziendale.
  • Trial - Versione di valutazione gratuita per 14 giorni di un'area di lavoro di livello Premium

Screenshot della pagina Crea un'area di lavoro di Azure Databricks nel portale di Azure.

Uso del portale di Azure Databricks

Dopo aver effettuato il provisioning di un'area di lavoro di Azure Databricks, è possibile usare il portale di Azure Databricks per usare i dati e le risorse di calcolo. Il portale di Azure Databricks è un'interfaccia utente basata sul Web tramite cui è possibile creare e gestire le risorse dell'area di lavoro (ad esempio i cluster Spark) e usare notebook e query per lavorare con i dati in file e tabelle.

Screenshot del portale di Azure Databricks.