Condividi tramite


Rete

Questo articolo presenta le configurazioni di rete per la distribuzione e la gestione di account e aree di lavoro di Azure Databricks.

Annotazioni

Azure Databricks addebita addebiti per i costi di rete quando i carichi di lavoro serverless si connettono alle risorse dei clienti. Vedere Informazioni sui costi di rete serverless di Databricks.

Informazioni generali dell'architettura di Azure Databricks

Azure Databricks opera da un piano di controllo e da un piano di calcolo.

  • Il piano di controllo include i servizi back-end gestiti da Azure Databricks nell'account Azure Databricks. L'applicazione Web si trova nel piano di controllo.
  • Il piano di calcolo è la posizione in cui vengono elaborati i dati. Esistono due tipi di piani di calcolo a seconda del calcolo in uso.
    • Per le risorse di calcolo classiche di Azure Databricks, le risorse di calcolo si trovano nella sottoscrizione di Azure nel cosiddetto piano di calcolo classico. Questo si riferisce alla rete nella sottoscrizione di Azure e alle relative risorse. Le risorse del piano di calcolo classico si trovano nell'area in cui si trova l'area di lavoro.
    • Per il calcolo serverless, le risorse di calcolo serverless vengono eseguite in un piano di calcolo serverless nell'account Azure Databricks. Le risorse del piano di calcolo serverless si trovano nella stessa area cloud del piano di calcolo classico dell'area di lavoro. Questa area viene selezionata durante la creazione di un'area di lavoro.

Per altre informazioni sul calcolo classico e sul calcolo serverless, vedere Calcolo. Per altre informazioni sull'architettura, vedere Architettura generale.

Proteggere la connettività di rete

Azure Databricks offre un ambiente di rete sicuro per impostazione predefinita, ma se l'organizzazione ha esigenze aggiuntive, è possibile configurare le funzionalità di connettività di rete tra le diverse connessioni di rete illustrate nel diagramma seguente.

Diagramma di panoramica della connettività di rete

  1. Utenti e applicazioni in Azure Databricks: è possibile configurare funzionalità per controllare l'accesso e fornire connettività privata tra gli utenti e le aree di lavoro di Azure Databricks. Consulta Rete utenti di Azure Databricks.
  2. Il piano di controllo e il piano di calcolo classico: le risorse di calcolo classiche, ad esempio i cluster, vengono distribuite nella sottoscrizione di Azure e si connettono al piano di controllo. È possibile usare le funzionalità di connessione di rete classiche per distribuire le risorse del piano di calcolo classico nelle proprie reti virtuali e abilitare la connettività privata dai cluster al piano di controllo. Vedere Rete del piano di calcolo classico.
  3. Piano di calcolo e archiviazione serverless: è possibile configurare connessioni private e dedicate dal calcolo serverless all'archiviazione. Consulta Connettività del piano di calcolo serverless.

È possibile configurare le funzionalità di rete di archiviazione di Azure, ad esempio gli endpoint privati, per proteggere la connessione tra il piano di calcolo classico e le risorse di Azure. Vedere Concedere all'area di lavoro di Azure Databricks l'accesso ad Azure Data Lake Storage e Raccomandazioni di rete per la federazione Lakehouse.

È anche possibile abilitare il supporto del firewall per l'account di archiviazione dell'area di lavoro per limitare l'accesso all'account da reti e connessioni autorizzate. Vedere Abilitare il supporto del firewall per l'account di archiviazione dell'area di lavoro.

La connettività tra il piano di controllo e il piano di calcolo serverless è sempre tramite il backbone di rete di Azure e non la rete Internet pubblica.

Get started

Comprendere l'architettura di rete di Databricks ed esplorare i concetti chiave.

Argomento Description
Panoramica dell'architettura di Databricks Informazioni sull'architettura del piano di controllo e del piano di calcolo che costituisce la base della rete di Databricks.
Collegamento privato di Azure Stabilire connessioni private tra la rete e Databricks usando collegamento privato di Azure per una maggiore sicurezza.
Informazioni sui costi di trasferimento e connettività dei dati Informazioni sui prezzi del trasferimento dei dati e sull'ottimizzazione dei costi per le funzionalità di connettività di rete.

Connectivity

Configurare connessioni di rete sicure per l'accesso in ingresso alle aree di lavoro e la connettività in uscita dalle risorse di calcolo.

Argomento Description
Rete front-end Configurare i controlli di accesso alla rete per gli utenti che si connettono alle aree di lavoro di Databricks tramite l'interfaccia Web e le API.
Collegamento front-end privato Abilitare la connettività privata dalla rete aziendale alle aree di lavoro di Databricks usando collegamento privato di Azure.
Rete di interconnessione della piattaforma di calcolo serverless Configurare l'accesso sicuro alla rete tra le risorse di calcolo senza server e le origini dati e i servizi.
Connettività privata alle risorse di Azure Stabilisci connessioni private dall'elaborazione serverless ad Azure Storage, SQL Database e ad altri servizi di Azure.
Connettività privata alle risorse nella rete virtuale Connettere il calcolo senza server alle risorse in esecuzione nella propria VNet tramite endpoint privati.
Gestire le regole degli endpoint privati Configurare e gestire le regole degli endpoint privati per la connettività di calcolo serverless.
Rete del piano di calcolo classico Informazioni sulle opzioni di rete per le risorse di calcolo classiche distribuite nella rete virtuale.
Distribuire Azure Databricks nella rete virtuale Ospitare i cluster Databricks nella propria rete virtuale di Azure per un controllo di rete migliorato (inserimento della rete virtuale - VNet).
Reti virtuali collegate Connettere la rete virtuale di Databricks ad altre reti virtuali nella sottoscrizione di Azure per accedere a risorse aggiuntive.
Connettere un'area di lavoro a una rete locale Estendere la rete aziendale a Databricks tramite VPN o Azure ExpressRoute.
Collegamento privato back-end Stabilire la connettività privata tra le risorse di calcolo classiche e il piano di controllo di Databricks.
Impostazioni di route definite dall'utente Configurare i percorsi definiti dall'utente (UDR) per controllare il flusso del traffico dai cluster Databricks.
Aggiornare la configurazione di rete dell'area di lavoro Modificare le configurazioni di rete per le aree di lavoro esistenti.
Connettività sicura del cluster Abilitare la connettività solo in uscita dai cluster al piano di controllo senza porte in ingresso aperte.

Sicurezza della rete

Implementare controlli di sicurezza per limitare e monitorare l'accesso alla rete.

Argomento Description
Che cos'è il controllo serverless dell'uscita? Limitare le connessioni di rete in uscita dalle risorse di calcolo serverless per impedire l'esfiltrazione dei dati e applicare la conformità.
Gestire le politiche di rete per il controllo dell'uscita serverless Creare e gestire criteri di rete che definiscono le connessioni in uscita consentite dal calcolo serverless.
Panoramica degli elenchi di accesso IP Informazioni su come usare gli elenchi di accesso IP per controllare quali indirizzi IP possono accedere alle aree di lavoro di Databricks.
Elenchi di accesso IP per le aree di lavoro Configurare i controlli di accesso IP a livello di area di lavoro per limitare l'accesso dalle reti approvate.
Elenchi di accesso IP per la console dell'account Impostare restrizioni IP a livello di account che si applicano a più aree di lavoro per la gestione centralizzata della sicurezza.
Configurare i criteri degli endpoint di servizio per l'accesso alle risorse di archiviazione Usare gli endpoint di servizio di Azure per proteggere la connettività tra Databricks e gli account di archiviazione di Azure.
Abilitare il supporto del firewall per l'account di archiviazione dell'area di lavoro Configurare le regole del firewall di Archiviazione di Azure per consentire l'accesso dalle risorse di calcolo classiche di Databricks.
Configurare un firewall di Azure Storage per l'accesso a calcolo serverless Usare tag di servizio stabili per configurare le regole del firewall di Azure Storage per la connettività di calcolo senza server.
Regole del firewall del nome di dominio Configurare le regole del firewall basate su dominio per consentire i servizi Databricks tramite i controlli di sicurezza di rete.
Modello ARM per il supporto del firewall Usare i modelli di Azure Resource Manager per automatizzare la configurazione del firewall per gli account di archiviazione dell'area di lavoro.