Che cos'è Azure Databricks Clean Rooms?
Importante
Questa funzionalità è disponibile in anteprima pubblica. Per chiederne l’accesso, rivolgersi al rappresentante di Azure Databricks.
Questo articolo presenta Clean Rooms, una funzionalità di Azure Databricks che usa la condivisione delta e l'elaborazione serverless per fornire un ambiente sicuro e protetto dalla privacy in cui più parti possono collaborare sui dati aziendali sensibili senza accedere direttamente ai dati dell'altro.
Requisiti
Per essere idonei all'uso delle camere pulite, è necessario:
- Iscriversi e essere approvati per l'anteprima pubblica. Per richiedere l'accesso, contattare il team dell'account Azure Databricks.
- Disporre di un account abilitato per il calcolo serverless. Consultare la sezione Abilitare l’elaborazione serverless.
- Disporre di un'area di lavoro abilitata per il catalogo Unity. Consultare Abilitare un'area di lavoro per il catalogo Unity.
Come funzionano le camere pulite?
Quando si crea una stanza pulita, creare quanto segue:
- Oggetto camera pulita a protezione diretta nel metastore del catalogo Unity.
- La stanza pulita "centrale", che è un ambiente temporaneo isolato gestito da Databricks.
- Oggetto camera pulita a protezione diretta nel metastore del catalogo Unity del collaboratore.
Tabelle, volumi (dati non tabulari) e notebook condivisi da entrambi i collaboratori nella stanza pulita, usando la condivisione Delta, solo con la sala pulita centrale.
I collaboratori non possono visualizzare i dati nelle tabelle e nei volumi di altri collaboratori, ma possono visualizzare i nomi di colonna e i tipi di colonna e possono eseguire codice notebook approvato che opera sulle tabelle e sui volumi. Il codice del notebook viene eseguito nella stanza pulita centrale.
In che modo Clean Rooms garantisce un ambiente senza attendibilità?
Il modello Databricks Clean Rooms è "senza attendibilità". Tutti i collaboratori in una stanza pulita senza trust hanno privilegi uguali, incluso il creatore della stanza pulita. Clean Rooms è progettato per impedire l'esecuzione di codice non autorizzato e la condivisione non autorizzata dei dati. Ad esempio, tutti i collaboratori devono approvare un notebook prima di poterlo eseguire. Questa relazione di trust viene applicata in modo implicito impedendo a un collaboratore di eseguire qualsiasi notebook creato da solo: è possibile eseguire solo un notebook creato dall'altro collaboratore.
Misure di sicurezza o restrizioni aggiuntive
Oltre al processo di approvazione implicito del notebook menzionato in precedenza, sono state applicate le misure di sicurezza seguenti:
Dopo la creazione di una stanza pulita, viene bloccato per impedire ai nuovi collaboratori di entrare nella stanza pulita.
Se un collaboratore elimina la stanza pulita, la stanza pulita centrale è vuota e nessuna attività della stanza pulita può essere eseguita da qualsiasi utente.
Durante l'anteprima pubblica, ogni camera pulita è limitata a due collaboratori.
Non è possibile rinominare la stanza pulita.
Il nome della stanza pulita deve essere univoco nel metastore di ogni collaboratore, in modo che tutti i collaboratori possano fare riferimento alla stessa stanza pulita senza ambiguità.
I commenti sull'entità a protezione diretta della stanza pulita nell'area di lavoro di ogni collaboratore non vengono propagati ad altri collaboratori.
Cosa viene condiviso con altri collaboratori?
- Nome della stanza pulita.
- Cloud e area della stanza pulita centrale.
- Nome dell'organizzazione (che può essere qualsiasi nome scelto).
- Identificatore di condivisione della stanza pulita (ID metastore globale + ID area di lavoro e indirizzo di posta elettronica utente).
- Alias di tabelle o volumi condivisi.
- Metadati di colonna (nome della colonna o alias e tipo).
- Notebook (sola lettura).
- Tabella di sistema degli eventi della sala pulita.
- Cronologia di esecuzione, tra cui:
- Nome del notebook in esecuzione
- Collaboratore che ha eseguito il notebook (non utente).
- Stato dell'esecuzione del notebook.
- Ora di inizio dell'esecuzione del notebook.
Cosa viene condiviso con la camera pulita centrale?
Tutto ciò che è elencato nella sezione precedente.
Tabelle, volumi e notebook di sola lettura.
Le tabelle e i volumi vengono registrati nel metastore della sala pulita centrale con qualsiasi alias fornito. Le tabelle, i volumi e i notebook vengono condivisi durante tutto il ciclo di vita della stanza pulita.
Limiti
Durante l'anteprima pubblica si applicano le limitazioni seguenti:
- Nessun supporto per la disattivazione di Internet in ambienti puliti per impedire a codice dannoso di esfiltrare i dati in una posizione esterna.
- Nessuna libreria scala credenziali del servizio inclusa nella versione richiesta di Databricks Runtime.
Quote di risorse
Azure Databricks applica quote di risorse a tutti gli oggetti a protezione diretta di Clean Room. Queste quote sono elencate in Limiti delle risorse. Se si prevede di superare questi limiti di risorse, contattare il team dell'account Azure Databricks.
È possibile monitorare l'utilizzo delle quote usando le API delle quote delle risorse del catalogo Unity. Vedere Monitorare l'utilizzo delle quote delle risorse del catalogo Unity.