Condividi tramite


Che cos'è Azure Databricks Clean Rooms?

Importante

Questa funzionalità è disponibile in anteprima pubblica. Per chiederne l’accesso, rivolgersi al rappresentante di Azure Databricks.

Questo articolo presenta Clean Rooms, una funzionalità di Azure Databricks che usa la condivisione delta e l'elaborazione serverless per fornire un ambiente sicuro e protetto dalla privacy in cui più parti possono collaborare sui dati aziendali sensibili senza accedere direttamente ai dati dell'altro.

Requisiti

Per essere idonei all'uso delle camere pulite, è necessario:

Come funzionano le camere pulite?

Quando si crea una stanza pulita, creare quanto segue:

  • Oggetto camera pulita a protezione diretta nel metastore del catalogo Unity.
  • La stanza pulita "centrale", che è un ambiente temporaneo isolato gestito da Databricks.
  • Oggetto camera pulita a protezione diretta nel metastore del catalogo Unity del collaboratore.

Tabelle, volumi (dati non tabulari) e notebook condivisi da entrambi i collaboratori nella stanza pulita, usando la condivisione Delta, solo con la sala pulita centrale.

I collaboratori non possono visualizzare i dati nelle tabelle e nei volumi di altri collaboratori, ma possono visualizzare i nomi di colonna e i tipi di colonna e possono eseguire codice notebook approvato che opera sulle tabelle e sui volumi. Il codice del notebook viene eseguito nella stanza pulita centrale.

Camere pulite semplice architettura e flusso

In che modo Clean Rooms garantisce un ambiente senza attendibilità?

Il modello Databricks Clean Rooms è "senza attendibilità". Tutti i collaboratori in una stanza pulita senza trust hanno privilegi uguali, incluso il creatore della stanza pulita. Clean Rooms è progettato per impedire l'esecuzione di codice non autorizzato e la condivisione non autorizzata dei dati. Ad esempio, tutti i collaboratori devono approvare un notebook prima di poterlo eseguire. Questa relazione di trust viene applicata in modo implicito impedendo a un collaboratore di eseguire qualsiasi notebook creato da solo: è possibile eseguire solo un notebook creato dall'altro collaboratore.

Misure di sicurezza o restrizioni aggiuntive

Oltre al processo di approvazione implicito del notebook menzionato in precedenza, sono state applicate le misure di sicurezza seguenti:

  • Dopo la creazione di una stanza pulita, viene bloccato per impedire ai nuovi collaboratori di entrare nella stanza pulita.

  • Se un collaboratore elimina la stanza pulita, la stanza pulita centrale è vuota e nessuna attività della stanza pulita può essere eseguita da qualsiasi utente.

  • Durante l'anteprima pubblica, ogni camera pulita è limitata a due collaboratori.

  • Non è possibile rinominare la stanza pulita.

    Il nome della stanza pulita deve essere univoco nel metastore di ogni collaboratore, in modo che tutti i collaboratori possano fare riferimento alla stessa stanza pulita senza ambiguità.

  • I commenti sull'entità a protezione diretta della stanza pulita nell'area di lavoro di ogni collaboratore non vengono propagati ad altri collaboratori.

Cosa viene condiviso con altri collaboratori?

  • Nome della stanza pulita.
  • Cloud e area della stanza pulita centrale.
  • Nome dell'organizzazione (che può essere qualsiasi nome scelto).
  • Identificatore di condivisione della stanza pulita (ID metastore globale + ID area di lavoro e indirizzo di posta elettronica utente).
  • Alias di tabelle o volumi condivisi.
  • Metadati di colonna (nome della colonna o alias e tipo).
  • Notebook (sola lettura).
  • Tabella di sistema degli eventi della sala pulita.
  • Cronologia di esecuzione, tra cui:
    • Nome del notebook in esecuzione
    • Collaboratore che ha eseguito il notebook (non utente).
    • Stato dell'esecuzione del notebook.
    • Ora di inizio dell'esecuzione del notebook.

Cosa viene condiviso con la camera pulita centrale?

  • Tutto ciò che è elencato nella sezione precedente.

  • Tabelle, volumi e notebook di sola lettura.

    Le tabelle e i volumi vengono registrati nel metastore della sala pulita centrale con qualsiasi alias fornito. Le tabelle, i volumi e i notebook vengono condivisi durante tutto il ciclo di vita della stanza pulita.

Limiti

Durante l'anteprima pubblica si applicano le limitazioni seguenti:

  • Nessun supporto per la disattivazione di Internet in ambienti puliti per impedire a codice dannoso di esfiltrare i dati in una posizione esterna.
  • Nessuna libreria scala credenziali del servizio inclusa nella versione richiesta di Databricks Runtime.

Quote di risorse

Azure Databricks applica quote di risorse a tutti gli oggetti a protezione diretta di Clean Room. Queste quote sono elencate in Limiti delle risorse. Se si prevede di superare questi limiti di risorse, contattare il team dell'account Azure Databricks.

È possibile monitorare l'utilizzo delle quote usando le API delle quote delle risorse del catalogo Unity. Vedere Monitorare l'utilizzo delle quote delle risorse del catalogo Unity.

Operazioni preliminari