Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questa pagina descrive come creare una stanza pulita di Databricks usando l'interfaccia utente. Una stanza pulita è un ambiente sicuro per l'analisi collaborativa dei dati.
Funzionalità e limitazioni principali:
- Collaborazione sicura: le stanze pulite consentono a più parti di collaborare sui dati aziendali sensibili senza l'accesso diretto ai dati non elaborati dell'altro.
- Capacità dei collaboratori: una cleanroom può ospitare dieci persone, tra cui l'autore e fino a nove collaboratori aggiuntivi.
- Limite metastore: Azure Databricks applica quote di risorse a tutti gli oggetti di sicurezza dell'ambiente controllato. Vedere Limiti delle risorse.
Per usare l'API REST, vedere Creare una stanza pulita.
Operazioni preliminari
I privilegi necessari per usare le stanze pulite variano a seconda dell'attività:
Attività | Privilegi obbligatori |
---|---|
Visualizzare una stanza pulita | Deve essere il proprietario della stanza pulita o avere uno dei privilegi seguenti per la stanza pulita: MANAGE , MODIFY CLEAN ROOM , EXECUTE CLEAN ROOM TASK o BROWSE . |
Aggiornare il proprietario di una stanza pulita | Deve essere il proprietario della camera bianca o avere il MANAGE privilegio sulla camera bianca. |
Aggiungere o rimuovere asset di dati in una stanza pulita | Deve essere il proprietario della camera pulita o avere il MODIFY CLEAN ROOM privilegio per la camera pulita. Se non sei il proprietario della stanza pulita, tu e il proprietario della stanza pulita dovete avere SELECT su qualsiasi tabella o vista e READ VOLUME su qualsiasi volume che aggiungete, insieme a USE CATALOG e USE SCHEMA sul catalogo padre e lo schema. |
Aggiungere o rimuovere notebook in una stanza pulita | Per il caricatore del notebook:
|
Aggiornare un commento in una stanza pulita | Deve essere il proprietario della camera pulita o avere il MODIFY CLEAN ROOM privilegio per la camera pulita. |
Concedere l'accesso a una stanza pulita | Deve essere il proprietario o avere il MANAGE privilegio per la stanza pulita. |
Eliminare una stanza pulita | Deve essere il proprietario o avere il MANAGE privilegio per la stanza pulita. |
Oltre ai privilegi specifici dell'attività, quando viene condivisa una stanza pulita, l'indirizzo di posta elettronica allegato all'identificatore di condivisione diventerà automaticamente il proprietario dell'organizzazione del collaboratore. Vedere Passaggio 1. Richiedere l'identificatore di condivisione del collaboratore.
Per informazioni sui requisiti di autorizzazione per l'aggiornamento delle stanze pulite e l'esecuzione di attività (notebook) nelle stanze pulite, vedere Gestire le stanze pulite ed Eseguire notebook in ambienti puliti.
Nota
La camera pulita centrale può avere un massimo di due aree diverse dall'area centrale della camera pulita tra i suoi collaboratori.
Passaggio 1. Richiedere l'identificatore di condivisione del collaboratore
Prima di poter creare una stanza pulita, è necessario avere l'identificatore di condivisione clean room delle organizzazioni con cui si collaborerà. L'identificatore di condivisione è una stringa costituita dall'ID del metastore globale dell'organizzazione e dall'ID dell'area di lavoro + dal nome utente del contatto (indirizzo di posta elettronica). I collaboratori possono trovarsi in qualsiasi cloud o area.
Contattare i collaboratori per richiedere l'identificatore di condivisione. Possono ottenere l'identificatore di condivisione usando le istruzioni in Trovare l'identificatore di condivisione.
Passaggio 2. Creare una camera pulita
Per creare una camera bianca, è necessario usare Catalog Explorer.
Nell'area di lavoro di Azure Databricks fare clic
Catalogo.
Nella pagina Accesso rapido fare clic sul pulsante Clean Rooms .On the Quick access page, click the Clean Rooms > button.
Fare clic su Crea stanza pulita.
Nella pagina Crea stanza pulita immettere un nome descrittivo per la stanza pulita.
Il nome non può usare spazi, punti o barre (/).
Una volta salvato, il nome della stanza pulita non può essere modificato. Usare un nome che i potenziali collaboratori troveranno utile e descrittivo.
Selezionare il provider di servizi cloud e l'area in cui verrà creata la sala pulita centrale.
Il provider di servizi cloud deve corrispondere all'area di lavoro corrente, ma l'area può essere diversa. Prendere in considerazione la residenza dei dati dell'organizzazione o altri criteri quando si effettua la selezione.
Ogni camera pulita può avere fino a dieci collaboratori. Immettere per ogni collaboratore l'identificatore di condivisione Clean Room. Vedere Passaggio 1. Richiedere l'identificatore di condivisione del collaboratore.
È possibile testare la clean room prima della distribuzione completa usando l'identificatore di condivisione o l'identificatore di un altro utente nel metastore corrente. In questo modo si creano due stanze pulite nel metastore corrente. Ad esempio, se si crea una stanza pulita denominata
test_clean_room
, viene visualizzata anche una seconda stanza pulita denominatatest_clean_room_collaborator
. L'esecuzione di notebook con un collaboratore in uno stesso metastore avviene nello stesso modo che con un collaboratore esterno. Vedere Eseguire notebook in clean rooms.Prendete nota dei nomi di catalogo assegnati a voi e ai vostri collaboratori.
Tutti gli asset di dati aggiunti alla stanza pulita verranno visualizzati in tale catalogo nella stanza pulita centrale e possono essere referenziati usando tale catalogo nello spazio dei nomi a tre livelli del catalogo Unity (
<catalog>.<schema>.<table-etc>
).
Selezionare il tipo di criterio di accesso alla rete. Questa operazione non può essere modificata dopo la creazione della stanza pulita.
- Accesso completo: accesso a Internet in uscita senza restrizioni.
- Accesso limitato: questo limita l'accesso in uscita alle destinazioni Internet specificate. Vedere Panoramica dei criteri di rete e Gestire i criteri di rete per il controllo in uscita serverless.
Nota
L'accesso limitato può ritardare la disponibilità degli asset per un massimo di dieci minuti.
Dopo aver creato la stanza pulita, è possibile visualizzare i criteri di accesso alla rete nella scheda Sicurezza .
- Fare clic su Crea stanza pulita.
Se l'area di lavoro corrente è impostata sul profilo di sicurezza della conformità HIPAA, quando si crea una stanza pulita, tale impostazione viene applicata alla stanza pulita centrale. I collaboratori devono accedere alla stanza pulita da un'area di lavoro con lo stesso profilo di sicurezza. Vedi il profilo di sicurezza della conformità .
Passaggio 3. Aggiungere asset di dati e notebook alla stanza pulita
Sia il creatore che i collaboratori possono aggiungere tabelle, volumi, visualizzazioni e notebook alla stanza pulita.
Nota
Le istruzioni seguenti presuppongono che si stia tornando a una stanza pulita già creata per aggiungere elementi. Se hai appena creato una stanza pulita per la prima volta, una procedura guidata ti guida nell’aggiunta di asset di dati e notebook. L'interfaccia utente effettiva per l'aggiunta di questi asset è la stessa, indipendentemente dal fatto che tu sia guidato dalla procedura guidata o meno.
Per aggiungere notebook:
Fare clic sul pulsante + Aggiungi notebook e cercare il notebook da aggiungere.
Assegnare un nome al notebook.
Seleziona il collaboratore che può eseguire il notebook. Seleziona Te per eseguire il notebook da solo.
Facoltativamente, è possibile assegnare al notebook un nome di notebook alternativo.
I notebook che condividi nelle stanze pulite eseguono query sui dati e svolgono attività di analisi sui dati contenuti in tabelle, viste e volumi che tu e altri collaboratori avete aggiunto alla stanza pulita.
Se si condivide un notebook che include risultati, questi risultati verranno condivisi con i collaboratori.
È possibile usare un notebook per creare tabelle di output condivise temporaneamente nel metastore del collaboratore quando eseguono il notebook. Vedere Creare e usare tabelle di output in Databricks Clean Rooms.
Per usare un set di dati di test, scarica il notebook di esempio .
Importante
Tutti i riferimenti dei notebook a tabelle, viste o volumi aggiunti alla camera bianca devono usare il nome del catalogo che è stato assegnato al momento della creazione della camera bianca ("creatore" per gli asset di dati aggiunti dal creatore della camera bianca e "collaboratore" per gli asset di dati aggiunti dal collaboratore invitato). Ad esempio, una tabella aggiunta dall'autore può essere denominata
creator.sales.california
.Analogamente, verificare che il notebook utilizzi tutti gli alias assegnati come risorse di dati nell'area protetta.
Per aggiungere risorse:
Nell'area di lavoro di Azure Databricks fare clic
Catalogo.
Nella pagina Accesso rapido fare clic sul pulsante Clean Rooms .On the Quick access page, click the Clean Rooms > button.
Trovare e fare clic sul nome della stanza pulita da aggiornare.
Fare clic su + Aggiungi asset di dati per aggiungere tabelle, volumi o viste.
Selezionare gli asset di dati da condividere e fare clic su Aggiungi asset di dati.
Quando si condivide una tabella, un volume o una vista, è possibile aggiungere facoltativamente un alias. Il nome dell'alias sarà l'unico nome visibile nella stanza pulita.
Quando si condivide una tabella, è possibile aggiungere facoltativamente clausole di partizione che consentono di condividere solo parte della tabella. Per informazioni dettagliate su come usare le partizioni per limitare le condivisioni, vedere Specificare le partizioni di tabella da condividere.
Nota
Per partecipare all'anteprima privata per la condivisione di tabelle federate, contattare il rappresentante dell'account Azure Databricks. Vedere Che cos'è Lakehouse Federation?.