Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Op deze pagina wordt beschreven hoe u een Databricks-clean room maakt met behulp van de gebruikersinterface. Een schone ruimte is een veilige omgeving voor gezamenlijke gegevensanalyse.
Belangrijke functies en beperkingen:
- Veilige samenwerking: Met schone ruimten kunnen meerdere partijen samenwerken aan gevoelige bedrijfsgegevens zonder directe toegang tot elkaars onbewerkte gegevens.
- Capaciteit van samenwerkers: Een schone kamer kan tien partijen hebben, waaronder de maker en maximaal negen andere medewerkers.
- Metastore-limiet: Azure Databricks dwingt resourcequota af voor alle beveiligbare objecten voor clean room. Zie Resourcelimieten.
Zie Een schone ruimte maken om de REST API te gebruiken.
Voordat u begint
De bevoegdheden die nodig zijn voor het gebruik van schone ruimten variëren afhankelijk van de taak:
Opdracht | Vereiste bevoegdheden |
---|---|
Een schone kamer weergeven | Moet de eigenaar van de schone kamer zijn of een van de volgende bevoegdheden hebben voor de schone kamer: MANAGE , MODIFY CLEAN ROOM , EXECUTE CLEAN ROOM TASK of BROWSE . |
De eigenaar van een schone kamer bijwerken | Moet de eigenaar van de schone kamer zijn of de MANAGE bevoegdheid hebben voor de schone kamer. |
Gegevensassets toevoegen of verwijderen in een schone ruimte | Moet de eigenaar van de schone kamer zijn of het MODIFY CLEAN ROOM voorrecht hebben op de schone kamer. Als u niet de eigenaar van de cleanroom bent, moeten u en de eigenaar van de cleanroom SELECT op enige tafel of weergave hebben, en READ VOLUME op elk volume dat u toevoegt, samen met USE CATALOG en USE SCHEMA op de bovenliggende catalogus en het schema. |
Notitieblokken in een schone ruimte toevoegen of verwijderen | Voor de uploader van het notitieblok:
|
Een opmerking in een schone ruimte bijwerken | Moet de eigenaar van de schone kamer zijn of het MODIFY CLEAN ROOM voorrecht hebben op de schone kamer. |
Toegang verlenen tot een schone kamer | Moet de eigenaar zijn of de MANAGE bevoegdheid hebben in de cleanroom. |
Een schone ruimte verwijderen | Moet de eigenaar zijn of het MANAGE -recht hebben op de cleanroom. |
Voorbij de taak-specifieke privileges, wanneer een cleanroom wordt gedeeld, zal het e-mailadres dat is gekoppeld aan de identificator voor delen automatisch de eigenaar worden in de organisatie van uw medewerker. Zie Stap 1. Vraag de deelidentificatie van de samenwerker aan.
Zie Schone ruimten beheren en notitieblokken uitvoeren in schone ruimten voor meer informatie over machtigingsvereisten voor het bijwerken van schone ruimten en het uitvoeren van taken (notebooks) in schone ruimten.
Notitie
De centrale schone kamer kan maximaal twee andere regio's hebben dan de centrale clean room regio onder zijn medewerkers.
Stap 1. Vraag om de deelidentificator van de medewerker
Voordat u een schone ruimte kunt maken, moet u de Clean Room-id hebben van de organisaties waarmee u samenwerkt. De delen-id is een tekenreeks die bestaat uit de globale metastore-id van de organisatie, de werkruimte-id en de gebruikersnaam van de contactpersoon (e-mailadres). Uw medewerkers kunnen zich in elke cloud of regio bevinden.
Neem contact op met uw medewerkers om hun gedeelde identificatiecode aan te vragen. Ze kunnen de ID voor delen ophalen met behulp van de instructies in Uw ID voor delen zoeken.
stap 2. Een schone ruimte maken
Als u een schone ruimte wilt maken, moet u Catalog Explorer gebruiken.
Klik in uw Azure Databricks-werkruimte op
Catalogus.
Klik op de pagina Snelle toegang op de knop Schone ruimten > .
Klik op Schone ruimte maken.
Voer op de pagina Clean Room maken een gebruiksvriendelijke naam in voor de schone ruimte.
De naam kan geen spaties, punten of slashes (/) gebruiken.
Zodra deze is opgeslagen, kan de naam van de schone ruimte niet worden gewijzigd. Gebruik een naam die potentiële medewerkers nuttig en beschrijvend vinden.
Selecteer de cloudprovider en regio waar de centrale schone ruimte wordt gemaakt.
De cloudprovider moet overeenkomen met uw huidige werkruimte, maar de regio kan verschillen. Houd rekening met de gegevenslocatie of andere beleidsregels van uw organisatie wanneer u uw selectie maakt.
Elke schone kamer kan maximaal tien medewerkers hebben. Voer de id voor het delen van de Clean Room in voor elke samenwerker. Zie Stap 1. Vraag de deelidentificatie van de samenwerker aan.
U kunt uw clean room testen voordat u de volledige implementatie uitvoert met behulp van uw id voor delen of de id van een andere gebruiker in uw huidige metastore. Als u dit doet, worden er twee schone ruimten in uw huidige metastore gemaakt. Als u bijvoorbeeld een schone ruimte met de titel
test_clean_room
maakt, wordt er ook een tweede schone ruimte met de naamtest_clean_room_collaborator
weergegeven. Notebooks uitvoeren met een samenwerker in dezelfde metastore werkt hetzelfde als met een externe samenwerker. Zie Notebooks uitvoeren in schone ruimten.Noteer de catalogusnamen die aan u en uw medewerkers zijn toegewezen.
Alle gegevensassets die aan de schone ruimte worden toegevoegd, worden weergegeven onder die catalogus in de centrale clean room en kunnen worden verwezen via die catalogus in de drie-niveau naamruimte (
<catalog>.<schema>.<table-etc>
).
Selecteer het type netwerktoegangsbeleid. Dit kan niet worden gewijzigd nadat de schone ruimte is gemaakt.
- Volledige toegang: onbeperkte uitgaande internettoegang.
- Beperkte toegang: hiermee beperkt u uitgaande toegang tot internetbestemmingen die u opgeeft. Zie Overzicht van netwerkbeleid en Netwerkbeleid beheren voor serverloos uitgaand verkeer.
Notitie
Beperkte toegang kan de beschikbaarheid van assets tot tien minuten vertragen.
Nadat u de schone ruimte hebt gemaakt, kunt u het netwerktoegangsbeleid bekijken op het tabblad Beveiliging .
- Klik op Schone ruimte maken.
Als uw huidige werkruimte is ingesteld op het HIPAA-nalevingsbeveiligingsprofiel, wordt die instelling toegepast op de centrale schone ruimte wanneer u een schone ruimte maakt. Samenwerkers moeten toegang hebben tot de schone ruimte vanuit een werkruimte met hetzelfde beveiligingsprofiel. Zie nalevingsbeveiligingsprofiel.
Stap 3. Gegevensassets en notebooks toevoegen aan de schone ruimte
Zowel de maker als de medewerkers kunnen tabellen, volumes, weergaven en notitieblokken toevoegen aan de clean room.
Notitie
In de volgende instructies wordt ervan uitgegaan dat u terugkeert naar een reeds gemaakte schone ruimte om assets toe te voegen. Als u net voor het eerst een schone ruimte hebt gecreëerd, begeleidt een wizard u bij het toevoegen van gegevensbronnen en notebooks. De gebruikersinterface voor het toevoegen van deze assets is hetzelfde, ongeacht of u door de wizard wordt geleid of niet.
Notitieblokken toevoegen:
Klik op de knop + Notitieblokken toevoegen en blader naar het notitieblok dat u wilt toevoegen.
Geef het notitieblok een naam.
Selecteer welke samenwerker het notebook kan uitvoeren. Selecteer U om het notebook zelf uit te voeren.
U kunt het notitieblok desgewenst een alternatieve naam voor notitieblok geven.
Notebooks die u in clean rooms deelt, voeren query's uit op gegevens en voeren gegevensanalyseworkloads uit op de tabellen, weergaven en volumes die u en andere medewerkers hebben toegevoegd aan de schone ruimte.
Als u een notitieblok met resultaten deelt, worden deze resultaten gedeeld met uw medewerkers.
U kunt een notebook gebruiken om uitvoertabellen te maken die tijdelijk worden gedeeld met de metastore van uw samenwerker wanneer ze het notebook uitvoeren. Zie Uitvoertabellen maken en gebruiken in Databricks Clean Rooms.
Download ons voorbeeldnotitieblok als u een testdataset wilt gebruiken.
Belangrijk
Notitieblokverwijzingen naar tabellen, weergaven of volumes die aan de clean room zijn toegevoegd, moeten de catalogusnaam gebruiken die is toegewezen toen de schone ruimte werd gemaakt ('maker' voor gegevensassets die zijn toegevoegd door de maker van de schone ruimte en 'samenwerker' voor gegevensassets die door de uitgenodigde samenwerker zijn toegevoegd). Een tabel die door de maker is toegevoegd, kan bijvoorbeeld
creator.sales.california
worden genoemd.Controleer of in het notebook aliassen worden gebruikt die eerder als gegevensassets in de schone ruimte waren toegewezen.
Assets toevoegen:
Klik in uw Azure Databricks-werkruimte op
Catalogus.
Klik op de pagina Snelle toegang op de knop Schone ruimten > .
Zoek en klik op de naam van de schone ruimte die u wilt bijwerken.
Klik op + Data-assets toevoegen om tabellen, volumes of weergaven toe te voegen.
Selecteer de gegevensassets die u wilt delen en klik op Gegevensassets toevoegen.
Wanneer u een tabel, volume of weergave deelt, kunt u eventueel een alias toevoegen. De aliasnaam is de enige naam die zichtbaar is in de schone ruimte.
Wanneer u een tabel deelt, kunt u desgewenst partitiecomponenten toevoegen waarmee u slechts een deel van de tabel kunt delen. Zie Tabelpartities opgeven om te delen voor meer informatie over het gebruik van partities om te beperken wat u wilt delen.
Notitie
Neem contact op met uw vertegenwoordiger van uw Azure Databricks-account om deel te nemen aan de private preview voor het delen van federatieve tabellen. Zie Wat is Lakehouse Federation?