Wat is Azure Databricks Clean Rooms?
Belangrijk
Deze functie is beschikbaar als openbare preview. Als u toegang wilt aanvragen, neemt u contact op met uw Azure Databricks-vertegenwoordiger.
In dit artikel maakt u kennis met Clean Rooms, een Azure Databricks-functie die gebruikmaakt van Delta Sharing en serverloze berekeningen om een veilige en privacybeveiligde omgeving te bieden waarin meerdere partijen kunnen samenwerken aan gevoelige bedrijfsgegevens zonder directe toegang tot elkaars gegevens.
Vereisten
Als u in aanmerking wilt komen voor het gebruik van schone ruimten, moet u het volgende doen:
- Meld u aan en word goedgekeurd voor de openbare preview. Neem contact op met uw Azure Databricks-accountteam om toegang te vragen.
- Een account hebben dat is ingeschakeld voor serverloze berekeningen. Zie Serverloze berekening inschakelen.
- Een werkruimte hebben die is ingeschakeld voor Unity Catalog. Zie Een werkruimte inschakelen voor Unity Catalog.
Hoe werkt Clean Rooms?
Wanneer u een schone ruimte maakt, maakt u het volgende:
- Een beveiligbaar clean room-object in uw Unity Catalog-metastore.
- De 'centrale' schone ruimte, een geïsoleerde kortstondige omgeving die wordt beheerd door Databricks.
- Een beveiligbaar clean room-object in de Unity Catalog-metastore van uw samenwerker.
Tabellen, volumes (niet-tabellaire gegevens) en notitieblokken die samenwerkers in de schone ruimte delen, worden gedeeld met Delta Sharing, met alleen de centrale clean room.
Samenwerkers kunnen de gegevens in de tabellen en volumes van andere medewerkers niet zien, maar ze kunnen kolomnamen en kolomtypen zien en ze kunnen goedgekeurde notebookcode uitvoeren die werkt via de tabellen en volumes. De notebookcode wordt uitgevoerd in de centrale clean room.
Hoe zorgt Clean Rooms voor een omgeving zonder vertrouwen?
Het Databricks Clean Rooms-model is 'geen vertrouwen'. Alle medewerkers in een no-trust clean room hebben gelijke bevoegdheden, waaronder de maker van de schone kamer. Clean Rooms is ontworpen om te voorkomen dat niet-geautoriseerde code en het niet-geautoriseerd delen van gegevens worden voorkomen. Alle medewerkers moeten bijvoorbeeld een notitieblok goedkeuren voordat het kan worden uitgevoerd. Deze vertrouwensrelatie wordt impliciet afgedwongen door te voorkomen dat een samenwerker een notitieblok uitvoert dat ze zelf hebben gemaakt: u kunt alleen een notitieblok uitvoeren dat is gemaakt door de andere samenwerker.
Aanvullende beveiliging of beperkingen
Naast het hierboven genoemde impliciete goedkeuringsproces voor notebooks zijn de volgende beveiligingsmaatregelen aanwezig:
Nadat een schone ruimte is gemaakt, wordt deze vergrendeld om te voorkomen dat nieuwe medewerkers lid worden van de schone ruimte.
Als een medewerker de schone kamer verwijdert, is de centrale schone ruimte leeg en kunnen geen clean room-taken door elke gebruiker worden uitgevoerd.
Tijdens de openbare preview is elke schone kamer beperkt tot twee medewerkers.
U kunt de naam van de schone kamer niet wijzigen.
De naam van de clean room moet uniek zijn in de metastore van elke samenwerker, zodat alle medewerkers ondubbelzinnig naar dezelfde schone ruimte kunnen verwijzen.
Opmerkingen over de schone ruimte die kunnen worden beveiligd in de werkruimte van elke samenwerker, worden niet doorgegeven aan andere medewerkers.
Wat wordt er gedeeld met andere medewerkers?
- Schone kamernaam.
- Cloud en regio van de centrale schone kamer.
- De naam van uw organisatie (dit kan elke gewenste naam zijn).
- De id voor het delen van een schone ruimte (globale metastore-id + werkruimte-id + e-mailadres van de gebruiker).
- Aliassen van gedeelde tabellen of volumes.
- Kolommetagegevens (kolomnaam of alias en type).
- Notitieblokken (alleen-lezen).
- Systeemtabel clean room events.
- Uitvoeringsgeschiedenis, waaronder:
- De naam van het notebook dat wordt uitgevoerd
- Samenwerker die het notebook heeft uitgevoerd (geen gebruiker).
- De status van het notebook wordt uitgevoerd.
- De begintijd van de notebookuitvoering.
Wat wordt gedeeld met de centrale schone kamer?
Alles wat in de vorige sectie wordt vermeld.
Alleen-lezen tabellen, volumes en notebooks.
Tabellen en volumes worden geregistreerd in de metastore van de centrale clean room met eventuele opgegeven aliassen. Tabellen, volumes en notitieblokken worden gedurende de hele levenscyclus van de schone ruimte gedeeld.
Beperkingen
Tijdens de openbare preview gelden de volgende beperkingen:
- Geen ondersteuning voor het uitschakelen van internet in schone ruimten om te voorkomen dat schadelijke code gegevens naar een externe locatie exfiltreert.
- Er zijn geen Scala-bibliotheken met servicereferenties opgenomen in de vereiste Databricks Runtime-versie.
Resourcequota
Azure Databricks dwingt resourcequota af voor alle clean room beveiligbare objecten. Deze quota worden vermeld in resourcelimieten. Als u verwacht deze resourcelimieten te overschrijden, neemt u contact op met uw Azure Databricks-accountteam.
U kunt uw quotumgebruik bewaken met behulp van de quota-API's voor Unity Catalog-resources. Zie Monitor your usage of Unity Catalog resource quotas.