Co to jest usługa Azure Databricks Clean Rooms?
Ważne
Ta funkcja jest dostępna w publicznej wersji zapoznawczej. Aby zażądać dostępu, skontaktuj się z przedstawicielem usługi Azure Databricks.
W tym artykule przedstawiono funkcję Clean Rooms, czyli funkcję usługi Azure Databricks, która korzysta z funkcji delta sharing i przetwarzania bezserwerowego w celu zapewnienia bezpiecznego i ochrony prywatności środowiska, w którym wiele stron może współpracować w zakresie poufnych danych przedsiębiorstwa bez bezpośredniego dostępu do danych.
Wymagania
Aby kwalifikować się do korzystania z czystych pomieszczeń, musisz:
- Zarejestruj się i zatwierdz się do publicznej wersji zapoznawczej. Skontaktuj się z zespołem konta usługi Azure Databricks, aby zażądać dostępu.
- Mieć konto, które jest włączone dla obliczeń bezserwerowych. Zobacz Włączanie przetwarzania bezserwerowego.
- Mieć obszar roboczy, który jest włączony dla wykazu aparatu Unity. Zobacz Włączanie obszaru roboczego dla wykazu aparatu Unity.
Jak działają czyste pokoje?
Podczas tworzenia czystego pokoju utworzysz następujące elementy:
- Zabezpieczany obiekt czystego pokoju w magazynie metadanych wykazu aparatu Unity.
- "Centralne" czyste pomieszczenie, które jest izolowanym środowiskiem efemerycznym zarządzanym przez usługę Databricks.
- Zabezpieczany obiekt czystego pokoju w magazynie metadanych katalogu unity współpracownika.
Tabele, woluminy (dane inne niż tabelaryczne) i notesy udostępnione przez jedną z akcji współpracowników w czystym pomieszczeniu przy użyciu funkcji Udostępniania różnicowego tylko w centralnym pomieszczeniu.
Współpracownicy nie widzą danych w tabelach i woluminach innych współpracowników, ale widzą nazwy kolumn i typy kolumn oraz mogą uruchamiać zatwierdzony kod notesu, który działa na tabelach i woluminach. Kod notesu jest uruchamiany w centralnym pomieszczeniu w czystym pomieszczeniu.
W jaki sposób clean rooms zapewnia środowisko bez zaufania?
Model Clean Rooms usługi Databricks to "no-trust". Wszyscy współpracownicy w pomieszczeniu bez zaufania mają równe uprawnienia, w tym twórcę czystego pokoju. Funkcja Clean Rooms została zaprojektowana w celu zapobiegania uruchamianiu nieautoryzowanego kodu i nieautoryzowanego udostępniania danych. Na przykład wszyscy współpracownicy muszą zatwierdzić notes, zanim będzie można go uruchomić. To zaufanie jest wymuszane niejawnie, uniemożliwiając współpracownikowi uruchamianie dowolnego notesu utworzonego przez siebie: możesz uruchomić tylko notes utworzony przez innego współpracownika.
Dodatkowe zabezpieczenia lub ograniczenia
Oprócz procesu niejawnego zatwierdzania notesu wymienionego powyżej obowiązują następujące zabezpieczenia:
Po utworzeniu czystego pokoju jest on zablokowany, aby uniemożliwić nowym współpracownikom dołączenie do czystego pokoju.
Jeśli jakikolwiek współpracownik usunie czyste pomieszczenie, centralna czysta sala jest pusta i nie może być uruchamiana żadna czysta sala zadań przez dowolnego użytkownika.
W publicznej wersji zapoznawczej każdy pokój czysty jest ograniczony do dwóch współpracowników.
Nie można zmienić nazwy czystego pokoju.
Nazwa czystego pokoju musi być unikatowa w magazynie metadanych każdego współpracownika, aby wszyscy współpracownicy mogli jednoznacznie odwoływać się do tego samego czystego pokoju.
Komentarze dotyczące zabezpieczanego pokoju w obszarze roboczym każdego współpracownika nie są propagowane do innych współpracowników.
Co jest udostępniane innym współpracownikom?
- Czysta nazwa pokoju.
- Chmura i region centralnego czystego pokoju.
- Nazwa organizacji (która może być dowolną wybraną nazwą).
- Identyfikator udostępniania pomieszczeń czystych (globalny identyfikator magazynu metadanych + identyfikator obszaru roboczego i adres e-mail użytkownika).
- Aliasy udostępnionych tabel lub woluminów.
- Metadane kolumn (nazwa kolumny lub alias i typ).
- Notesy (tylko do odczytu).
- Tabela systemowa zdarzeń w pomieszczeniu.
- Historia uruchamiania, w tym:
- Nazwa uruchamianego notesu
- Współpracownik, który uruchomił notes (a nie użytkownik).
- Stan uruchomienia notesu.
- Godzina rozpoczęcia przebiegu notesu.
Co jest udostępniane centralnej czystej sali?
Wszystkie elementy wymienione w poprzedniej sekcji.
Tabele, woluminy i notesy tylko do odczytu.
Tabele i woluminy są rejestrowane w centralnym magazynie metadanych pomieszczenia z podanymi aliasami. Tabele, woluminy i notesy są współużytkowane w całym cyklu życia czystego pokoju.
Ograniczenia
W publicznej wersji zapoznawczej obowiązują następujące ograniczenia:
- Brak obsługi wyłączania Internetu w czystych pokojach, aby uniemożliwić złośliwemu kodowi eksfiltrowanie danych do lokalizacji zewnętrznej.
- Brak bibliotek scala poświadczeń usługi zawartych w wymaganej wersji środowiska Databricks Runtime.
Limity przydziałów zasobów
Usługa Azure Databricks wymusza limity przydziału zasobów dla wszystkich zabezpieczanych obiektów clean room. Te limity przydziału są wymienione w temacie Limity zasobów. Jeśli spodziewasz się przekroczyć te limity zasobów, skontaktuj się z zespołem konta usługi Azure Databricks.
Użycie limitu przydziału można monitorować przy użyciu interfejsów API przydziałów zasobów wykazu aparatu Unity. Zobacz Monitorowanie użycia przydziałów zasobów wykazu aparatu Unity.