Udostępnij za pośrednictwem


Co to jest usługa Azure Databricks Clean Rooms?

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej. Aby zażądać dostępu, skontaktuj się z przedstawicielem usługi Azure Databricks.

W tym artykule przedstawiono funkcję Clean Rooms, czyli funkcję usługi Azure Databricks, która korzysta z funkcji delta sharing i przetwarzania bezserwerowego w celu zapewnienia bezpiecznego i ochrony prywatności środowiska, w którym wiele stron może współpracować w zakresie poufnych danych przedsiębiorstwa bez bezpośredniego dostępu do danych.

Wymagania

Aby kwalifikować się do korzystania z czystych pomieszczeń, musisz:

  • Zarejestruj się i zatwierdz się do publicznej wersji zapoznawczej. Skontaktuj się z zespołem konta usługi Azure Databricks, aby zażądać dostępu.
  • Mieć konto, które jest włączone dla obliczeń bezserwerowych. Zobacz Włączanie przetwarzania bezserwerowego.
  • Mieć obszar roboczy, który jest włączony dla wykazu aparatu Unity. Zobacz Włączanie obszaru roboczego dla wykazu aparatu Unity.

Jak działają czyste pokoje?

Podczas tworzenia czystego pokoju utworzysz następujące elementy:

  • Zabezpieczany obiekt czystego pokoju w magazynie metadanych wykazu aparatu Unity.
  • "Centralne" czyste pomieszczenie, które jest izolowanym środowiskiem efemerycznym zarządzanym przez usługę Databricks.
  • Zabezpieczany obiekt czystego pokoju w magazynie metadanych katalogu unity współpracownika.

Tabele, woluminy (dane inne niż tabelaryczne) i notesy udostępnione przez jedną z akcji współpracowników w czystym pomieszczeniu przy użyciu funkcji Udostępniania różnicowego tylko w centralnym pomieszczeniu.

Współpracownicy nie widzą danych w tabelach i woluminach innych współpracowników, ale widzą nazwy kolumn i typy kolumn oraz mogą uruchamiać zatwierdzony kod notesu, który działa na tabelach i woluminach. Kod notesu jest uruchamiany w centralnym pomieszczeniu w czystym pomieszczeniu.

Czysta architektura i przepływ pomieszczeń

W jaki sposób clean rooms zapewnia środowisko bez zaufania?

Model Clean Rooms usługi Databricks to "no-trust". Wszyscy współpracownicy w pomieszczeniu bez zaufania mają równe uprawnienia, w tym twórcę czystego pokoju. Funkcja Clean Rooms została zaprojektowana w celu zapobiegania uruchamianiu nieautoryzowanego kodu i nieautoryzowanego udostępniania danych. Na przykład wszyscy współpracownicy muszą zatwierdzić notes, zanim będzie można go uruchomić. To zaufanie jest wymuszane niejawnie, uniemożliwiając współpracownikowi uruchamianie dowolnego notesu utworzonego przez siebie: możesz uruchomić tylko notes utworzony przez innego współpracownika.

Dodatkowe zabezpieczenia lub ograniczenia

Oprócz procesu niejawnego zatwierdzania notesu wymienionego powyżej obowiązują następujące zabezpieczenia:

  • Po utworzeniu czystego pokoju jest on zablokowany, aby uniemożliwić nowym współpracownikom dołączenie do czystego pokoju.

  • Jeśli jakikolwiek współpracownik usunie czyste pomieszczenie, centralna czysta sala jest pusta i nie może być uruchamiana żadna czysta sala zadań przez dowolnego użytkownika.

  • W publicznej wersji zapoznawczej każdy pokój czysty jest ograniczony do dwóch współpracowników.

  • Nie można zmienić nazwy czystego pokoju.

    Nazwa czystego pokoju musi być unikatowa w magazynie metadanych każdego współpracownika, aby wszyscy współpracownicy mogli jednoznacznie odwoływać się do tego samego czystego pokoju.

  • Komentarze dotyczące zabezpieczanego pokoju w obszarze roboczym każdego współpracownika nie są propagowane do innych współpracowników.

Co jest udostępniane innym współpracownikom?

  • Czysta nazwa pokoju.
  • Chmura i region centralnego czystego pokoju.
  • Nazwa organizacji (która może być dowolną wybraną nazwą).
  • Identyfikator udostępniania pomieszczeń czystych (globalny identyfikator magazynu metadanych + identyfikator obszaru roboczego i adres e-mail użytkownika).
  • Aliasy udostępnionych tabel lub woluminów.
  • Metadane kolumn (nazwa kolumny lub alias i typ).
  • Notesy (tylko do odczytu).
  • Tabela systemowa zdarzeń w pomieszczeniu.
  • Historia uruchamiania, w tym:
    • Nazwa uruchamianego notesu
    • Współpracownik, który uruchomił notes (a nie użytkownik).
    • Stan uruchomienia notesu.
    • Godzina rozpoczęcia przebiegu notesu.

Co jest udostępniane centralnej czystej sali?

  • Wszystkie elementy wymienione w poprzedniej sekcji.

  • Tabele, woluminy i notesy tylko do odczytu.

    Tabele i woluminy są rejestrowane w centralnym magazynie metadanych pomieszczenia z podanymi aliasami. Tabele, woluminy i notesy są współużytkowane w całym cyklu życia czystego pokoju.

Ograniczenia

W publicznej wersji zapoznawczej obowiązują następujące ograniczenia:

  • Brak obsługi wyłączania Internetu w czystych pokojach, aby uniemożliwić złośliwemu kodowi eksfiltrowanie danych do lokalizacji zewnętrznej.
  • Brak bibliotek scala poświadczeń usługi zawartych w wymaganej wersji środowiska Databricks Runtime.

Limity przydziałów zasobów

Usługa Azure Databricks wymusza limity przydziału zasobów dla wszystkich zabezpieczanych obiektów clean room. Te limity przydziału są wymienione w temacie Limity zasobów. Jeśli spodziewasz się przekroczyć te limity zasobów, skontaktuj się z zespołem konta usługi Azure Databricks.

Użycie limitu przydziału można monitorować przy użyciu interfejsów API przydziałów zasobów wykazu aparatu Unity. Zobacz Monitorowanie użycia przydziałów zasobów wykazu aparatu Unity.

Rozpocznij