Co je Azure Databricks Clean Rooms?

Tato stránka představuje funkci Uzavřené místnosti, což je vlastnost Azure Databricks, která využívá Delta Sharing a bezserverový výpočet k zajištění zabezpečeného prostředí pro ochranu soukromí, ve kterém může více stran spolupracovat na citlivých podnikových datech, aniž by měly přímý přístup k datům druhé strany.

Požadavky

Abyste mohli používat čisté místnosti, musíte mít:

Jak funguje čištění místností?

Když vytvoříte čistou místnost, vytvoříte následující:

  • Objekt čisté místnosti, který lze zabezpečit, ve metastoru katalogu Unity.
  • "Centrální" čistá místnost, což je izolované dočasné prostředí spravované Databricks.
  • Zabezpečitelný objekt chráněného prostoru v metastore katalogu Unity vašeho spolupracovníka.

Tabulky, svazky (ne tabulková data), zobrazení a poznámkové bloky, které kterýkoliv spolupracovník sdílí v čisté místnosti, jsou sdíleny výhradně pouze s centrální čistou místností pomocí Delta Sharing.

Spolupracovníci neuvidí data v tabulkách, zobrazeních nebo svazcích jiných spolupracovníků, ale můžou zobrazit názvy sloupců a typy sloupců a mohou spouštět schválený kód poznámkového bloku, který pracuje s datovými prostředky. Kód poznámkového bloku běží v centrální čisté místnosti. Poznámkové bloky mohou také generovat výstupní tabulky, které umožňují vašim spolupracovníkům dočasně ukládat výstup určený jen pro čtení do jejich metastoru katalogu Unity, aby s ním mohli pracovat ve svých pracovních prostorech.

Čisté místnosti – jednoduchá architektura a tok s výstupními tabulkami

Jak Clean Rooms zajišťují prostředí bez důvěry?

Model Databricks pro Clean Rooms je "bez důvěry". Všichni spolupracovníci v čisté místnosti s nulovou důvěrou mají stejná oprávnění, včetně zakladatele čisté místnosti. Čisté místnosti jsou navržené tak, aby zabránily spuštění neoprávněného kódu a neoprávněnému sdílení dat. Tento vztah důvěryhodnosti se vynucuje explicitně tím, že před spuštěním poznámkového bloku budou muset všichni spolupracovníci schválit poznámkový blok. I když poznámkový blok můžete nahrát sami sobě, musí ho před spuštěním schválit ostatní spolupracovníci. Viz Schválení poznámkového bloku v čisté místnosti.

Další bezpečnostní opatření nebo omezení

Kromě výše uvedeného procesu explicitního schvalování poznámkového bloku se používají následující bezpečnostní opatření:

  • Po vytvoření čisté místnosti je uzamčena, aby se noví spolupracovníci nemohli připojit k čisté místnosti.

  • Pokud některý spolupracovník odstraní čistou místnost, centrální čistá místnost je znehodnocena a žádný uživatel nemůže spouštět úkoly čistých místností.

  • Každá čistá místnost je omezená na deset spolupracovníků.

  • Čistou místnost nelze přejmenovat.

    Název čisté místnosti musí být v metastoru každého spolupracovníka jedinečný, aby všichni spolupracovníci mohli jednoznačně odkazovat na stejnou čistou místnost.

  • Když spolupracovník přidá komentáře do čisté místnosti zabezpečitelné ve svém pracovním prostoru, nebudou se tyto komentáře šířit do ostatních spolupracovníků.

Co se sdílí s dalšími spolupracovníky?

  • Čistý název místnosti.
  • Cloud a oblast centrální čisté místnosti.
  • Název vaší organizace (který může být libovolný název, který zvolíte).
  • Identifikátor sdílení čisté místnosti (globální ID metastore + ID pracovního prostoru + e-mailová adresa uživatele).
  • Aliasy sdílených tabulek, zobrazení nebo svazků.
  • Metadata sloupců (název sloupce nebo alias a typ).
  • Notebooky (jen pro čtení)
  • výstupní tabulky (jen pro čtení, dočasné).
  • Tabulka událostí systému čisté místnosti.
  • Historie spuštění, včetně:
    • Název spuštěného poznámkového bloku
    • Spolupracovník, který spustil poznámkový blok (nikoliv uživatel).
    • Stav běhu poznámkového bloku
    • Čas spuštění běhu poznámkového bloku

Co je sdíleno s centrální čistou místností?

  • Všechno, co je uvedené v předchozí části

  • Tabulky, svazky, zobrazení a poznámkové bloky jsou jen pro čtení.

    Tabulky, zobrazení a svazky se registrují v metadatovém úložišti centrální čisté místnosti se všemi zadanými aliasy. Datová aktiva se sdílejí v průběhu životního cyklu čisté místnosti.

Nejčastější dotazy k čištění místností

Níže najdete nejčastější dotazy týkající se čistých místností.

Jak se moje data spravují v čisté místnosti?

Centrální čistý pokoj spravuje Azure Databricks. V centrální čisté místnosti:

  • Žádná strana nemá oprávnění správce.
  • Pro všechny strany jsou viditelná pouze metadata.
  • Každá strana může přidat data do centrální čisté zóny.
  • Čisté místnosti používají funkci Delta Sharing k bezpečnému sdílení dat do čisté místnosti, ale ne mezi účastníky. Podívejte se na Co je to Delta Sharing?.

Jak jsou moje data soukromá?

Centrální čisté prostory fungují na izolované výpočetní vrstvě bez serveru, spravované službou Databricks, hostované v oblasti poskytovatele cloudu, kterou zvolí tvůrce čisté místnosti.

Čisté pokoje poskytují:

  • schválení kódu: tvůrce čisté místnosti a spolupracovníci mohou sdílet tabulky a svazky s centrální čistou místností, ale smí spouštět jenom poznámkové bloky nahrané druhou stranou. Před schválením můžete kód přidaný druhou stranou zkontrolovat. Pokud spustíte poznámkový blok přidaný jinou stranou, implicitně kód schválíte.
  • Správa verzí: Poznámkové bloky v čistých místnostech mají správu verzí, aby všechny strany mohly spouštět pouze plně schválené poznámkové bloky. Můžete spustit jenom nejnovější verzi poznámkového bloku. Systémovou tabulku čistých místností můžete použít k zobrazení, která verze poznámkového bloku byla spuštěna, a monitorovat všechny provedené změny.
  • Omezený přístup: Při vytváření čisté místnosti můžete ke správě odchozích síťových připojení použít řízení odchozího přenosu dat bez serveru. Pokud omezíte přístup z čisté místnosti, zablokuje se přístup k neoprávněnému úložišti. Viz Co je řízení výchozího přenosu dat bez serveru?.

Další informace o zabezpečení a bezserverové výpočetní rovině najdete v tématu sítě bezserverové výpočetní roviny.

Jak se zaznamenávají akce?

Akce čisté místnosti provedené vámi nebo vašimi spolupracovníky se zaznamenávají v tabulce systému událostí čistých místností. Tyto záznamy zahrnují podrobná metadata o konkrétní akci, která byla provedena. Viz referenční tabulku systému událostí čisté místnosti.

Akce čisté místnosti se také zaznamenávají do auditního protokolu vašeho účtu v rámci služby clean-room. Viz Akce Čistých místností.

Když spolupracovník upraví oprávnění k zabezpečitelné čisté místnosti v rámci svého metastoru, tyto změny se zaznamenávají v protokolech auditu ve službě unityCatalog .

Jak funguje fakturace?

Další informace o cenách služby Databricks Clean Rooms najdete na odkazu.

Omezení

Platí následující omezení:

  • V požadované verzi Databricks Runtime nejsou zahrnuty žádné Scala knihovny pro přihlašovací údaje služeb.

Kvóty prostředků

Azure Databricks vynucuje kvóty prostředků pro všechny objekty se zabezpečením v Clean Room. Tyto kvóty jsou uvedené v omezeních prostředků. Pokud očekáváte překročení těchto limitů prostředků, obraťte se na svůj tým účtů Azure Databricks.

Využití kvóty můžete monitorovat pomocí rozhraní API kvót katalogu Unity. Viz Sledujte využití kvót prostředků Unity Catalog.

Začínáme