Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tato stránka popisuje, jak nastavit Delta Sharing na Azure Databricks pro poskytující organizace (organizace, které chtějí používat Delta Sharing k bezpečnému sdílení dat).
Pokud jste příjemcem dat (organizace, která přijímá data sdílená pomocí Delta Sharing), přečtěte si, jak číst data sdílená pomocí Databricks-to-Databricks Delta Sharing (pro příjemce).
Important
Delta Sharing vyžaduje pracovní prostor s povoleným katalogem Unity. Pro správu sdílených složek můžete vytvořit jeden pracovní prostor s podporou katalogu Unity. V některých účtech jsou nové pracovní prostory pro Unity Catalog povolené automaticky. Viz Automatické povolení katalogu Unity.
Pokud není možné vytvořit nový pracovní prostor s podporou katalogu Unity, můžete pomocí opensourcového projektu Delta Sharing nasadit vlastní server Pro sdílení delta pro sdílení tabulek Delta z libovolné platformy.
Počáteční nastavení zprostředkovatele zahrnuje následující kroky:
- Povolení rozdílového sdílení v metastoru katalogu Unity
- (Volitelné) Nainstalujte rozhraní příkazového řádku katalogu Unity.
- Udělte oprávnění k vytváření a správě sdílených složek a příjemců.
- Konfigurujte audity aktivity Delta Sharing.
- Nakonfigurujte hodnotu TTL (Time to Live) materializace dat.
- Nakonfigurujte přístup k síti úložiště.
Requirements
Jako poskytovatel dat, který nastavuje váš účet Azure Databricks tak, aby mohl sdílet data, musíte mít:
Alespoň jeden pracovní prostor Azure Databricks, který je konfigurovaný pro Unity Catalog.
Abyste mohli využívat podporu Databricks pro poskytovatele Delta sdílení, nemusíte migrovat všechna pracovní prostředí do katalogu Unity. Přečtěte si Potřebuji katalog Unity k použití Delta Sharing?.
Příjemci nemusí mít pracovní prostor s podporou katalogu Unity.
Role správce účtu k povolení Delta Sharing pro váš Unity Catalog metastore a k povolení auditního protokolování.
Role správce metastoru
CREATE SHAREnebo oprávnění.CREATE RECIPIENTViz role správce.Note
Pokud byl váš pracovní prostor pro katalog Unity povolen automaticky, možná nemáte správce metastoru. Správci pracovních prostorů v těchto pracovních prostorech však mají ve výchozím nastavení oprávnění
CREATE SHAREaCREATE RECIPIENT.Další informace najdete v tématu Automatické povolení katalogu Unity a oprávnění správce pracovního prostoru, pokud jsou pracovní prostory povoleny pro katalog Unity automaticky.
Konfigurace cloudového úložiště, která umožňuje přístup k síti od příjemce.
Povolení rozdílového sdílení v metastoru
Pokud máte v úmyslu sdílet data jenom s uživateli v jiných metastorech katalogu Unity ve vašem účtu, není nutné povolit funkci Sdílení delta ve vašem metastoru. Sdílení Metastore-to-metastore v rámci jednoho účtu služby Azure Databricks je ve výchozím nastavení povolené.
Jinak postupujte podle těchto kroků pro každý metastore katalogu Unity, který spravuje data, která chcete sdílet pomocí Delta Sharing.
Jako správce účtu Azure Databricks se přihlaste ke konzole účtu.
Na bočním panelu klikněte na
Katalog.
Kliknutím na název metastoru otevřete jeho podrobnosti.
Klikněte na zaškrtávací políčko vedle možnosti Povolit rozdílové sdílení se stranami mimo vaši organizaci.
Nakonfigurujte životnost tokenu příjemce.
Tato konfigurace nastaví dobu, po které vyprší platnost všech tokenů příjemců a musí se znovu vygenerovat. Tokeny příjemců se používají jenom v otevřeném protokolu sdílení . Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření.
Note
Životnost tokenu příjemce pro existující příjemce se neaktualizuje automaticky, když změníte výchozí životnost tokenu příjemce pro metastor. Pokud chcete pro daného příjemce použít novou životnost tokenu, musíte jeho token otočit. Viz Správa tokenů příjemců.
Nastavení výchozí životnosti tokenu příjemce:
- Ověřte, že je povolené nastavení vypršení platnosti (výchozí nastavení).
- Zadejte počet sekund, minuty, hodiny nebo dny a vyberte měrnou jednotku. Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření.
- Klikněte na Povolit.
Další informace najdete v tématu Aspekty zabezpečení pro tokeny.
Při sdílení s příjemcem Azure Databricks, který není ve vašem účtu, zadejte název organizace.
Note
Zadání čitelného názvu organizace pomáhá příjemcům identifikovat zprostředkovatele sdílených složek a odpovídající objekty zprostředkovatele v seznamu poskytovatelů příjemce.
Klikněte na Povolit.
(volitelné) Nainstalujte rozhraní příkazového řádku katalogu Unity
Pro správu akcií a příjemců můžete použít Catalog Explorer, SQL příkazy nebo Unity Catalog CLI. Rozhraní příkazového řádku běží ve vašem místním prostředí a nevyžaduje žádné výpočetní prostředky od Azure Databricks.
Pokud chcete rozhraní příkazového řádku nainstalovat, přečtěte si téma Co je Rozhraní příkazového řádku Databricks?
Udělení oprávnění k vytváření a správě sdílených složek a příjemců
Správci metastoru mají možnost vytvářet a spravovat sdílené složky a příjemce, včetně udělení sdílených složek příjemcům. Správce metastoru může delegovat mnoho úloh poskytovatele pomocí následujících oprávnění:
-
CREATE SHAREv metastoru umožňuje vytvářet sdílené složky. -
CREATE RECIPIENTv metastoru umožňuje vytvářet příjemce. -
USE RECIPIENTudělí možnost vypsat a zobrazit podrobnosti pro všechny příjemce v metastoru. -
USE SHAREv metastoru umožňuje vypsat a zobrazit podrobnosti pro všechny sdílené položky v metastoru. -
USE RECIPIENT,USE SHARE,aSET SHARE PERMISSIONkombinované umožňují uživateli udělit přístup ke sdílení příjemcům. - Správce metastoru má možnost převést vlastnictví jakékoli sdílené složky.
- Vlastníci sdílení a vlastníci příjemců mohou tyto objekty aktualizovat a poskytovat sdílení příjemcům. Tvůrci objektů mají ve výchozím nastavení udělené vlastnictví, ale vlastnictví je možné převést.
- Vlastníci sdílených složek mohou do sdílených složek přidávat tabulky a svazky, pokud mají
SELECTpřístup k tabulkám aREAD VOLUMEpřístup ke svazkům.
Podrobnosti naleznete v tématu Oprávnění katalogu Unity a zabezpečitelné objekty a oprávnění popsaná pro úlohy Delta Sharing.
Povolení protokolování auditu
Jako správce účtu Azure Databricks byste měli povolit auditování pro zaznamenání událostí Delta Sharing, například:
- Když někdo vytvoří, upraví, aktualizuje nebo odstraní sdílenou složku nebo příjemce.
- Když příjemce přistupuje k aktivačnímu odkazu a stáhne přihlašovací údaje (jenom otevřené sdílení)
- Když příjemce přistupuje k datům
- Při obměně přihlašovacích údajů příjemce nebo vypršení jeho platnosti (jenom otevřené sdílení)
Important
Aktivita Delta Sharing se protokoluje na úrovni účtu. Při konfiguraci doručování protokolů nezadávejte hodnotu pro workspace_ids_filter.
Pokud chcete povolit protokolování auditu, postupujte podle pokynů v referenčních informacích k diagnostickým protokolům.
Podrobné informace o protokolování událostí v rámci Delta Sharing najdete v tématu Auditování a monitorování sdílení dat.
Konfigurace TTL pro materializaci dat
Jako účet Azure Databricks nebo správce metastoru můžete nakonfigurovat hodnotu TTL materializace dat, která určuje, jak dlouho se materializovaný výsledek ukládá do mezipaměti. Materializace nastane, když příjemce dotazuje sdílená dynamická zobrazení, materializovaná zobrazení, streamované tabulky a cizí tabulky. Ve výchozím nastavení je hodnota TTL osm hodin. Samotná mezipaměť se po dalších třech hodinách vyřadí materializací a poskytne tak další čas pro dokončení stávajících dotazů.
Pokud chcete tuto hodnotu změnit, postupujte takto:
V pracovním prostoru Azure Databricks klikněte na
Klikněte na Katalog pro otevření Průzkumníka katalogu.
V horní části podokna Katalog klikněte na
a vyberte Sdílení Delta.
Případně na stránce Rychlý přístup klikněte na tlačítko Delta Sharing>.
Na kartě Sdílí se se mnou klikněte v pravém horním rohu na název vaší organizace.
Klikněte na Zobrazit nastavení Delta Sharing.
Jako hodnotu TTL materializace zadejte požadovanou hodnotu TTL.
Povolit síťový přístup k úložišti
Pokud je vaše základní cloudové úložiště nakonfigurované pomocí řízení přístupu, přidejte síť příjemce do seznamu povolených, aby mohli číst sdílené tabulky.
Podrobnosti najdete v tématu Konfigurace bran firewall služby Azure Storage a virtuálních sítí a konfigurace brány firewall pro bezserverový výpočetní přístup.